1. 서 론
2. 데이터 및 방법론
2.1 데이터 수집 및 전처리
2.2 빈도해석
2.3 군집화 기법
2.4 부트스트래핑 기반 강건성 평가
3. 분석 결과
3.1 빈도해석 결과
3.2 군집화 결과
3.3 강건성 평가 결과
4. 고 찰
5. 결 론
1. 서 론
기후변화는 중위도 지역을 중심으로 강수 형태와 계절적 특성에 상당한 영향을 미치고 있으며, 특히 폭설과 적설 심도(snow depth)의 공간적·시간적 변동성을 심화시키고 있다(Marty and Blanchet, 2012; Blanchet et al., 2009). 북미와 유럽 등 여러 지역에서 수행된 연구에 따르면, 지구온난화에도 불구하고 한파와 폭설을 동반한 국지적 강설 사건은 오히려 강도가 증가하거나 특정 지역에서 빈발할 가능성이 제기되고 있다(Zarzycki, 2018; Cho et al., 2021). 이러한 변화는 수문·기상 재해 위험도 평가뿐 아니라 지역 맞춤형 설계빈도 산정, 재난 대응 전략 수립에도 직결되기 때문에 과학적 근거에 기반한 정량적 분석이 필수적이다(Kudo et al., 2017; Moller et al., 2017).
적설 심도의 극값 분석에는 전통적으로 확률분포 기반 빈도해석(frequency analysis)이 활용되어 왔으며, Gumbel, Generalized Extreme Value (GEV), Weibull, Pearson Type III 등 다양한 분포가 적용되어 왔다(Shin et al., 2013; Park and Chung, 2019). 특히 Kolmogorov-Smirnov (KS) 검정이나 Akaike Information Criterion (AIC)과 같은 통계적 적합도 지표를 통해 관측소별 최적 분포를 선정하고, 이를 바탕으로 재현기간별 최대 적설심을 산정하는 접근법이 널리 쓰이고 있다(Li et al., 2023; Hossain et al., 2021). 또한 최근에는 적설량, 적설 심도, 융설(snowmelt) 등의 극값 변화 양상을 다지역 또는 국가 단위에서 종합적으로 분석하여 기후변화 시나리오에 따른 미래 위험 변화를 정량화하려는 시도가 활발히 이루어지고 있다(Troin et al., 2016; Smyth et al., 2020).
최근에는 수문·기상 자료의 공간적 분류를 위한 군집 분석 기법의 활용이 활발히 이루어지고 있으며, 강우·가뭄 빈도해석뿐 아니라 극한 기상현상의 공간적 동질성 평가에도 적용되고 있다. Procrustes 분석과 주성분분석(PCA)을 병행한 다변량 군집화 기법은 기상 요소 간 상관성을 고려한 지역 구획에 효과적인 것으로 나타났으며(Nam et al., 2008), 자기조직화지도(Self-Organizing Map)를 활용한 K-means 기반 군집화는 최적 군집 수 도출과 공간적 군집 경계의 시각화에 유리하다는 점에서 국내 적용 사례가 보고되고 있다(Kim et al., 2012). 또한, 변동 핵밀도 함수나 이변량 확률분포와 연계된 군집분석 기법은 불확실성이 큰 수문자료에서도 공간적 군집의 강건성을 확보할 수 있는 방법으로 제시되고 있다(Oh et al., 2008; Yoo et al., 2010).
한편, 장기간 관측자료를 활용한 빈도해석에서는 자료의 연속성(continuity)과 균질성(homogeneity) 확보가 필수적이다. 관측 공백이나 비현실적인 이상값은 통계적 극값 해석의 신뢰도를 저하시킬 수 있으므로, 이를 사전에 보정하거나 제거하는 절차가 필요하다는 연구 결과가 보고된 바 있다(Hanel et al., 2009; Eccel et al., 2012). 본 연구에서는 이러한 기존 연구의 흐름을 반영하여, 전국 기상관측소의 연 최대 적설심 자료를 대상으로 결측 연도가 많은 지점과 0cm 이하의 비현실적 자료를 제외한 후, KS 검정을 기반으로 관측소별 최적 분포를 선정하고 재현기간별 최대 적설심을 산정하였다.
본 연구에서는 관측소별 빈도해석 결과의 공간적 이질성을 효과적으로 분류하고, 군집 경계의 형태적 다양성과 분포 특성을 비교하기 위해 K-means, Gaussian Mixture Model (GMM), 계층적 군집분석(Hierarchical Clustering)을 병행 적용하였고, 부트스트래핑 기반 강건성(stability) 평가를 통해 군집 결과의 신뢰도를 검증하고자 한다.
2. 데이터 및 방법론
2.1 데이터 수집 및 전처리
본 연구에서는 1980년대 이후부터 2023년까지의 기간 동안 전국 약 101개 ASOS 기상관측소에서 관측된 연 최대 최심신적설(maximum snow depth) 자료를 활용하였다. 자료는 기상청에서 제공하는 국가 기상관측망 데이터를 기반으로 수집하였으며, 분석에 앞서 시계열의 연속성과 자료 신뢰도를 확보하기 위한 전처리 과정을 수행하였다. 우선 결측 연도가 다수 존재하는 관측소는 통계적 불확실성이 크고 극값 해석에서 신뢰도를 저하시킬 우려가 있으므로 분석 대상에서 제외하였다. 또한 0 cm 이하의 비현실적인 관측값은 자료 입력 오류나 관측 문제에 의해 발생했을 가능성이 높아, 빈도해석의 정규성과 통계적 타당성을 확보하기 위해 사전 제거하였다. 이러한 과정을 거쳐 최종적으로 선정된 관측소의 위치는 Fig. 1과 같다.
2.2 빈도해석
전처리를 마친 관측소별 연 최대 최심신적설 자료를 대상으로 극치분포(extreme value distribution) 기반 빈도해석을 수행하였다. 사용된 분포는 Gumbel, Generalized Extreme Value (GEV), Weibull, Pearson Type III, Lognormal 총 다섯 가지 분포이며, 각 분포의 모수는 적률법(Method of Moments)과 최우도법(Maximum Likelihood Estimation)을 통해 추정하였다. 이들 분포는 꼬리 두께와 비대칭성 등 극값 꼬리 특성의 스펙트럼을 폭넓게 포괄하며, 수문·설해 분야 선행연구에서의 적합도 비교와 실무 적용성이 검증되어 재현기간 산정의 비교 가능성을 확보할 수 있다. 관측소별 최적 분포 선정에는 Kolmogorov-Smirnov (KS) 검정을 활용하였으며, KS 검정은 경험분포함수와 이론분포함수 간 최대 차이를 통계량으로 계산하며, 값이 작을수록 자료와 분포의 적합성이 높음을 의미한다. 이를 통해 관측소별 최적 분포를 확정한 뒤 2년, 5년, 10년, 30년, 50년, 100년, 200년 재현기간에 대한 적설심을 산정하였다. 이로써 관측소별 극한 적설 특성을 정량화하고, 이후 군집화 분석과 부트스트래핑 기반 강건성 평가의 입력 자료로 활용할 수 있는 기반을 마련하였다. 또한, 최종적으로 선정된 77개 기상관측소의 연 최대 최심신적설 자료를 활용하여 연도별 평균값의 시계열 변화를 분석하였다(Fig. 2).
2.3 군집화 기법
재현기간별 산정된 최심신적설 값을 입력 자료로 활용하여 다중 군집화(multi-clustering) 분석을 수행하였다. 적용된 군집화 기법은 중심 기반의 K-means, 확률적 혼합모형 기반의 Gaussian Mixture Model (GMM), 계층적 구조를 반영하는 Hierarchical Clustering으로 구성된다. 군집 수(k)는 사전 검토를 통해 5개로 고정하였으며, 엘보우 기법(Elbow Method)과 실루엣 계수(Silhouette Coefficient)를 활용하여 최적 군집 수 설정의 타당성을 확인하였다. Figs. 3, 4, 5는 본 연구에서 활용된 세 가지 군집화 기법을 시각적으로 나타낸 것이다. 먼저 Fig. 3은 K-means 군집화 과정을 보여주며, 원자료를 입력으로 받아 중심점(centroid)을 기준으로 데이터를 반복적으로 재할당하고 중심을 갱신하여 최종적으로 k개의 군집으로 분류하는 과정일 직관적으로 설명한다. Fig. 4는 Gaussian Mixture Model (GMM)을 활용한 혼합분포 기반 군집화 과정을 나타내며, 기댓값-최대화(EM) 알고리즘을 통해 데이터가 여러 개의 가우시안 성분으로 구성된 확률적 혼합모형으로 추정되는 과정을 보여준다. 마지막으로 Fig. 5는 계층적 군집화(Hierarchical Clustering) 결과를 덴드로그램(dendrogram) 형태로 나타낸 것으로, 클러스터 간 거리를 기반으로 데이터가 단계적으로 병합되는 과정을 시각화하고, 덴드로그램을 특정 높이에서 절단하여 최종 군집 수를 결정할 수 있음을 보여준다.
2.4 부트스트래핑 기반 강건성 평가
군집화 결과의 신뢰성을 평가하기 위해 부트스트래핑(bootstrapping) 기반 강건성 검증을 수행하였다. 전체 자료에 대해 200회 재표본(resampling)을 반복 수행하고 각 반복에서 군집화를 재적용하여 원본 데이터와 재표본 데이터 간 군집 일치도를 평가하였다. 군집 결과의 안전성은 ARI (Adjusted Rand Index)를 활용하여 정량적으로 비교하였으며, 이를 통해 K-Means, GMM, Hierarchical Clustering 간 안정성 차이를 분석하였다. Fig. 6은 부트스트래핑(bootstrap) 과정을 나타낸다. 왼쪽 패널은 원본 데이터로부터 복원추출을 통해 여러 개의 부트스트랩 샘플이 생성되는 과정을 보여주며, 오른쪽 패널은 이렇게 생성된 샘플들의 분포를 시각화하여 통계량의 표본분포를 근사하는 과정을 설명한다.
3. 분석 결과
3.1 빈도해석 결과
본 연구에서는 전국 77개 기상관측소의 연 최대 최심신적설 자료를 대상으로 Gumbel, Generalized Extreme Value (GEV), Weibull, Pearson Type III, Lognormal 분포를 적용하여 극치분포 기반 빈도해석을 수행하였으며, Kolmogorov-Smirnov (KS) 검정을 활용하여 관측소별 최적분포를 선정하였다. 분석 결과, 다수의 관측소에서 Pearson Type III와 GEV 분포가 우세하게 나타났으며, 일부 지점에서는 Gumbel 및 Weibull 분포가 선택되어 지역 간 극치분포 특성의 이질성이 확인되었다. 특히, 대관령·속초 등 강원 산간지역과 같이 폭설 다발지점에서는 꼬리(tail) 확률이 상대적으로 두꺼운 Pearson Type III와 GEV 분포가 빈번히 선택되어, 극한 적설 사건의 확률적 특성을 보다 정밀하게 반영하는 분포의 필요성이 강조되었다. 지점별 최적 분포의 분포는 Fig. 7에 제시하였으며, GEV・Pearson-III는 강원 산지 및 동해안에 상대적으로 집중되고, Gumbel/Weibull은 내륙 평지 관측소에 비교적 고르게 분포하는 경향을 확인할 수 있다.

Fig. 7.
Spatial distribution of best-fit probability distributions for annual maximum snow depth in South Korea based on the Kolmogorov-Smirnov (KS) test. Each station is classified into one of five distributions: Gumbel (red), GEV (yellow), Weibull (blue), Pearson Type III (green), and Lognormal (black). The map includes administrative boundaries, a north arrow, and a 100-km scale bar for reference
선정된 최적분포를 기반으로 2, 5, 10, 30, 50, 100, 200년 재현기간에 해당하는 최대 적설심을 산정한 결과, 강원도 산간 및 중부 내륙 일부 지점에서 100년 재현기간 적설심이 200 cm 이상으로 추정되었으며, 반면 수도권 및 남부 내륙 지역의 일부 관측소에서는 50 cm 이하의 낮은 값을 나타냈다(Fig. 8). 이러한 공간적 차이는 고도, 지형적 방향성(북사면 여부), 대기 순환 패턴과 같은 기후·지형 요인의 복합적 작용에 기인하는 것으로 판단된다.

Fig. 8.
Boxplots of the maximum snow depth for different return periods: (a) 2, 5, 10, and 30-year return periods; (b) 50, 100, and 200-year return periods. The boxes represent the interquartile range (IQR), the horizontal line within each box indicates the median, whiskers denote 1.5×IQR, and circles show outliers. Increasing return periods exhibit a wider spread in snow depth, reflecting greater spatial variability in extreme snowfall events
특히 Fig. 8에 나타난 바와 같이 재현기간이 증가함에 따라 전국 기상관측소의 최대 적설심 분포는 중앙값뿐 아니라 상위 사분위수(Q3)와 극단치(outliers) 범위에서도 뚜렷한 확장 양상을 보였다. 예를 들어 2년 재현기간에서는 전국 관측소의 최대 적설심 중앙값이 약 10-15 cm 범위에 집중된 반면, 100년 재현기간에서는 일부 관측소에서 200 cm 이상의 적설심이 산정되어 지역 간 격차가 현저하게 확대되었다. 이러한 경향은 강원 산간 및 중부 내륙의 고지대 관측소에서 특히 두드러지게 나타났으며, 반대로 수도권 및 남부 내륙의 평지 관측소에서는 100년 재현기간에서도 대부분 50 cm 이하의 상대적으로 낮은 값을 보였다.
또한, 재현기간이 증가할수록 사분위 범위(interquartile range, IQR)가 비례적으로 확장되는 현상은 극한 적설심의 공간적 변동성이 기후·지형 요인에 의해 비선형적으로 증폭될 수 있음을 시사한다. 이는 단순히 평균 적설심 변화뿐만 아니라 극값 분포의 상위 꼬리(tail) 특성에 대한 정량적 분석이 필요함을 강조한다.
본 연구에서는 전국 기상관측소에서 산정된 재현기간별 최대 최심신적설을 바탕으로 Ordinary Kriging (OK) 기법을 활용하여 공간보간을 수행하고, 재현기간별 극한 적설 심도의 공간적 분포를 Fig. 9에 제시하였다. 크리깅은 관측지점 간 공간적 상관성을 고려하여 추정값을 산정하는 통계적 보간 기법으로, 주변 지점의 영향에 의해 극단값이 부분적으로 완화(smoothing)되는 특성을 가진다. 따라서 관측값 중 일부 지점에서 600 cm 이상의 최대 적설심이 산정되었더라도, 보간 결과는 공간적 평균화 효과로 인해 200년 재현기간의 경우 약 350 cm 내외로 표현된다.
Fig. 9 결과를 살펴보면, 재현기간이 증가할수록 적설심의 최대값과 공간적 분포 범위가 모두 확대되는 경향이 뚜렷하게 나타난다. 2년·5년 재현기간에서는 주로 강원 영동 산지에 집중된 국지적 고적설 심도가 나타나며, 30년 이상 재현기간부터는 영서 내륙과 일부 산간 지역으로 고적설 구역이 확장된다. 특히 100년과 200년 재현기간에서는 강원 산악지대뿐만 아니라 일부 중부 내륙 지역에서도 200 cm 이상의 고적설 심도가 관측·추정되는 등 극한 적설사상의 공간적 불균일성이 두드러지게 확대되는 양상을 보였다.
이러한 결과는 극한 재현기간에서의 적설심이 특정 지역에 편중되어 나타나는 기후학적 리스크를 시사하며, 재난 대응 및 설계 기준 수립 시 지역 맞춤형 대책 수립의 필요성을 뒷받침한다. 또한 단순 평균 적설심뿐 아니라 극단분포의 상위 꼬리(tail) 특성을 고려한 통계적·공간적 분석이 필수적임을 확인할 수 있다.
3.2 군집화 결과
재현기간별 최대 적설심 벡터(2~200년)를 입력으로 하여 K-means, GMM, Hierarchical의 세 기법을 적용하였다. 엘보우(WCSS)와 실루엣 계수 결과(Figs. 10 and 11)에서 k=5가 합리적이었고, 이를 기준으로 세 기법의 공간 패턴을 비교하였다(Figs. 12, 13, 14).

Fig. 11.
Silhouette scores for different numbers of clusters (k=2-6). Although the highest silhouette score is observed at k=2, a larger number of clusters is required to capture spatial and statistical variability. The value at k=5 shows a relatively stable score, supporting the selection of five clusters for further analysis
세 지도에서 공통적으로 확인되는 점은 다음과 같다. (i) Cluster 1(빨강)이 주로 강원 산간-영동 및 태백산맥 축의 고적설역에 응집하여 나타난다. (ii) 저적설역은 남부 해안·제주 및 서해안-수도권 남부에 넓게 분포하며, 방법에 따라 Cluster 2(노랑) 또는 Cluster 5(검정)로 할당된다. (iii) 동해안 일부(속초-동해 일대, 울릉도 포함)에서 별도의 군집(Cluster 3; 파랑 또는 Cluster 4; 초록)이 소수 지점으로 나타나는데, 이는 장주기 재현기간에서의 분포 꼬리(heavy tail) 또는 지역적 지형효과(습윤 동해안형 강설)를 반영한 것으로 해석된다.
방법별 차이는 다음과 같이 뚜렷하다. K-means (Fig. 12)는 군집 크기가 비교적 균형적이며, 고적설(Cluster 1; 빨강)과 저적설(Cluster 5; 검정)을 공간적으로 선명하게 분리한다. 남부·서해안의 저적설역은 주로 검정(Cluster 5)으로, 내륙의 중간 적설역은 노랑/파랑/초록으로 나뉘어 경계가 가장 명확하다. GMM (Fig. 13)은 GMM의 Cluster 5는 주요한 극한 적설 특성이 관측되지 않은 지역들을 통합하는 “배경 군집(background cluster)”으로 가능하며, 이는 GMM이 각 관측소의 적설 특성을 연속적인 확률 분포 형태로 모델링함에 따라 발생하는 자연스러운 결과이다. 이러한 배경 군집은 다수 관측소가 평균적인 적설 양상을 보이는 반면, 소수의 고특이점(극한 적설 구역)은 개별 군집으로 분리되는 GMM의 구조적 특성에 기인하며, 이는 중간 적설 범위의 경계 지점에서의 확률적 혼합 분포를 반영하는 해석으로 이해될 수 있다. 반면, 강원 산간의 빨강(Cluster 1)과 동해안의 파랑/초록(Cluster 3/4)은 소수지만 안정적으로 유지되어 경계 지점의 확률적(유연한) 배정을 보여준다. Hierarchical (Fig. 14)는 노랑(Cluster 2)이 대부분의 지점을 차지하는 거대 군집으로 형성되고, 나머지(빨강/파랑/초록/검정)는 소수의 특이 지역으로 남는다. 응집적 특성상 유사도가 높은 지점이 단계적으로 합쳐지면서 전반적 패턴은 보수적·조밀, 세부 경계는 다소 둔화된다. 요약하면, 고적설 핵심역(강원 산간-영동)은 세 기법에서 모두 일관되게 분리되며, 중·저적설역의 경계 처리에 따라 방법 간 차이가 발생한다. K-means는 해상도와 해석 용이성이 가장 높고, GMM은 경계 및 혼합 지역을 유연하게 흡수해 대형 배경군집(Cluster 5)을 형성하며, Hierarchical는 대규모 단일 군집(Cluster 2)을 중심으로 보수적 분할을 제공한다. 부트스트랩 기반 강건성(3.3절)에서도 이러한 성향이 반영되어 GMM의 평균 ARI가 가장 높고, K-means가 그 다음, Hierarchical가 가장 낮았다 - 즉, GMM은 표본 변동 하에서 군집 재현성이 우수, K-means는 경계가 선명해 해석이 용이, Hierarchical는 거시 패턴 파악에 적합하다. 이러한 상보적 특성에 비추어, 설계·운영 목적의 지역 유형화에는 K-means (가독성) 또는 GMM (재현성)을 우선 활용하고, 초기 탐색 단계에서는 Hierarchical로 거시 분포를 확인한 뒤 세밀 기법으로 보완하는 전략이 타당하다.
3.3 강건성 평가 결과
본 연구에서는 군집화 결과의 신뢰성을 정량적으로 검증하기 위해 200회 부트스트랩(bootstrap) 재표본화를 수행하고, 각 표본에 대해 K-means, Gaussian Mixture Model (GMM), Hierarchical Clustering 기법을 동일한 조건에서 반복 적용하였다. 원자료에서의 기준 군집 결과와 부트스트랩 표본에서의 결과 간 일치도는 Adjusted Rand Index (ARI)로 산정하였으며, 평균(Mean), 표준편차(SD), 사분위수(Q25-Q75), 그리고 95% 분위수(Q2.5-Q97.5)를 산출하였다(Table 1, Fig. 15).
Table 1.
Bootstrap-based stability assessment of clustering methods (B=200)
| Method | Mean | SD | Q25 | Median | Q75 | Q2.5 | Q97.5 |
| KMeans | 0.609 | 0.236 | 0.43 | 0.574 | 0.821 | 0.226 | 1 |
| GMM | 0.687 | 0.289 | 0.41 | 0.746 | 0.987 | 0.185 | 1 |
| Hierarchical | 0.497 | 0.222 | 0.315 | 0.444 | 0.675 | 0.185 | 0.959 |

Fig. 15.
Boxplots summarizing the distribution of Adjusted Rand Index (ARI) across 200 bootstrap samples for K-means, GMM, and Hierarchical clustering. The horizontal line denotes the median; the box limits correspond to the interquartile range (Q25–Q75); whiskers indicate 95% quantile intervals (Q2.5–Q97.5)
분석 결과, GMM 기법이 평균 ARI=0.687로 가장 높은 안정성을 보였으며, 중앙값 또한 0.746으로 나타나 군집 경계의 재현성이 가장 우수한 것으로 확인되었다. K-means 기법은 평균 ARI=0.609, 중앙값 0.574로 비교적 양호한 성능을 보였으며, Hierarchical Clustering은 평균 ARI=0.497로 가장 낮은 안정성을 나타냈다.
특히 GMM과 K-means 기법의 95% 분위수 상한(Q97.5)이 1.0에 도달한 것은 일부 지역(예: 고적설 관측소)에서 표본 변동성과 관계없이 동일한 군집 결과가 반복적으로 재현되었음을 의미한다. 반면 중간 적설 특성을 보이는 지역에서는 군집 경계의 불확실성이 커서 ARI 값의 분산이 상대적으로 높게 나타났으며, 이는 ARI 값의 높은 분산이 곧 경계 지역의 군집 재현성 불안정성과 직접적으로 연결됨을 의미하며, 특히 GMM의 경우에도 이러한 지역에서는 구성 군집 간 중첩된 확률 밀도 함수로 인해 군집 할당이 샘플간 다르게 나타날 수 있다.
4. 고 찰
본 연구는 기후변화에 따른 극한 적설의 공간적 이질성을 빈도해석-군집화-강건성 평가라는 통합적 방법론을 통해 정량화하였으며, 이 과정에서 도출된 분석 결과는 이론적 기여뿐 아니라 실무적 활용 측면에서도 의미 있는 시사점을 제공한다.
우선, 빈도해석 결과에서 나타난 극치분포의 공간적 다양성은 적설심이라는 단일 기상 변수조차 지역에 따라 상이한 통계적 구조를 가지며, 이는 재현기간 산정과 설계기준 수립 시 전국 일률적 접근이 부적절함을 시사한다. 특히 고지대 및 대설 빈발지역에서는 꼬리 확률이 두꺼운 GEV나 Pearson-III 분포가 우세하였고, 이는 극한 설계에 있어 tail-risk 중심의 분포 선택이 필수적임을 강조한다. 이 같은 결과는 Moller et al. (2017) 및 Blanchet et al. (2009)의 연구와 일치하며, 기후 리스크가 단순히 평균이 아닌 “극단값의 구조적 특성”에서 비롯된다는 점을 재확인시킨다.
둘째, 재현기간별 공간보간 결과는 동해안 및 강원 산간 지역의 고적설 특성이 장기 재현기간에서 전국으로 확장되는 양상을 보여주며, 기후시스템의 내재적 변동성과 지형적 영향이 극값 특성을 증폭시키는 메커니즘을 반영한다. 이 결과는 단순히 "눈이 많이 오는 지역"을 파악하는 것을 넘어서, 극단값의 공간 패턴이 어떻게 확장되고 재편되는지를 보여주는 지표로 기능할 수 있다.
셋째, 본 연구에서 제안된 다중 군집화 기법의 적용은 극한 적설 특성에 따라 기상관측소를 유형화할 수 있는 실질적 기반을 마련하였다는 점에서 큰 의의가 있다. 기존 연구들(Nam et al., 2008; Kim et al., 2012; Oh et al., 2008; Yoo et al., 2010)은 군집분석을 통해 강수량, 가뭄 등의 지역 구분을 시도했지만, 본 연구처럼 빈도해석 기반 극값 곡선 자체를 군집의 기준으로 삼고, 동시에 GMM과 부트스트래핑을 통한 통계적 강건성 검증을 수행한 사례는 국내외적으로 매우 드물다. 특히 GMM이 군집 경계의 유연성과 안정성 측면에서 가장 우수한 성능을 보였으며, K-means는 해석 편의성이 높아 실무 적용에 유리함이 확인되었다. 이는 Clustering 기법 선택에 있어 “정확성 vs. 해석 용이성”의 트레이드오프를 고려해야 함을 의미한다. 이러한 알고리즘별 특성은 Fig. 16에 정리한 바와 같이 ‘해석 용이성–통계적 강건성’ 축에서의 상대적 위치로 도식화하였다. GMM은 높은 재현성과 통계적 안정성 측면에서 우수하지만, 그 해석이 복잡하고 경계가 연속적이기 때문에 직관적인 구역 설정에는 다소 불리하다. 반면 K-means는 해석 용이성이 뛰어나지만, 통계적 안정성이나 경계 유연성에는 상대적으로 제한적이다. Hierarchical는 보수적이며 거시적 패턴 파악에 적합하지만, 세밀한 공간 구분에는 제약이 있다.
또한, 군집화 기법에 따라 경계지역의 분류가 상이하게 나타난다는 점은 정책 결정 시 고려해야 할 중요한 요소다. 예컨대 K-means는 명확한 군집 구분을 제공하지만 경계의 유연성은 떨어지는 반면, GMM은 확률 기반의 연속적인 배정이 가능해 경계 지역에 대한 포용성이 높다. 따라서 재난 대응, 인프라 설계 등 실제 적용 목적에 따라 상호 보완적 기법 활용 전략이 필요하다.
다만 본 연구는 다음과 같은 한계도 내포하고 있다. 첫째, 기상관측소의 수가 77개로 한정되어 있어, 일부 미관측 지역의 보간 결과는 높은 불확실성을 가질 수 있다. 둘째, 빈도해석에 사용된 분포는 단변량(extreme univariate) 분포에 국한되었으며, 향후 공동분포(joint distribution) 혹은 **이변량 극치 분석(bivariate extreme analysis)**을 적용할 경우, 설계기준 간 연계성 및 리스크 통합 분석이 가능할 것이다. 셋째, 강건성 평가는 ARI에 기반한 통계적 반복성 검증에 초점을 맞췄으나, 향후 실제 재해 발생 빈도나 피해 규모와의 정합성을 검토하는 실증적 검증 단계가 추가된다면 실효성이 더욱 높아질 수 있다.
그럼에도 불구하고, 본 연구는 빈도해석-군집화-강건성 평가를 통합한 분석 체계를 정립함으로써, 기후변화 하에서의 극한 적설 특성을 과학적·객관적으로 유형화할 수 있는 프레임워크를 제시하였다. 특히 정책 수립자 및 인프라 설계자 입장에서는 본 연구의 결과를 바탕으로 지역별 리스크 등급화를 수행하고, 차별화된 설계 기준을 마련할 수 있다는 점에서 실질적 기여가 크다. 향후에는 본 연구를 기반으로 기후변화 시나리오(SSP, RCP) 적용, 실시간 적설 예측과의 통합, 융설 및 홍수와의 연계 리스크 평가 등으로 확장하여, 종합적 재난 대응 전략 수립에 기여할 수 있을 것으로 기대된다.
5. 결 론
본 연구는 전국 기상관측소의 장기 적설 관측자료를 기반으로 극치분포 기반 빈도해석, 공간 보간, 다중 군집화, 그리고 부트스트래핑 기반 강건성 평가를 통합한 분석 체계를 제안하였다. 이러한 접근법은 극한 적설의 공간적 이질성을 정량적으로 규명하고, 기후 리스크 평가를 위한 과학적 근거를 제공한다는 점에서 학술적·실무적 활용 가치가 높다.
첫째, 빈도해석 결과에서 단일 확률분포만으로는 지역 간 적설 특성의 이질성을 충분히 설명하기 어렵다는 점을 보여주었다. 특히 고적설 지역에서는 꼬리 확률이 두꺼운 GEV 및 Pearson Type III 분포가 우세하게 나타났으며, 이는 재현기간 기반 설계 시 지역의 기후·지형적 요인을 반영한 맞춤형 분포 선택이 필요함을 시사한다.
둘째, 재현기간이 증가함에 따라 극한 적설의 공간적 집중성과 변동성이 모두 확대되는 현상이 나타났다. 강원 산악지대뿐만 아니라 중부 내륙 일부에서도 200cm를 초과하는 적설심이 산정되었으며, 이는 장기 재현기간에서 위험 지역의 범위가 재정의될 가능성을 보여준다.
셋째, K-means, GMM, Hierarchical Clustering을 적용한 군집화 결과, 강원 산간-영동 지역은 세 기법 모두에서 일관되게 고적설 핵심역으로 분류되었으며, 중·저적설 지역에서는 기법 간 상이한 군집 경계가 나타났다. 이러한 차이는 분석 목적에 따라 단일 알고리즘보다는 다중 군집 기법의 상호 비교와 보완적 활용이 필요함을 의미한다.
넷째, 부트스트래핑 기반 강건성 평가 결과, GMM 기법은 가장 높은 군집 재현성을 보였고, K-means는 해석 용이성이 뛰어난 것으로 확인되었다. 이는 알고리즘 선택 시 통계적 안정성과 해석의 명확성 간의 균형을 고려해야 함을 정량적으로 입증한 결과이다.
종합하면, 본 연구는 극한 적설의 통계적 특성과 공간적 패턴을 동시에 반영하는 분석 프레임워크를 구축함으로써, 기후 기반 설계기준 수립, 지역별 적설 대응 전략, 그리고 재해 리스크 관리 체계 정교화에 실질적인 기여를 할 수 있음을 보여주었다.
또한 본 연구에서 제안한 방법론은 적설뿐만 아니라 강우, 홍수, 가뭄 등 다양한 기후 극한 변수로 확장 가능하며, 복합재난 분석 및 기후 적응 전략 수립에도 적용될 수 있다. 향후 연구에서는 (1) 기후변화 시나리오(SSP, RCP) 기반 미래 적설 특성 분석, (2) 적설-융설-홍수 연계 재해 시나리오 통합 분석, (3) 실시간 자료를 활용한 동적 군집화 및 시계열 클러스터링 적용을 통해 본 연구의 분석 체계를 고도화할 수 있을 것이다. 더 나아가, 고도별 가중치를 포함한 3차원 영역 평균화 기법 개발, GPU 기반 병렬 연산을 활용한 실시간 처리 프레임워크 구축, 다양한 지형·도시 환경에서의 적용성 검증이 향후 과제로 제시된다. 특히 폭설 및 집중호우가 빈발하는 기후위기 상황에서 본 연구의 접근법을 현장 적용과 정책적 활용으로 연결하는 작업은 학문적·실무적으로 중요한 과제가 될 것이다.














