1. 서 론
2. 연구 대상 지역 및 자료
2.1 대상 지역
2.2 대상 자료
3. XGBoost 모형 기반의 하천습지 대체습지 후보지 선정 방법
4. 연구 결과 및 토의
4.1 모형 구축 결과
4.2 하천습지 대체습지 후보지 선정 결과 분석
5. 결 론
1. 서 론
습지는 육상 생태계와 수생 생태계의 전이가 이루어지는 곳으로, 생물 다양성 보존, 영양물질 공급, 수위조절과 같은 다양한 기능을 수행하여 환경 생태학적으로 높은 가치를 지닌다(Li et al., 2020; Kim et al., 2017; Sun et al., 2017). 습지의 유형은 습지가 형성되는 메커니즘과 지형적 특성을 비롯한 여러 요건에 의해 구분될 수 있으며, 습지를 형성하는 물의 종류에 따라 담수로 구성된 내륙습지(inland wetland)와 염수로 구성된 연안습지(coastal wetland)로 나눌 수 있다(Park et al., 2005). 기후변화가 심화됨에 따라, 탄소 포집 및 저장 능력이 일찍이 확인된 연안습지 및 해양 생태계에서는 ‘블루 카본(blue carbon)’이라는 개념을 도입하여 활발한 생태계 보전과 연구가 진행되었지만(Macreadie et al., 2021; Meng et al., 2019; Siikamäki et al., 2013), 내륙습지는 상대적으로 주목받지 못하였다. 그러나 Nahlik and Fennessy (2016)에 의해 수행된 연구를 통해 내륙습지가 연안습지와 유사한 수준의 탄소 포집 및 저장 능력을 지닌다는 사실이 확인되었다. 이에 따라 비교적 최근에 내륙습지에서 포집 및 저장되는 탄소를 ‘틸 카본(teal carbon)’으로 정의하게 되었으며, 내륙습지를 대상으로 한 습지 보전 및 연구가 점진적으로 진행되고 있다(Zinke, 2020).
우리나라 내륙습지는 지형에 따라 산지습지, 호수습지, 인공습지, 하천습지로 구분된다(ME, 2011). 우리나라 내륙습지에서 가장 넓은 면적을 차지하는 유형은 하천의 범람으로 형성된 하천습지로, 주기적인 범람으로 인해 침수와 노출이 반복되는 퇴적환경을 이루는 수심 2 m 이하의 수역으로 정의된다(Fretwell et al., 1996; Wilson and Mitsch, 1996). 하천습지는 서식지보다 유로(channel)로 인식되며 저평가되었으나(Son and Jeon, 2003), 하천 범람 및 퇴적작용을 통해 다변하는 하천 지형은 생태계에 영양염류를 공급하고 생물체에 서식처를 제공하여 생태계 보전과 유지 및 생물 다양성 향상에 중요한 지형적, 지리적 역할을 한다. 또한, 하천습지의 다양한 지표면 높낮이와 토양환경은 천연기념물 보존에 기여하고, 홍수와 가뭄 등의 자연재해를 완화하고 오염을 정화하는 역할을 한다(Yoon and Yun, 2022). 이러한 특성으로 인해 하천습지는 면적, 환경 생물 다양성 변화에 특히 높은 반응성을 보이며(Lee and Youn, 2022; Xu et al., 2019), 하천습지의 이산화탄소 흡수 및 고정 능력 또한 하천습지의 지형, 퇴적물 입도, 퇴적환경에 크게 영향을 받는다(Yoon and Yun, 2022). 이에 따라, 내륙습지 중 가장 넓은 면적을 차지하는 하천습지의 집중 관리는 효율적인 내륙습지 보전을 위해 필수적이다.
생태적·환경적 중요성에도 불구하고 국내 하천습지는 매립, 간척을 포함한 다양한 개발로 인해 규모가 빠르게 감소하고 있으며(Rho and Lee, 2007), 지역 주민의 삶의 질과 환경 안전성에도 부정적인 영향을 미치고 있다(Horwitz and Finlayson, 2011). 환경부는 5년 주기로 내륙습지의 규모 변화와 식생을 조사하고 있으며, 2017년과 2022년 조사에서 확인된 10곳의 하천습지 소실은 체계적인 모니터링과 훼손 방지 대책의 필요성을 보여준다. 미국은 1988년 습지 훼손에 대응하기 위해 보상 방안으로 대체습지를 도입하였으며, 습지 본연의 기능 손실을 방지하기 위해 습지 총량 유지를 법제화하였다. 대체습지는 훼손된 습지의 생태적 기능을 복원하거나 보완하는 역할을 하며, 이를 통해 환경적 손실을 최소화하려는 노력이 이루어지고 있다. 대체습지를 조성할 때는 생태계 연결성과 기능적 연속성을 유지하기 위해, 다른 지역의 습지보다 동일 지역 내 습지를, 이종 습지보다 동종 습지를 우선적으로 고려해야 한다(Niu et al., 2023; De Grove, 2013).
습지 모니터링과 대체습지 조성을 위한 분석에 공간정보 활용이 필수적인 만큼, 국내외에서 원격탐사자료를 활용한 연구가 진행되었다. 국내의 경우, Choi et al. (2010)은 IKONOS, SPOT, Landsat 영상을 활용하여 연안습지의 퇴적환경 및 저세미세조류 환경을 분석하였다. 또한 Yi et al. (2010)은 Landsat, Kompsat-2, 항공 LiDAR 자료를 이용하여 낙동강 하구습지의 공간정보를 추출하였다. 국외에서는 원격탐사 자료에 머신러닝을 결합한 연구가 이루어지고 있다. Petropoulos et al. (2015)는 Landsat 영상을 기반으로 서포트 벡터 머신(support vector machine, SVM)을 활용하여 연안습지의 퇴적과 침식을 정량화하였으며, Mallick et al. (2021)은 SVM을 비롯한 5개의 머신러닝 알고리즘을 적용하여 습지를 지도화하였다. 또한, Aslam et al. (2024)는 랜덤 포레스트(random forest) 기반 모형을 활용하여 습지의 취약성을 분석하였다. 이처럼 원격탐사자료와 머신러닝을 결합한 연구는 습지의 정량적 분석 및 시각화에 있어 큰 진전을 이루었으나, 기존 연구는 주로 정량화와 지도화에 초점이 맞추어져 있어, 잠재적인 하천습지 후보지를 탐색하는 부분에서는 여전히 개선의 여지가 존재한다.
본 연구에서는 extreme gradient boost (XGBoost) 기반 이진 분류 모형에 원격탐사자료와 재분석자료를 적용하여 잠재적인 하천습지 후보지를 탐색하는 방법론을 제안하였다. 모형의 학습에는 면적이 넓은 하천습지 10곳의 원격탐사 및 재분석자료에서 수집한 수문·기상, 식생, 탄소 관련 인자 총 13개가 활용되었다. 2017년부터 2022년까지 6년간의 자료를 기반으로 학습된 모형에 2023년 1월부터 12월까지의 월별 원격탐사 및 재분석자료를 평균한 연간 대표자료를 적용하였다. 모형의 결과는 픽셀별 유사도로, 연구에서 구축한 XGBoost 모형의 의사결정 경로와 하천습지와 얼마나 일치하는지를 확률적으로 나타낸다. 본 연구에서는 학습 자료와 99% 이상의 유사도를 가지는 지역을 나타냄으로써 하천습지의 대체습지 형성 시 우선적으로 고려할 수 있는 지역을 도출하고자 하였다. 해당 지역은 기존 하천습지와 유사한 특성을 가지는 지역으로, 하천습지의 대체습지 후보지로 거론될 수 있는 지역이다. 본 연구는 현장 중심의 조사를 위한 사전 조사에 활용되어 조사의 효율을 높일 수 있다.
2. 연구 대상 지역 및 자료
2.1 대상 지역
본 연구에서는 하천습지의 대체습지를 탐색하는 XGBoost 모형을 구축하기 위하여 전국 하천습지(1,327곳, 991.93 km2) 중 면적이 가장 큰 10곳을 선정하여 모형 학습에 활용하였으며(Fig. 1), 자세한 위치 및 면적에 관한 정보는 Table 1에 나타나 있다. 해당 지역은 2017년과 2022년에 제작된 내륙습지 인벤토리 자료를 통해 존속이 확인된 지역으로 모형의 하천습지 특성 학습을 위해 활용되었다. 습지 존속 파악을 위해 활용한 2017년과 2022년의 내륙습지 인벤토리 자료는 각각 환경 빅데이터 플랫폼(Envbigdata, https://www.bigdata-environment.kr)과 에코뱅크(Ecobank, https://www.nie-ecobank.kr) 웹사이트에서 제공되고 있다.
Table 1.
Location and area information of 10 river wetlands
2.2 대상 자료
본 연구에서는 하천습지의 대체습지 선정을 위한 XGBoost 기반 모형을 구축하면서, 하천습지의 수문·기상, 탄소, 식생 등 주요 생태적·환경적 특성을 반영하기 위해 대상 지역의 원격탐사자료와 재분석자료를 통합적으로 활용하였다. 이를 통해 대체습지 후보지의 잠재성을 정량적으로 평가하고, 효율적인 선정 방안을 제시하고자 하였다. 원격탐사자료 MODerate resolution Imaging Spectroradiometer (MODIS)와 Integrated Multi-satellitE Retrievals for Global Precipitation Measurement (GPM IMERG)를 통해 획득한 인자 9개와 유럽 중기기상예보센터(European Centre for Medium-Range Weather Forecasts, ECMWF)에서 제공하는 5번째 세대 자료(5th Generation of ECMWF ReAnalysis Land, ERA5 Land)를 통해 인자 4개를 획득하여 도합 13개의 수문·기상, 식생, 탄소 관련 인자를 확보하였다(Table 2). 상이한 시·공간 해상도를 가진 자료를 100 m × 100 m 공간 해상도의 월 단위 자료로 변환하기 위해 각각 최근접 이웃 보간법(nearest-neighbor interpolation)과 선형 보간 방법(linear interpolation)을 사용하였다.
Table 2.
Summary of the datasets used in this study
미항공우주국(National Aeronautics and Space Administration, NASA)은 지구권 내를 관측하기 위해 다중 분광 센서인 MODIS를 극궤도 위성 Terra와 Aqua에 탑재하였다(Justice et al., 1998). MODIS는 다양한 파장대를 활용 및 조합하여 20개 이상의 환경, 수문, 기상, 식생, 반사도 자료를 주기적으로 제공하고 있으며, 정확성에 대한 많은 검증이 이루어진 바 있다(Baik et al., 2022). 본 연구에 활용된 MODIS 기반 인자는 Level-3 product (MOD16A2, MOD13A1, MOD15A2H, MOD17A2, MOD09A1)를 통해 획득하였다. 습지의 수문 순환 및 기상의 측면을 고려하기 위해 본 연구에 활용된 수문·기상 인자는 MOD16A2를 통해 획득한 잠열 플럭스(latent heat, LE), 잠재증발산(potential evapotranspiration, PET)와 MOD09A1의 Band 2번과 4번의 조합으로 계산한 정규화된 수분 지수(normalized difference water index, NDWI)이다. LE는 물 순환 및 지역 기후변화 예측에 활용되며(Chen et al., 2020), 특히 습지에서의 LE는 열교환을 나타낼 뿐만 아니라, 주된 열 흡수원 역할을 수행한다(Piccolo, 2019). 토양이 수분으로 완전 포화 되어 있을 때 발생하는 증발산량을 나타내는 지표(Yoon and Yoo, 2023)인 PET를 장기적으로 수분이 포화 되어 있는 습지 생태계에 적용할 시, 물 순환을 짐작할 수 있으며, 물 수요 예측을 통해 생태계 안정성을 파악할 수 있다. NDWI는 반사도 차이를 활용하여 수체를 탐지할 수 있는 인자로, 아래 Eq. (1)에 따라 MOD09A1의 band 2번과 4번을 사용하여 인자를 계산하였다.
연구에 활용된 MODIS 기반 식생 인자에는 식생의 광학 영상으로 기반으로 활력도를 평가하는 향상된 식생 지수(enhanced vegetation index, EVI), 정규화된 식생지수(normalized difference vegetation index, NDVI)와 식생 구조 및 기능을 정량화하는 입면적 지수(leaf area index, LAI), 광합성유효복사흡수율(fraction of photosynthetically active radiation, FPAR)가 있다. EVI와 NDVI는 MOD13A1를 활용하였으며, LAI와 FPAR는 MOD15A2H를 활용하였다. Fu et al. (2024) 연구진에 따르면, NDVI와 EVI는 식물 종의 밀도와 분포를 반영하여 종 다양성 추정에 활용될 수 있으며, Zhao et al. (2009)는 EVI와 NDVI를 활용하여 하천습지의 생태적 특성을 관측하여 하천습지 모니터링의 가능성을 확인하였다. LAI는 식생의 생물량, 생산성, 광합성 능력을 간접적으로 설명한다는 측면에서 중요한 인자이며(Luo et al., 2015; Adam et al., 2010), Wang et al. (2015)은 MODIS FPAR을 활용하여 홍수가 습지 식생에 미치는 영향을 관측하였다.
생태계에서 생산된 유기물의 총량을 나타내는 총일차생산량(gross primary productivity, GPP)는 하천습지의 탄소 순환을 살펴보기 위해 활용되었으며, 본 연구에 활용된 GPP는 MOD17A2에서 획득하였다. Xiao et al. (2019)은 GPP를 활용하여 습지 생태계에서 흡수하는 탄소량 및 탄소 예산을 정량화하였으며, Tuttle et al. (2008)은 GPP를 통해 습지에서 일어나는 유기물 생산 및 소비 과정을 파악하여 수문 유입량이 습지 건강성에 미치는 영향을 확인하였다. MODIS에 기반한 각종 인자 자료는 홈페이지(https://terra.nasa.gov/data/modis-data)에서 획득할 수 있다.
GPM IMERG는 전 지구 규모의 강수 정보를 제공하는 위성 기반 자료로, 다수의 연구에서 미래 기후 예측 및 강수가 생태계에 미치는 영향을 분석하기 위해 활용되고 있다(Pradhan et al., 2022; Huffman et al., 2020). 강수는 습지의 주요 수분 공급원으로, 강수량의 변화는 습지 내 식생 분포, 생물 다양성 및 생태계 변화에 직·간접적인 연관성이 있는 것으로 나타났다(Feher et al., 2017; Kovářová and Pokorný, 2010; Poiani et al., 1995). GPM IMERG는 인공위성에 탑재된 센서에서 측정된 정보와 다수의 추가 인공위성 자료 및 강우소 관측 자료의 결합 및 검증을 통해 생성된다(Huffman et al., 2015). 본 연구에 활용된 IMERG 자료는 GPM IMERG의 7번째 버전 자료(IMERG_GPM_3IMERG 07)의 Final run 자료로 2023년 7월부터 배포되었으며, 다수의 위성 데이터와 지상 강수 게이지 데이터를 통합하여 검증 완료 후 제공되는 자료로, 다수의 연구에서 높은 정확도를 보였다(Foelsche et al., 2017). 본 연구에 활용한 자료는 NASA Earthdata 사이트(https://disc.gsfc.nasa.gov/)에서 획득할 수 있다.
본 연구에서는 다수의 연구에서 기후 분석 및 예측에 활용되어 정확성이 검증된 ERA5 재분석자료 중에서도 특히 육지 특성을 보다 정밀하게 모의할 수 있도록 대규모 지상 및 위성 자료를 앙상블하여 제공되는 ERA5-Land 자료를 활용하였다(Gomis-Cebolla et al., 2023; Yilmaz, 2023). 본 연구에 활용한 데이터는 2 m 높이의 이슬점 온도(dewpoint temperature, Td), 대기 온도(air temperature, Ta) 및 지표면 온도(land surface temperature, LST)와 지표면부터 지표면 아래 약 7 cm 깊이에서 측정된 평균 토양 수분량(soil moisture, SM) 데이터이다. Xu et al. (2024)은 습지의 이슬이 습지의 상태를 나타내는 지표로 활용될 수 있다고 하였으며, Barbera et al. (2015)는 Ta를 통해 기온이 습지 미생물 활동과 식물 호흡 촉진에 미치는 영향을 파악할 수 있다고 하였다. LST는 습지의 매립 및 다른 유형으로의 토지피복변화를 관측할 때 활용될 수 있는 지표이며(Du et al., 2019; Muro et al., 2018),다수의 연구를 통해 SM이 습지 건강성 및 상태를 확인할 수 있는 효율적인 지표임이 확인되었다(Bentley et al., 2022; Dabrowska-Zielinska et al., 2018; Aguilera et al., 2016; Hájek et al., 2013). ERA5-Land 자료는 ECMWF에서 운영하는 Copernicus Climate Change Service (https://cds.climate.copernicus.eu/)에서 획득할 수 있다.
3. XGBoost 모형 기반의 하천습지 대체습지 후보지 선정 방법
본 연구에서는 하천습지의 대체습지 후보지를 선정하기 위해 많은 트리가 결합하여 최적의 예측을 수행하는 XGBoost 모형을 활용하였다. Chen and Guestrin (2016)에 의해 고안된 XGBoost 모형은 여러 개의 의사결정 트리를 결합한 gradient boost machine (GBM)에 기반하지만, GBM에서 발생하는 과적합을 줄이기 위해 분류 이득이 없는 노드를 삭제하는 자체 과적합 규제 기능과 트리의 최대 깊이 설정 기능이 있다. 또한, XGBoost 모형은 병렬 연산을 수행하며 실제 값과 예측값 사이의 잔차를 줄이기 위해 새로운 트리를 추가하면서 학습을 진행하기 때문에 학습이 효율적으로 진행된다(Hwang et al., 2024). 본 연구는 평균 제곱근 오차(root mean squared error, RMSE)를 최소화하는 방향으로 진행되었으며, 과적합을 방지하기 위해 검증 성능이 개선되지 않으면 학습을 중단하기 위해 early stopping 기법을 적용하였다(Fig. 2).
본 연구에 활용된 XGBoost 모형 구축의 첫 단계는 원격탐사자료와 재분석자료를 수집하는 것이다. XGBoost 모형은 2차원 자료를 처리할 수 없으므로 2차원 자료인 원격탐사자료와 재분석자료를 1차원으로 변환하였다. XGBoost 모형의 학습은 2017년에서 2022년의 대상 지역 자료를 활용하였으며, 픽셀마다 하천습지(1)와 비하천습지(0) 정보를 라벨링 하여 목표 변수로 설정하였다. 학습 자료(training set), 검증 자료(validation set), 테스트 자료(testing set)는 각각 60%, 20%, 20%의 비율로 형성하였으며, 총 10,000회 학습하였다. 하이퍼파라미터 최적화에는 다양한 하이퍼파라미터 조합을 자동 탐색하여 최적의 조합을 도출하는 Optuna 프레임워크를 활용하였다. 학습 과정에서 최적화된 하이퍼파라미터는 학습률(eta), 노드 분할(gamma), 트리의 최대 깊이(max depth), 샘플링 비율(subsample), 자식 노드의 최소 가중치 합(min child weight)이다.
본 연구에서는 하천습지(1)와 비하천습지(0)를 분류하기 위해 XGBoost 기반의 이진 분류 모형을 구축하였다. 해당 모형은 입력된 학습 자료의 특성과 패턴을 학습하여, 예측하고자 하는 자료와 학습 자료와의 유사도를 픽셀 단위로 제시한다. 여기서 유사도란 다수의 결정 트리를 통해 학습된 분류 기준에 따라, 각 픽셀이 의사결정 경로상 하천습지와 얼마나 일치하는지를 확률적으로 나타낸 값이다. 모형 학습에는 2017년부터 2022년까지 6년간의 원격탐사 및 재분석 기반의 월 단위 100 m × 100 m 해상도 자료를 활용하였다. 이후, 2023년 전반의 하천습지 분포를 파악하기 위해 학습된 모형에 2023년 1월부터 12월까지의 월별 원격탐사 및 재분석자료를 평균한 연간 대표자료를 적용한 후, 결과를 2차원으로 변환하여 대체습지 후보지를 도출하였다. 해당 지역은 학습 자료와 99% 이상의 유사도를 가지어 하천습지의 대체습지 형성 시 우선적으로 고려할 수 있는 지역이다.
하천습지의 대체습지 후보지 선정을 위한 XGBoost 모형의 학습 성능을 알아보기 위해 학습 자료 및 검증 자료의 RMSE와 결정계수(coefficient of determination, R2), 혼동 행렬을 분석하였다. RMSE는 예측값과 실제값 간의 차이를 나타내는 지표로, 값이 낮을수록 모형의 예측 정확성이 높음을 의미한다. R2는 모형이 데이터의 변동성을 얼마나 설명하는지를 나타내는 지표로, 1에 가까울수록 우수한 성능을 나타낸다. 혼동 행렬은 분류 문제에서 true positive (TP), false positive (FP), false negative (FN), true negative (TN)로 모형의 예측값과 실제값을 비교하여 성능을 평가한다. 정밀도(precision)는 실제 양성 중에 모형이 양성으로 정확히 예측한 비율을 의미하며, 재현율(recall)은 실제 양성 중에서 모형이 얼마나 잘 찾아냈는지를 나타낸다. 정확도(accuracy)는 전체 예측 중에서 맞춘 비율을 의미하고, F1 점수는 정밀도와 재현율의 조화 평균으로 두 지표 간의 균형을 반영한다. 이를 통해 모형이 대체습지 후보지를 얼마나 정확하고 일관되게 예측하는지를 종합적으로 평가할 수 있다.
4. 연구 결과 및 토의
4.1 모형 구축 결과
하천습지 대체습지 후보지 선정을 위한 XGBoost 모형의 학습 성능을 알아보기 위해 학습 자료와 검증 자료의 RMSE와 R2를 분석한 결과는 Fig. 3와 같다. Fig. 3에서 확인 할 수 있듯이, 학습 자료와 검증 자료 모두 학습 초기 과정에서 RMSE가 급격히 감소하였으며, 약 150회 반복 학습 이후 각각 0.13과 0.20으로 수렴하여 일정하게 유지되었다. 학습 자료와 검증 자료 간 RMSE 차이는 0.06으로, 모형이 학습 데이터에 과적합 되지 않고 검증 데이터에 대해 안정적으로 일반화되었음을 보여준다. 테스트 자료의 RMSE는 0.23으로, 검증 RMSE보다 약간 높게 나타났다는 사실을 통해 모형의 일반화 성능이 양호함을 확인할 수 있었다. 학습 자료와 검증 자료의 R2는 학습 초기 50회 동안 빠르게 증가하여 모형의 성능이 대폭 향상되었다. 학습 자료의 R2는 0.84로 학습 데이터의 변동성을 84% 설명하며, 검증 자료와 테스트 자료의 R2는 동일하게 0.69로 수렴하였다. 이는 모형이 검증 자료와 테스트 자료에서도 학습 자료와 유사한 수준의 설명력을 유지했음을 시사한다.
테스트 자료에 대한 혼동 행렬의 결과, TP, FP, FN, TN는 각각 22,884, 2,890, 89,798, 3,500으로 나타났다(Fig. 4(a)). 이를 활용해 계산된 모형의 precision, recall, accuracy는 각각 88.78%, 86.73%, 97.84%였으며, F1 점수는 87.74이었다(Fig. 4(b)). 이는 XGBoost 모형이 하천습지로 예측한 픽셀 중 약 89%가 실제로 하천습지였으며, 실제 하천습지를 약 87%의 비율로 정확히 찾아냈음을 의미한다. 특히 정확도가 97% 이상으로 나타나 전체 예측 중 하천습지(1)와 비하천습지(0)를 올바르게 분류한 비율이 크다는 것을 보여준다. F1 점수 87.74는 모형이 하천습지(1)와 비하천습지(0)를 비교적 균형 있게 예측하였음을 알 수 있다. 한편, Optuna 프레임워크를 통해 하이퍼파라미터 eta, gamma, max depth, subsample, min child weight는 각각 0.2998, 0.2092, 15, 0.9676, 1으로 최적화되었다.
4.2 하천습지 대체습지 후보지 선정 결과 분석
본 연구에서 구축한 XGBoost 모형에 2023년 1월부터 12월까지의 월별 원격탐사 및 재분석자료를 평균한 연간 대표자료를 적용한 결과는 Fig. 5와 같다. 빨간색으로 표시된 지역은 모두 기존 하천습지와 99% 이상의 유사도를 보이는 지역을 나타낸 것으로, 하천습지의 대체습지가 조성 시 우선적으로 고려되기에 적합한 지역이다. 분석 결과, 학습 자료로 활용하지 않은 지역 중에 하천습지로 판별된 픽셀들이 존재하며, 하천습지(1)로 판별된 픽셀 수는 총 451,373개로, 이는 한반도 전체 픽셀(37,514,112개)의 약 1.2%에 해당한다. 우리나라 주요 산맥을 피하여 하천 주변의 저지대 및 평탄한 지역을 중심으로 분포하는 경향을 보였다. 또한, 하천습지가 가지는 고유한 특성인 지류가 모의되었음을 확인할 수 있었다.
한편, 모형 결과로 도출된 모든 지역을 검증하기에는 자원의 한계가 존재하였다. 또한, 본 연구에서 다루는 대체습지는 아직 습지로 공식적으로 지정되지 않은 지역을 대상으로 하므로, 하천습지에 대한 기존 조사 자료가 부족하였다. 이에 따라, 모형에 의해 하천습지로 분류된 지역 중 무작위로 5곳을 선정하여, 해당 지역의 수역, 지형, 수원 등 습지 생태계 형성의 기본 요소를 중심으로 하천습지로 분류된 것이 타당한지를 검토하였다. 아울러, 생태계의 공간적 근접성이 유사한 환경 형성과 밀접한 관련이 있다는 기존 연구(Valcu and Kempenaers, 2010; Soininen et al., 2007)를 바탕으로, 국가 습지 인벤토리에 등록된 하천습지와의 공간적 거리를 함께 분석하였다.
본 연구 결과에 대한 지엽적인 분석을 위해 모형의 결과 중 하천습지로 분류된 지역 중 무작위로 선정한 5곳은 Fig. 6에 나타나 있다. 첫 번째 후보지는 여주 부근이다(Fig. 6(a)). 해당 지역은 한강이 유입되는 지역으로, 각각 여주 북쪽과 느습봉 근처에서 복하천과 양화천이라는 주요 지류로 나누어진다. 복하천 상류에는 복대습지가, 하류에는 흥천교습지가 위치하고, 두 습지 간의 거리는 약 1,600 m이다. 양화천에는 양화천하류습지, 율극교습지, 구양3교습지가 일정 간격을 두고 존재하여 같은 강을 공유하는 연속성 있는 습지 체계로 볼 수 있다.
두 번째로 살펴본 후보지는 선산읍 부근으로(Fig. 6(b)), 낙동강에서 파생된 감천이 흐르는 지역이다. 감천에는 하천습지인 황산리하도습지, 강호습지, 신촌리하도습지가 순서대로 위치하고 있으며, 선산읍 부근의 낙동강에는 하천습지인 월곡리하도습지, 관심리하도습지 및 해평습지가 순서대로 위치하고 있다. 월곡리하도습지와 관심리하도습지 사이의 직선거리는 약 250 m이고, 관심리하도습지와 해평습지 사이의 직선거리는 약 1,200 m로 연속성 있는 생태계로 간주할 수 있다.
세 번째로 살펴본 지역은 용담호 주변이다(Fig. 6(c)). 해당 위치에는 금강이 주수원인 용담호가 형성되어 있으며, 가로, 세로 길이는 약 10 km, 17 km인 대규모 수역이 위치하고 있다. 해당 지역은 크게 다섯 갈래(좌상단, 우상단, 좌측, 좌하단, 우하단)의 하천으로 나누어진다. 후보지의 중심지와 가장 가까운 습지인 원월평습지는 약 5 km 떨어져 있지만, 후보지 중심 10 km 내에 와룡교습지 및 원월평습지를 비롯한 15개의 하천습지가 위치한다는 측면에서 유사한 생태계가 형성되어 있을 가능성이 크다.
네 번째로 살펴본 지역은 강원도의 소양호 일대이다(Fig. 6(d)). 소양호는 1973년 소양강을 막아 만든 댐이다. 해당 후보지의 좌측 끝단에는 하천습지인 율원리습지가 접하고 있고, 후보지의 우측 끝단에는 하천습지인 인제38대교습지와 부평리습지가 접하고 있다. 이 중 인제38대교습지와 부평리습지의 직선거리는 약 1,650 m 이다. 해당 후보지에는 총 가로 길이는 약 32 km이며, 세로 길이는 약 20 km에 달하는 지류가 형성되어 있다.
마지막으로 살펴볼 지역은 파로호 주변이다(Fig. 6(e)). 파로호는 북한강이 상류에 화천댐이 건설되면서 생긴 호수로, 북한강을 주수원으로 한다. 해당 지역 주변에는 두류봉과 성주봉을 비롯한 다양한 산봉우리가 있어 복잡한 지류가 나타나며, 이로 인해 어류를 비롯한 풍부한 수생태계가 형성되어 있다. 해당 후보지의 좌측에는 하천습지인 어룡동습지, 장거습지, 붕어섬습지가 위치해 있으며, 이 중 장거습지와 붕어섬습지의 거리는 약 245 m로 생태계의 유사도가 큰 것으로 파악될 수 있다.

Fig. 6.
Comparison between the predicted river wetland replacement sites marked in red (left) and the corresponding satellite images (right) for five locations; (a) near Yeoju, Gyeonggi-do, (b) near Seonsan-eup, Gumi-si, Gyeongsangbuk-do, (c) near Yongdam Lake, (d) near Soyang Lake and (e) near Paro Lake
5. 결 론
본 연구에서는 원격탐사자료와 재분석자료를 활용하여 하천습지가 형성될 수 있는 잠재적 후보지인 대체습지를 탐색하는 XGBoost 모형 기반 방법론을 제안하였다. 원격탐사 및 재분석자료를 모형의 입력자료로 활용하여 다양한 지역 및 시기의 데이터 적용을 위한 기반을 마련하였다. 이를 통해 획득한 수문·기상, 식생, 탄소 관련 인자 총 13가지를 사용하여 습지 생태계를 다각적으로 고려하고자 하였다. 먼저, 환경부에서 제작한 2017년과 2022년 전국 내륙습지 인벤토리 자료를 활용하여 학습 기간 동안 유지된 하천습지 중 면적이 넓은 10곳을 선정하였다. 이후, 해당 위치의 원격탐사 및 재분석자료를 추출하여 XGBoost 모형의 학습에 활용하였다. 학습이 완료된 모형에 2023년 전국 평균 자료를 적용하였다. 모형의 결과는 수문·기상, 식생, 탄소의 측면에서 기존 하천습지와 높은 유사도를 가지는 픽셀의 도출이며, 해당 지역은 하천습지의 대체습지를 조성할 때 우선적으로 고려할 수 있는 지역이다.
모형의 학습은 초기 약 150회 동안 빠른 성능 향상이 이루어졌으며, 학습 자료와 검증 자료의 RMSE와 R2 모두 수렴하는 양상을 보였으며, 테스트 자료의 RMSE와 R2는 각각 0.23와 0.69을 기록하였다. 혼동 행렬을 통해 계산된 모형의 정밀도, 재현율, 정확도는 각각 88.78%, 86.73%, 97.84%였으며, F1 점수는 87.74이었다. 구축된 모형에 2023년 전국 평균 자료를 적용한 결과, 한반도 면적의 1.2%에 달하는 451,373개의 픽셀이 99% 이상의 확률로 하천습지로 분류되었다. 자원의 한계로 인해 모형의 결과로 도출된 모든 지역을 확인할 수 없으므로, 후보지 5곳을 무작위로 선정하여, 보다 지엽적인 분석을 진행하였다. 분석이 진행된 지역 5곳(여주, 선산읍, 용담호, 소양호, 파로호 주변) 모두에서 지류 형성을 비롯하여 하천습지로 판별되기 적절함을 확인할 수 있었다.
본 연구에서 제안한 XGBoost 기반 모형을 통해 하천습지로 분류된 지역들은 기존 하천습지와의 근접성 및 연속성을 지니고 있어 생태계의 확장 가능성을 확인할 수 있었다. 그러나 본 연구의 결과는 대체습지 후보지를 도출하기 위한 잠재적 가능성을 제시하는 데 초점을 맞추고 있으며, 해당 지역이 실제로 하천습지로 적합한지에 대한 명확한 검증은 추가적인 연구가 필요하다. 항공사진 및 문서 자료를 활용한 검증은 후보지의 초기 평가에 유용했으나, 생태학적, 수리학적, 그리고 토양학적 요소를 포함한 정량적 통계 분석이 부족하다는 한계가 있다. 따라서 향후 연구에서는 후보지의 물리적, 생태적 특성을 보다 정밀하게 분석하고, 장기적인 모니터링 데이터를 활용하여 대체습지의 형성 가능성을 심층적으로 평가할 필요가 있다.
본 연구에서 구축한 모형은 원격탐사 및 재분석자료와 같은 픽셀 기반 자료를 가용한다는 측면에서 효율적인 현장 조사를 위한 사전 조사에 의의가 있으며, XGBoost와 같은 머신러닝의 활용이 습지 보전을 위한 주요 접근 방식 중 하나가 될 수 있다는 점을 시사하였다. 특히, 국내 내륙습지 중 가장 큰 비율을 차지하는 하천습지의 대체습지 후보지를 탐색한다는 점에서 효율적인 국내 내륙습지 보전에 기여할 수 있다. 본 연구의 한계인 원격탐사 및 재분석자료의 획일적인 변환을 개선하고, 추가적인 머신러닝 및 딥러닝 모형을 활용하면 자료의 특성을 강화할 수 있을 것으로 판단된다. 이러한 점들을 보완하여 연구를 확장할 시, 높은 시·공간 해상도의 습지 생태계 모니터링을 통해 하천습지 생태계의 변동을 신속하게 인식할 수 있을 것이다. 또한, 본 연구를 통해 구축한 모형 및 결과로 제시된 잠재적인 하천습지 대체습지 후보지 선정은 개발과 환경 보존 간의 균형 확립에 기여할 수 있을 것으로 사료된다.
결론적으로, 본 연구는 하천습지 대체습지 후보지 선정에 있어 데이터 기반 접근법의 가능성을 제시하였으며, 이는 향후 하천습지 보전 및 복원 전략 수립에 기초 자료로 활용될 수 있을 것이다. 그러나 본 연구를 통해 도출된 하천습지의 대체습지 후보지가 실제로 적합한지에 대한 평가는 생태적·환경적 측면을 포함한 다양한 습지의 특성을 종합적으로 고려하여 검증되어야 한다.







