1. 서 론
2. 연구방법 및 데이터
2.1 CNN 기반 도시침수 공간분포 예측 모형
2.2 적용 유역 및 데이터
2.3 침수 모의 성능 평가 기준
3. 결과 및 분석
3.1 딥러닝 침수 해석 결과 비교
3.2 딥러닝 모형의 강수 시계열 범위 민감도 분석
3.3 연산시간 비교 분석
4. 결 론
1. 서 론
기후변화가 가속화됨에 따라 집중 호우로 인한 도심 지역에서의 침수 피해가 증가하고 있다. 또한, 개발로 인한 투수성 토지 피복의 감소는 유출 증가 등 수문 순환을 변화시켜 도시를 침수에 더 취약하게 만든다. 도시에서의 침수는 빠르게 발생하고 전파되어 대규모 인명 피해와 경제적 손실을 초래할 수 있어 신속하고 정확한 예측이 중요하다. 도시에서의 침수 위험 공간정보를 생성하기 위해서는 천수 방정식(Shallow Water Equations, SWE) 등 홍수파 지배 방정식을 도시 지형 정보와 연계하여 수치 해석하는 물리과정 기반 방법론이 주로 활용된다(Noh et al., 2019; Lee et al., 2016). 다만, 이러한 물리과정 모형은 공간 해상도가 증가할수록 모의 격자 수가 공간 해상도의 제곱에 비례하여 늘어나고, Courant-Friedrichs- Lewy 조건 등의 제약으로 인해 더 작은 계산 시간 간격 적용이 필요하기 때문에 병렬연산 기술의 향상에도 불구하고 고해상도 침수 해석에 많은 컴퓨터 자원과 계산시간이 소요되는 한계가 있다(Choi et al., 2023b).
최근 데이터 및 인공지능 과학의 발전에 힘입어 딥러닝(Deep Learning, DL) 기술의 홍수 예측분야 적용이 늘어나고 있다. 딥러닝 모형은 물리 과정과 수문 변수 간의 상호작용을 모의하지 않고 데이터에 기반하여 모형을 구축하기 때문에 물리과정 기반 모형에 비해 연산 시간 단축이 가능하다는 장점이 있다. 수문 정보의 시공간적 특징을 추출하고 홍수의 면적 또는 홍수위를 예측하기 위해 활용되는 인공지능 기술에는 인공신경망(Artificial Neural Network, ANN)(Zhu et al., 2021; Berkhahn et al., 2019), 합성곱신경망(Convolutional Neural Network, CNN)(Guo et al., 2021; Seleem et al., 2023) 장단기신경망(Long Short-Term Memory, LSTM)(Zhang et al., 2023; Zhou et al., 2023, 2021), 생성적 적대 신경망(Generative Adversarial Networks, GAN) 등의 모형들을 활용한 연구들이 수행되었다. 예를 들어, Nearing et al. (2024)은 개발도상국 등 유량 관측 정보가 부족한 지역에 적용 가능한 LSTM 기반 인공모형을 개발하고 선행예측기간 7일의 일 단위 유량 예측을 수행하고 적용성을 평가하였다. Latt and Wittenberg, (2014)은 과거 수위와 강우량을 사용하여 특정 위치의 하천 수위와 유량을 예측하는 단계적 다중 선형 회귀(Stepwise Multiple Linear Regression, SMLR) 모형과 인공신경망(ANN) 모형을 개발하고 성능을 평가하였으며. 이외에도 딥러닝 모형을 활용한 관측 자료 기반의 지점 시계열 예측 연구가 다양하게 수행되었다(Samantaray et al., 2023; Tsakiri et al., 2018; Wei, 2020). Zhou et al. (2021)은 공간 상관관계를 활용하여 모형에서 침수된 위치를 식별하여 계산 비용을 줄이는 공간 축소 및 재구성(Spatial Reduction and Reconstruction, SRR) 접근 방법과 식별된 위치에서의 수위를 모의하는 딥러닝(DL) 모형인 장단기신경망(LSTM)을 결합한 SRR-DL 프레임워크를 개발하였으며, 300만 개 이상의 대규모 격자로 구성된 지역에서 대해 빠르게 하천 범람 홍수 모의가 가능함을 확인하였다. Kabir et al. (2020)은 합성 수위 곡선과 2차원 물리과정 기반 모형의 모의 결과를 이용하여 하천 범람 지도를 신속하게 생성하기 위한 CNN 모형을 개발하였으며, 서포트 벡터 회귀(Support Vector Regression, SVR) 모형과 비교하여 CNN 모형의 성능이 더 뛰어남을 확인하였다. Hosseiny (2021)은 하천의 지형과 홍수 범위를 식별하고 하천의 홍수 수심을 예측할 수 있는 CNN 기반의 U-Net River을 개발하여 홍수 지역의 하천 형태와 침수 영역을 자동으로 식별할 수 있었다. Schmid and Leandro (2023)은 하천 범람 시 최대 홍수 범위를 예측하기 위해 CNN모형과 각 격자까지의 거리를 고려하는 특징 정보 기반 레이어(feature-informed dense layers)를 결합한 자료 기반 홍수 침수 예측 시스템(Feature-informed data-driven Forecast System, FFS)을 제안하고 지형 데이터의 입력 없이 하천으로부터 떨어진 거리만을 사용하여 최대 홍수 범위를 예측하였다. 이처럼 하천 범람 예측에 대해 딥러닝 기법의 적용이 활발히 연구되고 있으며, 최근에는 도시 지역의 내수침수 예측을 위한 연구도 진행되고 있다. Löwe et al. (2021)은 지형 자료를 입력으로 사용하여 훈련되지 않은 강우 사건과 위치에서의 침수 지도를 예측하는 U-net 기반의 U-FLOOD를 제안하였으며, Hofmann and Schüttrumpf (2021)은 이미지 변환 방식을 기반으로 하는 floodGAN 모형을 개발하고, 공간 분포를 가지는 강수 이미지를 변환하여 최대 침수 범위와 수심을 예측했다. Burrichter et al. (2023)은 강수로 인한 침수 지도를 예측하기 위해 인코더-디코더 신경망(Encoder-Decoder Networks), 그래프 신경망(Graph Neural Networks), 생성적 적대 신경망(GAN) 등 다양한 딥러닝 모형을 결합하였으며, T-GCN (Temporal Graph Convolutional Network) 모형이 가장 우수한 성능을 보이는 것을 확인하였다. 또한, Xu and Gao (2024)은 해안 도시의 복합적 홍수 위험을 예측하기 위해 폭풍해일, 강우, 배수 유출을 고려하여 LSTM과 CNN을 결합한 하이브리드 모형을 개발하고 적용성을 확인하는 등 딥러닝 모형은 다양한 침수 유형에 대해 적용되고 있다. 이와 같이 국외에서는 여러 가지 모형들을 결합하여 더 뛰어난 성능의 모형을 구축하거나, 훈련되지 않은 유역에도 사용할 수 있는 일반화된 예측 모형을 구축하는 등 딥러닝 기반 홍수 예측 모형의 정확성과 효율성을 향상시키기 위한 연구가 많이 이루어지고 있다.
국내에서는 주로 딥러닝 기반 모형을 적용하여 하천의 홍수위를 예측하는 연구가 수행되었다(Jung et al., 2021, 2018; Park, 2024). 홍수의 공간분포 해석에 관한 연구로는 Kim et al. (2019)은 ANN 모형인 SVNARX (Second Verification Algorithm of Nonlinear Auto-Regressive)와 SOFM (Self-Organizing Feature Map)를 활용하여 홍수 지도를 예측하는 방법을 제안하였으며, Kim et al. (2020)은 LSTM 모형과 로지스틱 회귀 모형을 연계하여 복잡한 배수체계를 가지는 도시유역의 유출 곡선과 침수 범위를 예측할 수 있는 기법을 제시하고, 강남 유역에 대해 검증하였다. 다만, 기존의 연구들은 주로 하천 범람 영향 해석이나 관측 자료 기반의 지점 시계열 예측 연구가 중점적으로 수행되어 도시침수 공간분포 해석 기술에 관한 연구는 상대적으로 부족한 실정이다.
본 연구의 목적은 물리과정 기반 모형의 도시침수 공간분포 해석 결과를 신속하게 모사할 수 있는 CNN 기반 딥러닝 모형을 개발하고 적용성을 평가하는 것이다. 이를 위해 물리과정 기반 셀룰러 오토마타(cellular automata) 모형인 CADDIES- WCA2D (Cellular Automata Dual-DraInagE Simulation- Weighted Cellular Automata 2D, 이하 CADDIES)의 모의자료를 기반으로 딥러닝 모형을 구축하고, 과거 침수사상에 대한 물리과정 기반 모형 대비 딥러닝 모형의 재현성을 이진 평가 지수 및 평균 제곱근 오차 등의 정량 지표로 평가한다. 연구 대상 지역은 부산 온천천 유역으로, CADDIES 모형의 다양한 가상 강수 시나리오에 대해 10 m 공간해상도로 구축된 침수 해석 정보로 CNN 딥러닝 모형을 훈련하고, 2014년과 2020년 강수 사상에 대한 딥러닝 모형의 침수 사상 재현 능력을 평가한다. 또한, 강수 시계열 윈도우 설정이 CNN 딥러닝 도시침수 모형의 정확도에 미치는 영향을 분석한다. 제안된 CNN 기반 도시침수 공간분포 예측 모형구축 방법은 Fig. 1과 같다. 논문의 구성은 2장에서 연구 방법과 자료를, 3장에서는 모의의 결과에 대한 분석을, 마지막 4장에서는 결론에 대해 논의한다.
2. 연구방법 및 데이터
2.1 CNN 기반 도시침수 공간분포 예측 모형
본 연구의 CNN 기반 도시침수 공간분포 예측 모형의 구조는 크게 두 가지 단계로 구성된다. 첫 번째로 딥러닝 모형에 적용할 데이터 세트 구축을 위하여 물리과정 모형을 이용해 침수심과 침수 범위를 포함하는 침수 정보를 생산한다. 물리과정 모형의 입력에는 합성 및 과거 강우 시나리오와 유역의 지형 데이터를 입력으로 하여 모의를 수행하였다. 다음으로, 강수 정보를 입력으로 받아 침수 정보를 출력하는 딥러닝 모형을 훈련하고, 하이퍼 매개변수를 최적화하였다. 훈련된 딥러닝 모형은 물리과정 기반 모형의 모의 결과와 비교하여 성능을 평가하였다.
침수 정보를 생산하기 위한 물리 모형으로는 셀룰러 오토마타 기반 2차원 도시침수 해석모형인 CADDIES 모형의 WCA2D 버전(Guidolin et al., 2016)을 적용하였다. CADDIES 모형은 비교적 빠른 연산이 가능한 격자 기반 수치 계산법인 셀룰러 오토마타 알고리즘 기반의 2차원 홍수 모형으로, 관성 및 운동량 보존항을 고려하지 않는 확산파 모형(diffusive wave model)이다. 각 격자는 지형, 지표 특성 정보를 포함하며, 인접 격자와의 상호작용을 통해 다음 격자로 물이 이동하고 분배된다. 중앙 격자와 이웃 격자 사이에서 이동하는 물의 양은 Manning 방정식과 임계 유동 방정식을 활용하여 제한되며, 중앙 격자에서 이동하는 물의 비율(부피)은 가중치 기반 시스템을 이용하여 계산한다는 특징이 있다. CADDIES 모형은 본 연구의 대상유역인 온천천 등 국내 유역에 대해 적용성이 검증된 바 있다(Choi et al., 2023a; Lee et al., 2024). 본 연구에서는 확률 강우량 기반 가상 강수 시나리오에 대해 CADDIES 모형으로 모의하여 딥러닝 모형의 훈련을 위한 침수모의 훈련정보를 구축하였다.
도시침수 해석 CNN딥러닝 모형은 1D-CNN 기술을 적용하였는데, 1D-CNN은 합성곱을 위한 커널(kernel)과 데이터의 시퀀스(sequence)가 1차원 형태로 변환되어 합성곱 연산을 수행하는 방식이다. 기존의 홍수 범람 해석 딥러닝 모형에서는 하천 상류단 유입량 시계열과 하천 범람 모의 결과를 활용하였으나(Kabir et al., 2020), 본 연구에서는 유역 면적 평균 강수량 시계열과 내수 범람 모의 결과를 CNN 모형의 훈련 데이터로 사용하였다. 구축된 CNN모형(Fig. 2)은 입력 층을 사용하여 학습 데이터의 시계열 길이와 특성의 개수를 입력받은 후 각각 32개와 128개의 필터를 갖는 두 개의 합성곱 층(convolutional layer)을 통해 고차원 특성을 추출하고, 각 합성곱 층 뒤에는 배치 정규화(batch normalization)를 적용하여 입력 데이터의 분포를 정규화한다. 배치 정규화는 내부 공변량 변화(internal covariate shift)를 줄이고 학습 속도를 향상시켜 과적합을 방지하는 데 도움을 주는 것으로 알려져 있다(Yamashita et al., 2018). 합성곱 레이어를 통해 추출된 특성 지도는 평탄화 층(flatten layer)을 통해 일차원 벡터로 변환되며, 이 후 밀집 층(dense layer)을 통해 학습된다. 밀집 층은 각각 32개, 256개, 512개의 필터를 사용하였으며, 각 층 사이에는 과적합을 방지하기 위해 드롭아웃(dropout)을 적용하였다. 마지막으로 밀집 층에서 예측 값이 출력되는데, 모형의 활성화 함수로는 ReLU (Rectified Linear Unit), 최적화 알고리즘으로는Adam (Adaptive Moment Estimation)을 사용하였다. 손실함수로는 평균제곱오차(Mean Squared Error, MSE)를 적용하였으며, 최대 100 에포크(epoch)동안 훈련을 수행하였다. 또한, 훈련 데이터 세트가 상대적으로 많지 않음을 고려하여 MSE가 10 에포크 동안 개선되지 않을 때 훈련을 종료하도록 조기 중지(early stopping) 옵션을 적용하였다. Fig. 3는 CNN 모형의 훈련 과정에 따른 MSE 손실함수 변화 그래프이다. 훈련 과정에서 발생하는 손실 값이 모형의 훈련이 반복됨에 따라 일정 값으로 낮아지며, MSE 값이 10 에포크 동안 개선되지 않아 에포크 100번이 되기 전 모형 훈련이 조기 중지되는 것을 확인할 수 있다.
또한, 강수량의 시간 변동성이 미치는 영향을 평가하여 최적 딥러닝 모형을 구성하기 위해 모의 시 과거 강수 정보의 활용범위(강수 윈도우)를 하이퍼 매개변수로 설정하여 민감도 분석을 수행하였다(3.2 절 참조). 민감도 분석을 통해 각 강수 사상에 적합한 윈도우를 선택하여 적용하였다.
2.2 적용 유역 및 데이터
본 연구에서는 부산광역시에 위치한 온천천 유역을 연구 대상 지역으로 선정하였다. 온천천은 수영강의 제1지류로 유역 면적 56.28 km2에 유로 연장 14.13 km, 하폭 30~90 m의 하천이다. 온천천 중상류의 하상경사는 약 1/40~1/520로 비교적 경사가 급하고 하류부는 약 1/840~1/1,000로 평탄하여 집중호우시 하류부에 위치한 연제구에서 주로 내수 및 외수 침수피해가 발생한다(Busan, 2004). 온천천 유역은 도심지가 발달하여 불투수 면적이 넓고, 이상 호우 시 하천 범람으로 인한 외수 범람(fluvial flooding)과 우수배제 시설의 통수능 용량 부족으로 인한 내수 침수(pluvial flooding)가 복합적으로 나타나는 특성을 가지고 있어 침수 피해가 크다. 본 연구에서 선정한 강수 사상이 발생한 연도의 피해 사례는 다음과 같다. 2014년에 발생한 집중호우는 시간당 최대 130 mm의 폭우가 발생하여, 사망 5명, 부상 5명, 실종 1명의 인명피해와 이재민 200여 명, 산사태 5곳, 주택 1,253개소 침수, 도로 유실·파손 56건, 농경지 침수 235 ha 등이 발생하였다(YNA, 2014; TKD, 2014). 2020년에는 부산 지역에 시간당 최대 80 mm 이상의 호우가 발생하여 온천천의 세병교, 연안교, 수연교 하부도로가 침수되어 통제되었으며, 초량 지하차도에서 3명이 숨지고 4명이 부상을 입었다(BI, 2020; N1, 2020). 2006년, 2009년, 2017년, 2021년, 2023년에도 온천천 유역은 저지대를 중심으로 침수 피해가 반복되고 있다(Fig. 4).
물리과정 기반 모형의 모의를 위한 지형 입력자료로 온천천 유역의 10 m 공간 해상도의 DSM (Digital Surface Model)을 사용하였다(Fig. 5). 본 연구에서 사용한 DSM은 등고선 수치지도로부터 추출된 도시 지역 지형의 높낮이뿐만 아니라 건물 등과 같은 인공구조물, 하천 지형을 실제와 유사하게 구성하기 위해 하천 단면 측량자료와 도로망 자료를 반영하였다. 온천천 유역의 10 m 공간 해상도에 대해 Son et al. (2010)은 내수침수 위험도 분석을 위해SWMM 모형을 구축하고 실제침수 구역과 모형의 결과를 비교 분석하여 타당성을 입증한 바 있으며, Choi et al. (2023a)는 과거 도시침수 사상을 CADDIES 모형으로 재현하고 침수 흔적도와 비교하여 유사하게 재현됨을 확인한 바 있다.
딥러닝 모형의 훈련 입력자료를 구축하기 위해 국가수자원관리종합정보시스템(WAMIS, http://www.wamis.go.kr/)에서 제공하는 온천천 유역이 포함된 부산 지역의 2년, 3년, 5년, 10년, 20년, 50년, 100년, 200년 빈도 확률 강수량(지속시간 17시간) 데이터를 사용하여 합성 강수 시나리오를 생성하였다. 강수량의 시간 분포는 정규분포를 따르는 시계열 그래프를 생성하였다(Wang et al., 2018). 생성된 합성 강수 시나리오는 추후 검증에 사용할 실제 강수 사상과 동일한 지속시간 17시간일 경우에 대해 1시간 간격으로 구성하였다(Fig. 6(a)). 본 고에 포함하지 않았으나 사전 검토 단계에서 정규분포 이외에 다양한 형태의 시간분포로 물리 모형을 모의하고 딥러닝 모형을 훈련한 바 있으나, 합성 강수 시나리오의 시간분포가 딥러닝 모형 성능에 큰 영향을 미치지 않았다. 대상유역에서 침수 피해가 발생하였던 과거 2014년과 2020년의 강수 사상을 선정하여 딥러닝 모형의 검증을 수행하였다. 강수 관측 자료는 기상청 기상자료개방포털(https://data.kma.go.kr/cmmn/main.do)에서 제공하는 온천천 인근 유역 방재기상관측(AWS) 지점인 금정구, 동래구 관측소의 1시간 간격 지점 우량 관측자료를 Thiessen 기법으로 면적 평균하여 유역 평균 강수량을 구축하고, 이에 대한 물리 모형의 침수 모의 결과를 딥러닝 모형 검증의 비교대상 자료로 활용하였다. 모형의 검증을 위해 선정된 강수 사상은2014년 8월 25일 07:00 ~ 2014년 8월 25일 23:00와 2020년 7월 23일 14:00~2020년 7월 24일 06:00이며 Thiessen 기법으로 생성한 1시간 단위의 면적평균 강수시계열은 Figs. 6(b) and 6(c)와 같다.
2.3 침수 모의 성능 평가 기준
2.3.1 이진 분류 지수(binary classification measure)
CNN 모형의 침수 범위 재현성을 HR (Hit Rate), FAR (False Alarm Ratio), CSI (Critical Success Index) 등 세 가지의 이진 분류 지수(binary classification measure)로 평가하였다. 본 연구에서는 최대 침수심 격자에 대해 침수 여부를 판별하기 위해 수심 15 cm를 기준으로 초과인 경우 침수, 이하인 경우 비침수로 구분하였다. 영국 환경청(EA, 2013)은 수심이 15cm를 초과할 경우 일반적인 보도블록 높이를 넘어 도시 지역의 인프라에 영향을 줄 수 있다고 제시하였다. 또한, 해당 기준은 미국 본토에 대하여 2차원 홍수 모의 모형을 개발하고 검증하는데 사용된 바 있다(Wing et al., 2017). 국내의 경우 서울시는 시간당 55 mm 초과 또는 15분당 20 mm 초과, 도로수위계에서 침수심이 15 cm를 초과하는 경우 침수 예보를 발령한다(SMG, 2023). 경기도는 도로 바닥면으로부터 15 cm 이상 침수되었거나 침수가 예상되는 경우 지하차도로의 차량 진입을 통제하는 등(IMNEWS, 2024) 다양한 지자체에서 15 cm를 침수 여부를 판별하는 기준 수심으로 사용하고 있다. Table 1에서 은 CNN 모형에서 침수된 격자를 나타내며, 은 비교대상 모형(benchmark model)인 CADDIES 모형에서 침수로 분류된 격자를 나타낸다. 와 는 각 모형에서 침수되지 않았다고 분류된 격자를 의미한다(Table 1).
Table 1.
Inundated grid in a CNN model | Non-inundated grid in a CNN model | |
Inundated grid in benchmark (CADDIES) | (Hits) | (False alarms) |
Non-inundated grid in benchmark (CADDIES) | (Misses) |
HR은 CADDIES 모형에 대한 CNN 모형의 침수 면적 비율을 나타낸다. 식은 Eq. (1)과 같으며, 침수 위험을 과소 예측하는 모형의 경향을 알 수 있다. HR의 범위는 0부터 1까지이며, 1에 가까워질수록 CNN 모형의 침수 면적이 CADDIES 모형의 침수 면적과 일치함을 의미한다.
FAR은 CADDIES 모형에서 침수되지 않은 면적에 대해 CNN 모형에서 침수된 면적으로 구분한 비율을 나타낸다. 식은 Eq. (2)와 같으며, 모형의 과대 예측 침수 범위에 대한 평가 지표이다. 범위는 0에서 1까지이며, 0인 경우 거짓 경보가 없음을 의미한다.
CSI는 과대 및 과소 예측 모두 고려한 전체적인 예측 성능 지표로 식은 Eq. (3)과 같다. 범위는 0에서 1까지이며, 1인 경우 CADDIES 모형의 침수 면적이 CNN 모형의 침수 면적과 일치함을 의미한다.
2.3.2 RMSE
CNN 모형의 침수심 해석 정확도를 평가하기 위한 정량 비교 지표로 평균 제곱근 오차(Root Mean Square Error, RMSE)를 사용하였다. RSME는 모형의 예측 정확도를 평가하기 위해 사용되는 통계적 지표로, 모형의 예측 값과 실제 값 사이의 잔차의 제곱합을 산술평균한 값의 제곱근으로 정의되며, 식은 Eq. (4)와 같다.
은 전체 모의 격자 수이며, 는 관측 혹은 비교대상 모형, 는 모의결과이다. 본 연구에서는 는 CADDIES 모형의 최대 침수심, 는 CNN 모형으로 모의된 최대 침수심을 적용하였다.
3. 결과 및 분석
3.1 딥러닝 침수 해석 결과 비교
부산 온천천 유역에서 발생한 2014년과 2020년의 과거 강수 사상에 대해 딥러닝 기반 CNN 모형과 물리과정 기반 CADDIES 모형의 최대 침수심 모의 결과를 비교 및 분석하였다. 최대 침수심 모의 결과는 전체 모의 시간에 대해 시간 간격마다 각 격자에서 모의된 침수심이 최대일 때의 침수심을 표시하였다.
Fig. 7은 4개의 도심지 영역에 대한 CADDIES 모형과 CNN 모형의 최대 침수심 모의 결과이며, Fig. 8은 CADDIES 모형의 최대 침수 모의 결과를 기준 값으로 설정했을 때 CNN 모형의 Hits, False alarms, Misses의 분포를 나타낸 지도이다. Fig. 7에서 CNN 모형은 CADDIES 모형의 침수 양상을 유사하게 재현하였으며, 특히 도로나 저지대에서의 침수 공간분포가 비슷하였다. 다만, 구역별 분석에서, 구역 A에서는 2014년과 2020년 모두 침수 면적과 침수심이 다소 과대 추정되었는데, 이는 해당 구역이 주변에 비해 급격한 경사를 가지고 있으며, 내수 침수 및 온천천의 외수 범람이 함께 발생하여 예측하기 어려운 복합 침수 특성을 가지기 때문으로 분석된다. 구역 B와 D에서는 CNN 모형의 침수 범위와 침수심이 CADDIES 모형과 상대적으로 유사하게 재현되었다.
Fig. 8에서 2014년 강수 사상에 대해 CNN 모형은 전반적으로 대부분의 침수 구역에서 높은 Hits 를 보였으며, False alarm은 주로 침수 경계 부분에서 발생했다. Misses는 일부 구역에서만 발생했는데, 이는 CNN 모형이 침수가 발생했던 학습 조건에 대해 최적화되어 침수의 과소 추정이 상대적으로 적게 발생하는 것으로 판단된다. Fig. 8에서 세부 구역별로 비교하면 구역 B와 D에서는 Hits가 높았으며 도로와 저지대의 침수 양상을 흡사하게 재현하였다. 구역 A와 C에서는 대부분의 침수 면적은 정확히 모의되었으나 경계면에서 False alarms이 발생했다. 4개의 구역 모두에서 Misses는 거의 발생하지 않았다. 2020년 강수 사상에 대해서도 CNN 모형은 높은 Hits를 보였으며, 침수 경계 부분에서 일부 False alarms이 나타났다. 구역 C의 경우 2014년도에 비해 False alarms이 높아졌으나, C를 제외한 대부분의 구역에서는 2014년도와 전반적으로 유사한 양상을 보였다. 또한, 2014년도의 경우 2020년도보다 더 흡사한 결과를 보였는데, 이는 2020년도의 강수가 두 번의 첨두가 발생하는 강수분포를 가졌기 때문으로 분석된다. 구역 C의 경우 2020년 집중호우로 인해 실제로 내수 침수 피해를 입었던 지역으로, CNN 모형이 CADDIES 모형의 결과에 비해 침수 면적은 과대 추정되었지만, 최대 침수심은 유사하게 모의하였다.
CADDIES 모형에 대한 CNN 모형의 최대 침수 범위 재현성을 HR, FAR, CSI로 평가하였으며, 최대 침수심 재현성은 RMSE로 평가하였다(Table 2). 2014년 사상의 경우 HR이 0.98로 CADDIES 모형에서 침수된 공간영역에 대해 CNN 모형에서도 침수가 재현됨이 확인되었다. FAR는 0.12로 False alarms의 일부 발생이 확인되나, CSI는 0.85로 전반적인 재현 성능은 우수하였다. RMSE 값은 0.22 m로, 적정한 재현성 범위에 해당하지만 침수범위에 비해 침수심은 예측 정확도가 일부 제한적인 것으로 판단된다. 2020년 사상의 경우 HR은 0.93로 2014년에 비해서는 다소 낮지만, 여전히 높은 정확도를 보였다. 그러나 FAR의 경우 0.19로 증가하여 2020년 강수 사상에서 CNN 모형이 일부 과대 모의하는 경향이 있었다. CSI는 0.76, RMSE 값은 0.23 m로 2014년 사상에 비해 침수 면적에 대한 모의 능력은 다소 떨어지지만, 침수심에 대한 모의 정확도는 유사했다.
본 연구에서 CNN 모형은 CADDIES 모형과 비교하여 최대 침수심을 재현함에 있어 일부 과대 추정하는 경향을 보였다. 기존 딥러닝 모형을 사용한 홍수 모의 연구에서도 유사하게 과대평가 또는 과소평가되는 사례가 있었다(Kabir et al., 2020; Hofmann and Schüttrumpf, 2021; Liao et al., 2023). 이는 CNN 모형이 훈련 데이터에서 학습한 패턴을 일반화하여 새로운 데이터에 적용하는 과정에서 발생하는 것으로 추정된다. CNN 모형은 데이터 기반으로 작동하며 물리적 과정을 직접 연산하지 않기 때문에, 복잡한 지형이나 강우가 입력되었을 때 물리과정 모형의 결과를 모사하기에 한계가 있을 수 있다. 그러나, CNN 모형은 물리과정 기반 모형에 비해 계산 시간이 90% 정도 단축되어 실시간 침수 예측이 필요한 상황에서 침수 정보를 신속하게 생산할 수 있다는 장점이 있다. 본 연구에서 CNN 모형은 과대 추정되는 경향이 있지만 RMSE가 0.22~0.23 m로 비교적 낮아 전반적으로 양호한 성능을 보여주었다. 향후 연구에서는 이러한 점을 보완하여 물리적 과정을 잘 반영할 수 있게 하여 모형의 예측 정확도와 신뢰성을 향상시킬 필요가 있다.
3.2 딥러닝 모형의 강수 시계열 범위 민감도 분석
강수량의 시간 변동성이 미치는 영향을 평가하여 최적 CNN 모형을 구성하기 위해 모의 시 과거 강수 정보의 활용 범위 즉, 강수 윈도우를 하이퍼 매개변수로 설정하여 민감도 분석을 수행하였다. 강수 데이터가 1시간 단위로 총 17시간임을 고려하여, 강수 윈도우 크기를 2시간, 4시간, 6시간으로 나누어 모형의 성능을 비교하였다. 모의 실험의 일관성을 위하여 모형의 시드(seed)를 고정하였으며, 각 윈도우 크기에 대해 5번의 모의를 수행하여 평균값을 산출하였다.
Table 3은 2014년과 2020년의 강수 사건에 대한 모형의 강수 윈도우별 성능 평가 결과이다. 성능 평가로는 모형의 정량적 평가를 위해 사용하였던 HR, FAR, CSI, 그리고 RMSE를 사용하였다. 분석 결과, 강수 사상에 따라 최적 윈도우 크기가 상이하였다. 2014년의 경우, 윈도우가 6시간에서 FAR를 제외한 모든 지표에서 가장 우수한 성능을 보였다. 이 경우 HR이 0.98, CSI가 0.85로 가장 높았으며, RMSE는 0.22 m로 가장 낮았다. 반면, 2020년 사상에서는 윈도우가 2시간일 때 FAR와 RMSE지표에서 상대적으로 좋은 성능을 보였다. CSI 지표는 강수 윈도우가 2시간과 6시간인 경우 모두 0.76으로 동일했으나, 윈도우가 2시간인 경우의 RMSE 값이 0.23 m로 가장 낮았다.
Table 3.
Window size | ||||||
2014 | 2020 | |||||
2 hrs | 4 hrs | 6 hrs | 2 hrs | 4 hrs | 6 hrs | |
HR | 0.94 | 0.91 | 0.98 | 0.92 | 0.90 | 0.93 |
FAR | 0.15 | 0.12 | 0.14 | 0.19 | 0.21 | 0.19 |
CSI | 0.81 | 0.80 | 0.85 | 0.76 | 0.72 | 0.76 |
RMSE | 0.58 | 0.30 | 0.22 | 0.23 | 0.29 | 0.26 |
2014년의 경우 긴 시간의 강수 정보가 침수 해석에 유리했지만, 2020년은 상대적으로 짧은 시간의 강수 윈도우 만으로 딥러닝 모형을 구성하였을 때 침수 해석 성능이 향상되었다. 이러한 결과는 강수의 특성이 모형의 성능에 영향을 미치며, 딥러닝 기반 도시침수 공간분포 예측 모형의 성능 최적화를 위해서는 대상 지역의 강수 특성을 고려한 적절한 강수 윈도우 크기의 선정이 중요하다. 향후 연구에서는 다양한 강수 시공간 패턴에 대한 분석을 통해 일반화된 윈도우 크기 선정이 필요할 것으로 판단된다.
3.3 연산시간 비교 분석
CNN 모형과 CADDIES 모형의 계산 효율성을 2014년 총 17시간 동안의 강수 사상에 대해 비교 분석하였다(Table 4). CADDIES 모형은 Intel I7-1260p CPU, 32GB RAM, Intel Iris Xe Graphics GPU가 탑재된 개인용 컴퓨터에서 실행되었으며, CNN 모형은 클라우딩 컴퓨팅 엔진인 Google Colab Pro plus의 NVIDIA A100 GPU를 활용하여 수행되었다.
CADDIES 모형의 경우 CPU 기반의 멀티 코어 병렬 계산(parallel computing) 방식인 OpenMP 버전을 이용했을 때, 1개의 강수 사상에 대한 최대 침수심 모의 결과 생성에 12개의 CPU코어로 연산시 약 140 sec가 소요되었다. 반면, 단일 코어를 사용하는 순차 계산(sequential computing)의 경우에는 약 600 sec가 소요되었다. CADDIES 모형을 사용하여 훈련 데이터세트를 만드는데 걸리는 총 시간은 병렬 계산 시 약 1,400 sec, 순차 계산 시 약 6,000 sec가 소요되었다. CNN 모형의 경우, 확률 강수량으로 생성된 10개의 훈련 데이터 세트의 학습에 약 40 sec가 소요되었다. 학습 후 실제 강수 사상에 대한 최대 침수심 지도 생성에는 약 15 sec로 상대적으로 짧은 시간이 소요되었다. 분석 결과, CNN 모형의 계산 시간이 CADDIS 모형의 순차 계산 시간에 비해 97.5%, 병렬 계산 시간에 비해 89.29% 단축되었다. CADDIES 모형은 기존의 물리 모형보다도 빠른 계산이 가능한 모형이라는 점을 고려했을 때, 본 연구에서 제안한 딥러닝 기반 도시침수 공간분포 예측 모형은 실시간 침수 예측 및 다양한 강수 사상에 대한 신속한 침수 분석이 요구되는 상황에서 연산시간을 단축시킬 수 있을 것으로 판단된다.
4. 결 론
본 연구에서는 기존의 물리과정 기반 도시침수 모형의 모의 결과를 신속하게 모사할 수 있는 딥러닝 기반 도시침수 공간분포 예측 모형을 제안하고, 적용성을 평가하였다. 딥러닝 모형은 확률 강수량을 기반으로 하는 가상 강수 시나리오에 대한 물리 모형 CADDIES의 침수 정보로 훈련되었으며, 강수 입력 윈도우 크기에 따른 최적 성능을 비교하였다. 검증은 과거 온천천 유역에서 발생한 두 가지 강수 사상에 대해 실시하였으며, 딥러닝 모형의 최대 침수 모의 결과는 CADDIES 모의 결과와 비교하여 재현성을 평가하였다. 주요 연구 결과는 다음과 같다.
1.과거 강수 사상에 대한 정량적 평가 결과, 2014년 사상에 대해 HR 0.98, FAR 0.14, CSI 0.85, RMSE 0.22 m, 2020년 사상에 대해서 HR 0.92, FAR 0.19, CSI 0.76, RMSE 0.23 m의 값을 보였다. CNN 모형은 합성 강수 사상에 대한 물리 모형의 모의 자료로 구축되었지만, 실제 강수 사상의 최대 침수 공간범위를 효과적으로 재현하였다. Misses는 낮았지만, False alarms은 상대적으로 높게 나타나 침수 영역을 일부 과대 예측하는 경향이 있었다.
2.CNN 모형의 최적 성능을 위한 강수 윈도우 크기는 2014년 사상에서는 6시간, 2020년 사상에서는 2시간일 때가 가장 적합하였다. 딥러닝 기반 도시침수 공간분포 예측 모형의 성능 최적화를 위해서는 대상 지역의 강수 특성을 고려하여 적절한 강수 윈도우 크기를 선택해야 한다.
3.모형의 연산 속도 평가 결과(10 m 급 공간해상도 17시간 연속 모의 기준), CADDIES 모형은 순차 연산(단일 CPU 코어 적용)시 600 sec, 병렬 연산(12 CPU 코어 적용)시 140초 소요되었다. 반면, CNN 모형은 GPU 병렬연산시 15초가 소요되어 연산 시간이 물리모형의 순차 연산에 비해 약 98%, 병렬 연산에 비해 약 90% 단축되어 신속한 도시침수 위험 지도 산정이 가능하였다.
본 연구의 결과는 딥러닝 기반 도시침수 해석 모형이 합성 강수 사상의 물리모형 침수 정보의 훈련으로도 실제 과거 강수 사상에서 효과적으로 최대 침수심 및 범위를 재현할 수 있음을 보여준다. 기존의 물리과정 기반 모형과 비교하여 CNN 모형은 효과적으로 침수 사상을 재현 가능하면서도 빠른 계산 시간을 가져 실시간에 가까운 고해상도 침수 지도 생성 가능성이 확인되었다. 이러한 딥러닝 모형의 연산 효율성은 고해상도의 우수관거-지표면 연계 물리과정 기반 모형을 적용할수록 더욱 향상될 것으로 기대된다. 특히 다양한 강수 사상에 대한 신속한 침수 분석이 요구되는 상황에서 유용하게 활용될 수 있을 것으로 전망된다. 다만, CNN 모형은 유역의 형태나 강수의 양상에 따라 최대 침수 영역을 다소 과대 추정하는 경향이 있는데, 향후 연구에서는 복잡한 도시 지형이나 다양한 유형의 강수 사상에 대한 일반화 성능을 높이는 것이 필요할 것으로 판단된다.