Flow rate prediction at Paldang Bridge using deep learning models

Yeongjeong Seong; Kidoo Park; Younghun Jung

doi:10.3741/JKWRA.2022.55.8.565

Preview

Research Article

Journal of Korea Water Resources Association. 31 August 2022. 565-575
https://doi.org/10.3741/JKWRA.2022.55.8.565

Flow rate prediction at Paldang Bridge using deep learning models

딥러닝 모형을 이용한 팔당대교 지점에서의 유량 예측

Yeongjeong Seong^a

Kidoo Park^b^*

Younghun Jung^c

성 연정^a

박 기두^b^*

정 영훈^c

^aPh.D Candidate, Department of Advanced Science and Technology Convergence, Kyungpook National University, Sangju, Korea

^bResearch Professor, Emergency Management Institute, Kyungpook National University, Sangju, Korea

^cProfessor, Department of Advanced Science and Technology Convergence, Kyungpook National University, Sangju, Korea

^a경북대학교 미래과학기술융합학과 박사수료

^b경북대학교 재난대응전략연구소 연구교수

^c경북대학교 미래과학기술융합학과 교수

^{*Corresponding Author}

ABSTRACT

Recently, in the field of water resource engineering, interest in predicting time series water levels and flow rates using deep learning technology that has rapidly developed along with the Fourth Industrial Revolution is increasing. In addition, although water-level and flow-rate prediction have been performed using the Long Short-Term Memory (LSTM) model and Gated Recurrent Unit (GRU) model that can predict time-series data, the accuracy of flow-rate prediction in rivers with rapid temporal fluctuations was predicted to be very low compared to that of water-level prediction. In this study, the Paldang Bridge Station of the Han River, which has a large flow-rate fluctuation and little influence from tidal waves in the estuary, was selected. In addition, time-series data with large flow fluctuations were selected to collect water-level and flow-rate data for 2 years and 7 months, which are relatively short in data length, to be used as training and prediction data for the LSTM and GRU models. When learning time-series water levels with very high time fluctuation in two models, the predicted water-level results in both models secured appropriate accuracy compared to observation water levels, but when training rapidly temporal fluctuation flow rates directly in two models, the predicted flow rates deteriorated significantly. Therefore, in this study, in order to accurately predict the rapidly changing flow rate, the water-level data predicted by the two models could be used as input data for the rating curve to significantly improve the prediction accuracy of the flow rates. Finally, the results of this study are expected to be sufficiently used as the data of flood warning system in urban rivers where the observation length of hydrological data is not relatively long and the flow-rate changes rapidly.

Keywords

LSTM model

GRU model

Water-level prediction

Flow-rate prediction

Rating curve

Flood warning system

최근의 수자원공학 분야는 4차산업혁명과 더불어 비약적으로 발전된 딥러닝 기술을 활용한 시계열 수위 및 유량의 예측에 대한 관심이 높아지고 있다. 또한 시계열 자료의 예측이 가능한 LSTM 모형과 GRU 모형을 활용하여 수위 및 유량 예측을 수행하고 있지만 시간 변동성이 매우 큰 하천에서의 유량 예측 정확도는 수위 예측 정확도에 비해 낮게 예측되는 경향이 있다. 본 연구에서는 유량변동이 크고 하구에서의 조석의 영향이 거의 없는 한강의 팔당대교 관측소를 선택하였다. 또한, LSTM 모형과 GRU 모형의 입력 및 예측 자료로 활용될 유량변동이 큰 시계열 자료를 선택하였고 총 자료의 길이는 비교적 짧은 2년 7개월의 수위 자료 및 유량 자료를 수집하였다. 시간변동성이 큰 시계열 수위를 2개의 모형에서 학습할 경우, 2개의 모형 모두에서 예측되는 수위 결과는 관측 수위와 비교하여 적정한 정확도가 확보되었으나 변동성이 큰 유량 자료를 2개의 모형에서 직접 학습시킬 경우, 예측되는 유량 자료의 정확도는 악화되었다. 따라서, 본 연구에서는 급변하는 유량을 정확히 예측하기 위하여 2개 모형으로 예측된 수위 자료를 수위-유량관계곡선의 입력자료로 활용하여 유량의 예측 정확도를 크게 향상시킬 수 있었다. 마지막으로 본 연구성과는 수문자료의 별도 가공없이 관측 길이가 상대적으로 충분히 길지 않고 유출량이 급변하는 도시하천에서의 홍수예경보 자료로 충분히 활용할 수 있을 것으로 기대된다.

키워드

LSTM 모형

GRU 모형

수위 예측

유량 예측

수위-유량관계곡선

홍수예경보시스템

MAIN

1. 서 론
2. 연구 방법
2.1 딥러닝 모형
2.2 모형의 성능분석 지표
3. 대상하천 선정 및 자료 수집
3.1 대상하천
3.2 대상지점의 수문량 자료의 수집
4. 모형 및 수위-유량관계곡선
4.1 모형 구성 및 매개변수의 설정
4.2 대상관측지점의 수위-유량 관계곡선
5. 모형의 계산 결과
5.1 모형의 수위 및 유량의 직접 학습(training) 및 직접 예측(prediction) 결과
5.2 모형의 수위의 직접 학습 결과 및 수위-유량관계곡선을 활용한 유량 예측 결과
6. 결론 및 고찰

1. 서 론

최근에 Deep Learning (DL) 모형의 발달로 미래의 수문량 예측에 대한 다양한 연구가 국내·외에서 활발히 진행되고 있다. 2015년 이후, 4차 산업혁명의 시작과 더불어 영상분석 및 자연어 처리 분야에서 Deep Neural Network (DNN, 심층신경망) 모형의 예측 정확도가 획기적으로 향상되었다. 수문·수자원 분야의 연구에서도 DNN을 활용한 수문량 예측에 적극적으로 활용되기 시작했다(Tran and Song, 2017; Chen et al., 2013). 또한, 수문·수자원분야 중, 물관리 측면과 홍수저감 및 방재적 측면에서 DNN 모형에 대한 적용성 및 정확도에 대한 관심이 급증하고 있다. 기존에는 수공학 분야는 데이터기반의 데이터 모형을 활용하기 보다는 동수역학에 근거한 전산유체역학(Computational Fluid Dynamics, CFD) 기반 물리모형이 하천계획이나 방재측면에서 널리 사용되었으나 동수역학 물리모형의 계산속도의 한계성과 정확도 향상 측면에서 더 이상의 발전을 이루기 어려웠다.

수문량 분석 및 예측에 활용하기 위해서는 기존의 동수역학 물리모형을 대체할 수 있는 계산 속도와 예측 정확도 향상이 요구된다. DNN 모형은 그에 대한 효과적인 대안이 될 수 있으며, DNN 모형 중에서 시계열 자료의 예측에 효과적인 Recurrent Neural Network (RNN, 순환신경망) 모형은 널리 개발되어 적용되고 있으며, 모형의 성능은 꾸준히 향상되고 있다(Kumar et al., 2004; Zhang et al., 2019). 또한, RNN 모형과 별도로 기존에는 영상분석 알고리즘으로 사용되는 Convolutional Neural Network (CNN, 합성곱신경망) 모형도 시계열자료의 예측에 사용되고 있으나 CNN 모형의 경우, RNN 모형에 비해 시계열 예측 정확도는 높지 않아 제한적인 시계열 수문자료 알고리즘으로 활용될 수 있다(Park et al., 2020; Guo et al., 2021). 최근에는 널리 활용되고 있는 시계열자료의 특성을 적절히 고려한 RNN 모형으로서 Long Short-Term Memory (LSTM) 모형 및 Gated Recurrent Unit (GRU) 모형이 수문 시계열 예측에 효과적인 알고리즘으로 사용되고 있다(Mok et al., 2020; Park et al., 2020; 2022).

LSTM 및 GRU 모형의 경우, 이전의 데이터 모형인 ARIMA 모형과 Fuzzy 모형을 대체할 수 있는 높은 예측 정확도를 얻을 수 있었다(Zhang et al., 2018). 또한, 최근의 기후변화 및 도시화에 의한 급격한 하천의 유출량 증가로 도시홍수에 대응할 수 있는 홍수방어계획 수립에 대한 중앙정부 및 지방자치단체의 관심이 급증하고 있다. 따라서, 수문 시계열 자료의 예측 정확도가 충분히 확보가 된다면, 홍수예경보를 위한 도구로써 충분히 활용해 볼 수 있다. 수위 예측의 정확도 향상을 위한 본류와 지류의 배수효과를 고려한 지류의 정확한 수위예측에 대한 연구(Sung et al., 2017) 등이 수행되었다. 하지만, 대부분의 수문·수자원 분야의 RNN 모형의 경우, 지하수 수위 예측, 저수지 수위 예측 등과 같은 완만한 수위 변동에서는 ARIMA 모형과 Fuzzy 모형의 예측결과와 비교하여 높은 정확도의 예측이 가능하였다(Adamowski and Chan, 2011; Kisi et al., 2012; Hipni et al., 2013). 하지만 급변하는 유량 예측의 경우, 수위 예측 결과에 비해 정확도가 크게 저하되어 LSTM 모형과 GRU 모형을 활용한 직접 유량 예측 결과를 실무에서 활용하기에는 신뢰도가 높지 않다(Park et al., 2020). 따라서 급변하는 고유량에 대한 예측의 정확도를 향상시키 위해 RNN 모형의 선택, 모형의 구성, 시계열 자료의 단위학습길이(sequence length), 입력되는 학습자료와 예측자료의 비율과 길이에 대한 연구를 통해 정확도 향상에 대한 다양한 연구가 수행되었다(Jung et al., 2018; Park et al., 2020). 수문량 예측 성능을 비교·검토한 결과, 급변하는 유량과 수위의 적절한 정확도를 확보할 수 있는 수문 시계열 예측모형은 GRU 모형과 LSTM 모형이 적절한 것으로 평가되었다(Park et al., 2020; 2022).

본 연구의 가장 주목할 만한 큰 특징은 수집된 수문 원자료의 직접적인 가공없이 상대적으로 변동성의 크기가 작은 수위자료를 이용하여 변동성 크기가 상대적으로 큰 유량 예측의 정확도를 향상시키고자 하였다. 따라서, 본 연구의 목적은 급변하는 유량 예측을 위해 LSTM 모형과 GRU 모형에 의해 직접 예측된 유량의 정확도와 예측 수위 및 수위-유량관계곡선이 결합된 간접적인 유량 예측방법의 정확도 분석을 통해 유량의 예측정확도를 분석한다. 두가지 방법에 의한 유량 예측 정확도 분석을 통해 LSTM 모형과 GRU 모형의 예측 정확도가 높은 수위자료와 수위-유량관계곡선을 결합한 향상된 새로운 유량 예측방법을 본 연구를 통해 제안하고자 한다. 본 연구에서는 이미 한국수문조사연보를 통해 고시된 수위-유량관계곡선 자료를 활용한다는 측면에서 이전의 다양한 수문분야의 정확도 향상을 위한 RNN 모형의 알고리즘 연구와 입력자료에 대한 직접적인 처리없이도 고수위 유량에 대한 정확도를 향상시킬 수 있는 획기적인 방법으로 평가될 수 있다.

2. 연구 방법

2.1 딥러닝 모형

2.1.1 Long Short-Term Memory (LSTM) 모형

LSTM (장단기 기억) 모형(Hochreiter and Schmidhuber, 1997)은 RNN의 장기 의존성(long-term dependency)에 의한 장기 기억 손실 문제(long-term memory loss)를 개선한 RNN 계열의 데이터 모형이다. Fig. 1 및 Eqs. (1)~(6)에서 보는 바와 같이 LSTM 모형은 망각 게이트, 입력 게이트와 출력 게이트로 구성된다. LSTM 모형이 가지고 있는 셀 상태(cell state)는 다른 RNN 모형과 구별되는 대표적인 특징이다. Fig. 1의 상단에 위치하는 수평선은 간단한 선형 연산을 통해 전체 시계열자료를 관통하는 셀 상태라고 불린다. LSTM 모형은 셀 상태의 구조를 가지고 있기 때문에 시계열 자료는 기억 손실(memory loss) 없이 다음 시간 단계로 이전 단계의 정보가 전달된다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F1.jpg

Fig. 1.

Long Short-Term Memory (LSTM)

(1)

f_{t} = σ (W_{f} ∙ [h_{t - 1}, x_{t}] + b_{f})

(2)

i_{t} = σ (W_{i} ∙ [h_{t - 1}, x_{t}] + b_{i})

(3)

c_{t} = \tanh (W_{c} ∙ [h_{t - 1}, x_{t}] + b_{c})

(4)

c_{t} = f_{t} c_{t - 1} + i_{t} c_{t}

(5)

o_{t} = σ (W_{0} ∙ [h_{t - 1}, x_{t}] + b_{0})

(6)

h_{t} = o_{t} \tanh (c_{t})

여기서, f_t: 시간 t에서의 망각 게이트, i_t: 시간 t에서의 입력 게이트, o_t: 시간 t에서의 출력 게이트, h_t: 시간 t에서의 층, W_f: 망각 게이트에서 은닉층의 가중치, W_i: 입력 게이트에서 은닉층의 가중치, W₀: 출력 게이트에서 은닉층의 가중치, b_f: 망각 게이트의 편향값, b_i: 입력 게이트의 편향값, b₀: 출력 게이트의 편향값, $σ$ (∙): 활성화 함수, tanh (∙): tanh함수 , c_t_―1: 이전 시간 t ‒ 1에서의 셀 상태, c_t: 시간 t에서의 셀 상태.

2.1.2 Gated Recurrent Unit (GRU) 모형

GRU (게이트 순환장치) 모형(Cho et al., 2014)은 LSTM 모형과 동일하게 장기기억 손실 문제를 해소하지만 LSTM 모형에 비해 보다 더 단순한 구조(Fig. 2와 Eqs. (7)~(10))로 구성되어 계산 효율이 훨씬 뛰어나다. GRU 모형은 기존의 LSTM 모형에서 사용되는 셀 상태의 계산을 줄여 LSTM 모형이 가지고 있는 3개의 게이트를 단순화한 형태를 갖는다. Fig. 2에서 보는 바와 같이 입력 게이트와 망각 게이트가 1개의 업데이트 게이트로 단순화된다. 즉, GRU 모형은 업데이트 게이트와 리셋 게이트로 구성된다. 리셋 게이트는 과거자료를 재설정하고 활성화 함수를 이용하여 과거자료를 0과 1사이의 값으로 재설정하여 출력한다. 업데이트 게이트는 과거 및 현재 정보량에 대한 업데이트 속도를 결정하고 출력값은 현재 시점 t에서의 자료량을 결정한다. GRU 모형은 LSTM 모형보다 활성화 함수의 사용이 1회 적은 2회 사용만으로도 효과적인 시계열 계산을 수행할 수 있다. 따라서, GRU 모형은 LSTM 모형에 비해 매개변수의 개수가 적기 때문에 학습 속도는 빠르지만 LSTM 모형의 장기기억 특성도 동일하게 가지고 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F2.jpg

Fig. 2.

Gated Recurrent Unit (GRU)

(7)

r_{t} = σ (W_{r} ∙ [h_{t - 1}, x_{t}] + b_{r})

(8)

z_{t} = σ (W_{z} ∙ [h_{t - 1}, x_{t}] + b_{z})

(9)

h_{t} = \tanh (W ∙ [h_{t - 1}, x_{t}] + b)

(10)

h_{t} = (1 - z_{t}) h_{t - 1} + z_{t} h_{t}

여기서, r: 리셋 게이트, z: 업데이트 게이트, z_t: 시간 t에서 전달되는 자료량, 1―z_t: 시간 t에서 망각 자료량, $h_{t}$ : 중간은닉 상태, h_t: 은닉 상태.

2.2 모형의 성능분석 지표

2.2.1 Mean Absolute Error (MAE, 평균절대오차)

MAE는 평균절대 오차이며, 자료의 방향성을 고려하지 않고 예측값 집합에서의 평균 오차의 크기를 결정한다. Eq. (11)과 같이 예측값과 관측값의 절대값 차에 대한 산술평균이다.

(11)

M A E = \frac{1}{N} \sum_{i = 1}^{N} |x_{i} - y_{i}|

여기서, x_i: 관측값, y_i: 예측값, N: 자료의 개수.

2.2.2 Mean Squared Error (MSE, 평균제곱오차)

MSE는 평균제곱오차로서 Eq. (12)와 같이 예측값과 관측값의 차에 대한 평균제곱이다.

(12)

M S E = \frac{1}{N} \sum_{i = 1}^{N} {(x_{i} - y_{i})}^{2}

2.2.3 Root Mean Squared Error (RMSE, 평균제곱근오차)

RMSE는 평균제곱근오차로서 Eq. (13)과 같이 예측값과 관측값의 차에 대한 제곱평균제곱근이다.

(13)

R M S E = \sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(x_{i} - y_{i})}^{2}}

2.2.4 Coefficient of determination (R², 결정계수)

결정계수 R²는 통계모형의 적합성에 대한 척도를 나타낸다.

(14)

R^{2} = 1 - \frac{\sum_{i = 1}^{N} {(x_{i} - {\hat{y}}_{i})}^{2}}{\sum_{i = 1}^{N} {(x_{i} - x)}^{2}}

여기서, $\hat{y_{i}}$ : 통계모형의 예측값, $x$ : 관측값의 평균.

2.2.5 Normalized Root Mean Squard Error (NRMSE, 표준화된 RMSE)

RMSE를 표준화하여, 자료의 order of magnitude가 다른 특성의 자료를 오차를 비교할 때 사용한다(Eq. (15)).

(15)

N R M S E = \frac{R M S E}{M a x (y_{i}) - M i n (y_{i})}

여기서, Max(y_i): 최대 예측값, Min(y_i): 최소 예측값.

2.2.6 Nash-Sutcliffe model Efficiency coefficient (NSE, Nash-Sutcliffe 모형 효율성 계수)

NSE은 모형 효율성 계수(Eq. (16))이며, 모형 계산 결과에 대한 예측 정확도를 정량화한 지표이다.

(16)

N S E = 1 - \frac{\sum_{i = 1}^{N} {(x_{i} - y_{i})}^{2}}{\sum_{i = 1}^{N} {(x_{i} - x)}^{2}}

Table 1에서 제시된 바와 같이, R²와 NSE가 0.5 미만이면 모형의 예측 결과는 “적절하지 않음(unsatisfactory)”이며, R²와 NSE의 범위가 0.5보다 크고 0.65 미만의 경우, 예측결과는 “사용가능(satisfactory)”이다. 또한 R²와 NSE의 범위가 0.65보다 크고 0.75 미만이면 모형의 예측결과는 “좋음(good)”이고 R²와 NSE가 0.75를 초과할 경우, 모형의 예측결과는 “매우 좋음(very good)”을 나타낸다.

Table 1.

Performance ratings for adopted statistics (Park et al., 2020)

Performance Rating	R²	NSE
Very good	0.75 < R² ≤ 1.00	0.75 < NSE ≤ 1.00
Good	0.65 < R² ≤ 0.75	0.65 < NSE ≤ 0.75
Satisfactory	0.50 < R² ≤ 0.65	0.50 < NSE ≤ 0.65
Unsatisfactory	R² ≤ 0.50	NSE ≤ 0.50

3. 대상하천 선정 및 자료 수집

3.1 대상하천

본 연구를 위해 우선 수위 및 유량 관측자료가 제공되고, 수위-유량관계곡선식이 확보되어야 한다. 수위-유량관계곡선의 저유량 범위의 예측 유량 정확도를 확보하기 위해 대상하천의 하구에서 전파되는 조위의 영향이 적은 상류 지점을 연구 대상지점으로 선정해야 한다. 또한 해당관측소의 수문자료 변동성이 큰 홍수사상이 존재해야 한다. 따라서 이를 만족하는 대상하천 지점을 한강상류 팔당대교 관측소로 선정하였다(Fig. 3). 한강은 북한지역을 제외하면 유역면적이 23,076.8 km²이며, 유로연장은 37,517.1 km, 유역형상계수는 0.143이다. 한강 형상은 여러 형상이 혼합된 복합상 유역이다. Fig. 3에서 보는 바와 같이 남한강과 북한강이 팔당호로 합류한 후, 팔당댐을 시점으로 한강 본류를 형성한다. 팔당대교 관측소는 한강 본류가 시작되는 팔당댐 직하류 지점에 위치해 있다. 한강의 잠실수중보~팔당댐 구간의 하천 지형학적 특징은 하천폭은 303~1,693 m, 저수로폭은 277~1,332 m이며, 평균 경사는 1/10100이다. 팔당대교 과업지점은 서울특별시 및 경기도 주요 도시를 관류하는 한강 중류부 구간으로써 급속한 도시화가 진행되었고 친수공간과 생태습지도 함께 조성되어 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F3.jpg

Fig. 3.

Map of the Han River basin at Paldang bridge

3.2 대상지점의 수문량 자료의 수집

본 연구의 대상지점인 한강 팔당대교 관측소는 환경부에 의해 수문량 관측을 위해 관측소를 운영·관리하고 있다. 본 연구의 수위 및 유량 자료는 국가수자원관리종합정보시스템(Water Resources Management Information System, WAMIS) 홈페이지를 통해 수집하였다. 한국수문조사연보(ME, 2018)에서는 전국 하천의 주요지점에 설치된 자기수위관측소의 수위 측량 성과를 기반으로 유량 검증을 통해 수위-유량관계곡선(rating curve)을 지속적으로 업데이트하고 있다. 따라서, 자기수위관측소에서 관측된 수위자료를 이용하여 유량으로 환산하여 Water Resources Management Information System (WAMIS)인 국가수자원관리종합정보시스템(환경부)을 통해 사용자에게 수위 및 유량에 대한 실시간 자료와 일자료를 웹서비스를 통해 제공하고 있다. 일반적으로 데이터 모형은 자료의 학습 길이가 길어질수록 모형의 예측 정확도는 향상된다. 하지만 관측소의 자료가 충분히 확보되지 않는 경우, 데이터 모형에서 일정 수준의 예측 정확도를 보장할 수 없기 때문에 모형의 효과적인 검증을 위해 비교적 짧은 기간의 수문량 자료를 사용하였다. 이와 같은 방법으로 검증된 데이터 모형의 경우, 관측자료의 길이가 비록 짧다고 하더라도 모형의 예측 정확도가 확보된다면 홍수예경보시스템으로의 활용을 기대할 수 있다. 따라서 본 연구에서는 모형에 적용할 총 자료는 2018년 1월 1일~2020년 7월 31일(2년 7개월)까지의 시계열 자료로 총 943개의 시계열자료를 모형의 학습자료 및 예측자료로 분리하여 활용하였다.

팔당대교 관측소 지점의 2018년 1월 1일~2020년 7월 31일까지의 일평균 수위 및 일 유량에 대한 통계적 특성을 분석하면 Table 2와 같다. 팔당대교 관측소의 평균 수위는 1.19 m, 수위 표준편차는 0.33 m이며, 일평균유량은 314.9 m³/s, 일평균유량 표준편차는 436.23 m³/s로 분석되었다. 수문량의 변동폭은 최소값에 대한 최대값의 비로 수위 변동율은 4.41배이며, 유량 변동율은 47.44배로 수위에 비해 유량 변동율은 10배 이상의 변동성을 나타내고 있다. 또한, 수문량의 표준편차 대비 평균비는 수위의 경우 3.55배이며, 유량의 경우, 17.90배이다. 따라서, Table 2에서 제시된 팔당대교 관측소의 해당기간의 통계 특성은 원자료 기반 유량 변동 범위는 수위 변동 범위에 비해 매우 크다. 이와 같은 변동성이 큰 자료의 경우, 데이터 모형의 예측 정확도를 결정짓는 중요한 요소가 된다. 또한, 대상 관측소는 팔당댐 직하류에 위치하고 있기 때문에 댐 방류량에 의해 크게 영향을 받을 수 있지만 댐 방류량과 같은 외부 조건을 배제하고 관측소의 수문자료만을 활용하여 데이터 모형의 정확도를 검증하였다. 따라서, 팔당댐 방류량은 본 연구에서는 고려하지 않는다.

Table 2.

Statistical characteristics of water levels and flow rate at the Paldang Bridge Station (period: 2018-2020)

Hydrological Data	Minimum Value	Maximum Value	Average Value	Standard Deviation
Water Level (EL.m)	0.96	4.23	1.19	0.33
Flow Rate (m³/s)	118.83	5636.87	314.90	436.23

4. 모형 및 수위-유량관계곡선

4.1 모형 구성 및 매개변수의 설정

본 연구에서는 오픈소스 프로그램 언어인 Python Ver. 3.7.7과 머신러닝 라이브러리인 TensorFlow Ver.2.1.0을 사용했다. Table 3에서 보는 바와 같이 적용된 RNN 모형으로 LSTM 모형과 GRU 모형을 사용하였다. 모형의 뉴런(neuron) 구성과 뉴런의 층을 구성하는 단위수(unit)는 Table 3과 같이 두 모형 모두 동일하게 구성하였다. 즉, 입력층 1개, 은닉층 2개, 드롭아웃 1개, 밀도층 2개로 구성하였다. 두 모형에 입력되는 단위학습길이는 이 전의 연구결과(Park et al., 2020; 2022)를 반영하여 예측 정확도가 가장 높았던 14일을 적용하였으며, 모형에 입력되는 학습 자료의 길이는 전체 수집된 수문량 자료의 74.9%를 학습 자료로 활용하였으며, 나머지 25.1%의 자료는 모형의 예측 정확도를 판단하는 예측 자료로 사용하였다. Eqs. (11)~(16)은 모형의 성능분석지표로써 모형의 학습 정확도 및 예측 정확도를 분석할 수 있다. 모형의 하이퍼파라미터(hyperparameter)인 학습율(learning rate)은 학습 수렴속도를 반영하여 매 학습마다 자동 입력되게 설정하였고 모형의 학습횟수(epoch)는 총 600회이다. 학습 최적화 도구는 Adam을 사용하였고 비용함수는 MSE (Mean Square Error)를 사용하였다.

Table 3.

Configuration of models

Model	Activation Function	Input Layer	Hidden Layer 1	Dropout	Hidden Layer 2	Dense Layer 1	Dense Layer 2
LSTM	ReLU	LSTM	LSTM 50 units	0.25	LSTM 50 units	25 units	1 units
GRU	ReLU	GRU	GRU 50 units	0.25	GRU 50 units	25 units	1 units

4.2 대상관측지점의 수위-유량 관계곡선

본 연구에서는 앞서 언급된 수위자료에 비해 유량자료의 변동성이 매우 크기 때문에 직접적인 유량 예측의 정확도와 수위-유량관계곡선을 활용한 유량 예측 정확도를 비교하는 것이 전체 연구내용의 핵심이다. 따라서, LSTM과 GRU 모형을 이용하여 시계열 수위를 예측하고 예측된 수위자료를 다시 수위-유량관계식의 입력자료로 활용하여 시계열 유량을 예측하게 된다. 이렇게 예측된 유량은 기존의 데이터 모형에 의해 직접적으로 예측된 유량자료와 정확도 분석을 실시하여 개선된 예측 유량 산정을 목표로 한다. 따라서, 수위-유량관계곡선의 정확도가 매우 중요하기 때문에 한국수문조사연보(ME, 2018)에서 제공하고 있는 팔당대교 관측소의 수위-유량관계곡선식을 활용하였다(Eqs. (17)~(19)).

(17)

Q = 455.399 {(h - 0.460)}^{1.967} : 0.46 m \leq h \leq 1.08 m

(18)

Q = 791.023 {(h - 0.690)}^{1.585} : 1.08 m \leq h \leq 2.62 m

(19)

Q = 644.548 {(h - 0.470)}^{1.629} : 2.62 m \leq h \leq 17.63 m

여기서, Q: 유량m³/s, h: 수위(EL.m).

5. 모형의 계산 결과

5.1 모형의 수위 및 유량의 직접 학습(training) 및 직접 예측(prediction) 결과

팔당대교 지점에서 LSTM 모형과 GRU 모형의 시계열 수위 및 유량에 대한 학습 및 예측 결과는 Table 4(수위에 대한 학습 및 예측 결과)와 Table 5(유량의 학습 및 예측 결과)와 같다. Fig. 4는 LSTM 모형의 수위 및 유량의 학습결과와 예측결과이며, Fig. 5는 GRU 모형의 수위 및 유량에 대한 학습결과와 예측결과이다.

Table 4에서와 같이 수위 자료에 대한 LSTM 모형의 학습 정확도는 R²는 0.9912이고 NSE 0.9943이다. 학습자료에 대한 모형의 정확도는 Table 1에서 제시된 바와 같이 “매우 좋음”으로 학습되었다. LSTM 모형의 수위 예측 정확도는 R²는 0.6944이고 NSE 0.6953으로써 “좋음”으로 예측되었다. 또한 Table 4에서는 수위 자료에 대한 GRU 모형의 학습 정확도는 R²는 0.9913이고 NSE 0.9876으로써 “매우 좋음”으로 평가되었다. GRU 모형의 수위 예측 결과의 정확도는 R²는 0.6447이고 NSE 0.6457로써 “사용가능”으로 평가되었다. 두 모형의 정확도 평가 결과를 종합하면 수위 예측에서는 GRU 모형보다는 LSTM 모형의 정확도가 더 좋은 것으로 평가되었다. 학습 정확도는 GRU 모형이 조금 높은 정확도를 얻었지만 동일한 수준의 예측성능으로 평가된다.

Table 4.

Comparison of the performance of the models on the water levels

Model	Computational State	MAE (EL.m)	MSE (EL.m)²	RMSE (EL.m)	NRMSE	R²	NSE
LSTM	Training	0.0157	1.93×10^‒6	0.0014	0.0011	0.9912	0.9943
LSTM	Prediction	0.0855	0.0002	0.0152	0.0034	0.6944	0.6953
GRU	Training	0.0309	4.41×10^‒6	0.0021	0.0056	0.9913	0.9876
GRU	Prediction	0.0854	0.0005	0.0224	0.0066	0.6447	0.6457

2개의 RNN 모형을 통해 유량을 직접 입력값으로 사용하여 학습하고 예측된 유량은 Table 5에서 제시되었다. 유량의 학습 정확도는 수위의 학습 정확도와 동일한 수준으로 NSE는 R²는 0.9953~0.9919 범위의 정확도를 갖는다. 하지만 예측 유량은 예측 수위에 비해 크게 악화되어 LSTM 모형과 GRU 모형의 유량에 대한 R²는 각각 0.5530과 0.5223이며, NSE는 0.5532와 0.5224로 예측되었다. 2개 모형의 유량 예측 정확도는 “사용가능”으로 급격히 예측성능이 저하되었다. Table 2에서 제시된 수위와 유량의 통계특성을 비교하면 급변하는 수위변동에 대한 유량변동률의 크기(Order of magnitude)는 1321.9이다. 하지만, Tables 4 and 5에서 보는 바와 같이 수위와 유량의 차원이 다르고 변동율이 다르기 때문에 Eq. (15)의 NRMSE을 이용하여 예측 정확도를 계산하였다. LSTM 모형과 GRU 모형의 수위에 대한 학습 NRMSE는 각각 0.0011과 0.0056이고 유량에 대한 학습 NRMSE는 0.0004와 0.0007로 수위에 대한 학습 결과에 비해 유량의 학습결과가 상대적으로 과적합(overfitting)된 것으로 평가된다. 그럼에도 불구하고 LSTM 모형과 GRU 모형의 수위 예측 결과는 각각 0.0034와 0.0066으로 계산되었고 LSTM 모형과 GRU 모형의 유량 예측 결과는 0.0083과 0.0111로 계산되었다. 따라서, 자료의 변동 크기 효과를 제거한 NRMSE 계산 결과에 근거하여도 2개의 모형 모두 수위의 예측 결과가 유량의 예측 결과에 비해 NRMSE가 작고 상대적으로 예측 정확도가 높게 계산되었다. 하지만, NRMSE의 변동폭은 모두 매우 작은 값으로 계산되기 때문에 수위와 유량의 무차원된 상대 변동량은 다소의 차이만 있고 큰 차이를 보이지 않았다. 따라서, 본 연구는 원자료가 가지고 있는 자료의 변동 크기를 자료의 최대 분포범위로 표준화(normalized)하여 자료의 변동 크기를 제거하는 원자료의 가공 절차를 수행하지 않고 상대적으로 원자료의 변동 크기가 작은 수위 자료를 직접 활용하여 간접적으로 자료 변동 크기가 큰 유량 예측을 효과적으로 수행할 수 있는 방법을 개발하고자 하는 것을 목표로 한다.

Table 5.

Comparison of the performance of the models on the flow rates

Model	Computational State	MAE (m³/s)	MSE (EL.m)²	RMSE (m³/s)	NRMSE	R²	NSE
LSTM	Training	25.5759	41.2048	6.4191	0.0004	0.9953	0.9953
LSTM	Prediction	88.5218	173.9420	13.1887	0.0083	0.5530	0.5532
GRU	Training	28.6730	14.5596	3.8157	0.0007	0.9919	0.9919
GRU	Prediction	81.8752	197.2985	14.0463	0.0111	0.5223	0.5224

LSTM 모형의 수위에 대한 학습 및 예측 결과는 Fig. 4(a1)에 도시하였다. LSTM 모형의 수위 예측 결과는 Fig. 4(a2)에서 보는 바와 같이 저수위 뿐만 아니라 급변하는 고수위 예측 결과일지라도 관측 수위 대비 적정한 예측 수준을 보였다. 하지만, LSTM 모형의 유량 예측 결과의 경우(Figs. 4(b2) and 4 (c2))는 저유량의 예측 결과는 관측값과 비교적 일치하고 있지만 고유량에서는 Figs. 4(b2) and 4(d2)에서 보는 바와 같이 예측된 고유량은 과대 추정되거나 과소 추정되는 경향을 보이고 있다. 따라서 LSTM 모형을 활용한 급변하는 고유량 예측값은 실무에서 사용하기에는 정확도가 좋지 않다. GRU 모형의 경우, 예측된 수위는 Figs. 5(a2) and 5(c2)와 같이 적정한 정확도로 예측되었다. 하지만, 유량의 GRU 모형의 예측 결과는 Figs. 5(b2) and 5(d2)와 같이 고유량에서는 LSTM 모형에서 나타난 고유량의 과대 예측은 관찰되지 않지만 LSTM 모형과 동일하게 유량은 과소 예측되었다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F4.jpg

Fig. 4.

Trainings and predictions of LSTM

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F5.jpg

Fig. 5.

Trainings and predictions of GRU

5.2 모형의 수위의 직접 학습 결과 및 수위-유량관계곡선을 활용한 유량 예측 결과

앞 절에서 언급한 바와 같이 LSTM 모형과 GRU 모형을 이용하여 직접 수위를 예측하는 경우는 Table 1에서 제시하고 있는 성능분석 지표의 “좋음”의 예측 정확도를 가지고 있다. 하지만, 데이터 모형을 통한 유량의 직접 예측 정확도는 급격히 악화된다. 따라서, 본 연구에서는 성능분석 지표의 “좋음”에 해당되는 수위 예측 결과를 수위-유량관계곡선식(Eqs. (17)~(19))과 결합하여 적용함으로써 유량의 예측 정확도를 높을 수 있었다. 이번 절에서는 직관적으로 그래프를 통해 모형의 모형의 성능과 정확도를 파악할 수 있는 R²를 이용하여 기술하였고 Table 6과 Figs. 6(b1)~6(c2)와 Figs. 7(b1)~7(c2)와 같다.

Table 6의 LSTM 모형과 GRU 모형으로 직접 학습된 유량과 학습된 수위결과를 수위-유량곡선에 적용한 유량의 R²는 0.9919~0.9975 범위로 “매우 좋음”에 해당한다. 그러나 직접 예측된 유량의 R² 범위는 LSTM과 GRU 모형에서 각각 0.5530과 0.5223으로 “사용가능”으로 예측성능이 크게 저하되었다. 따라서, 두 모형을 통해 예측된 수위를 유량관계곡선식과 결합하여 적용할 경우, 유량의 예측 정확도(R² = 0.6870~0.6034)는 수위의 예측 정확도(R² = 0.6944~0.6447) 수준으로 크게 개선되었다.

Figs. 6 and 7에서는 직접 유량 예측 결과와 수위-유량관계곡선을 활용한 유량 예측 결과를 그래프로 도시하였다. Figs. 6(c1) and 6(c2)에서 보는 바와 같이 LSTM 모형의 경우, 예측된 수위를 입력자료로 수위-유량관계곡선을 활용한 유량예측결과가 직접 유량 예측 결과보다 크게 개선되었다. 또한 Figs. 7(c1) and 7(c2)의 GRU 모형의 유량 예측 결과는 수위-유량관계곡선을 활용한 유량 예측 결과가 직접 유량 예측 결과보다 정확도가 크게 향상되었다.

Table 6.

Comparison of the performance of the models and rating curves on the flow rates

Model	Computational State	Training R²	Prediction R²
LSTM	Direct flow rate	0.9953	0.5530
LSTM	Water level and rating curve	0.9975	0.6870
GRU	Direct flow rate	0.9919	0.5223
GRU	Water level and rating curve	0.9960	0.6034

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F6.jpg

Fig. 6.

Flow rate simulations using LSTM and rating curve

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-08/N0200550801/images/kwra_55_08_01_F7.jpg

Fig. 7.

Flow rate simulations using GRU and rating curve

6. 결론 및 고찰

본 연구에서는 수문량 분석에서 효과적이며, 시계열 예측이 가능한 LSTM 모형과 GRU 모형을 이용하여 수위 및 유량 예측의 정확도 분석을 실시하였다. 또한 변동성이 매우 큰 유량 예측의 정확도를 향상시킬 수 있는 방법으로써 유량의 변동 크기를 제거하지 않고 상대적으로 변동 크기가 작은 수위 자료와 수위-유량관계곡선을 활용한 효과적인 유량 예측법을 제시하였다. 이를 위해서는 수위를 이용한 유량의 정확한 예측에 필수적인 한국수문조사연보에 고시된 수위-유량곡선을 사용하였으며, 저유량 범위에서는 조위에 의한 유량 산정의 불확실성을 제거하기 위해 한강 하구로부터 충분히 떨어져 조위의 영향이 없는 팔당대교 지점을 과업지점으로 선정하였다. 또한 실제 관측소의 상황에 따라 관측자료의 충분하지 않는 제한적인 상황을 가정하기 위하여 본 연구에서 사용된 총 자료의 길이는 2018년 1월 1일~2020년 7월 31일까지 총 2년 7개월의 시계열 수위 및 유량 자료를 사용하였다. 이 기간동안의 총 자료의 74.9%는 학습 자료로써 모형의 입력자료로 사용되었고 나머지 25.1%는 예측된 결과의 검증 자료로 활용하였다. LSTM 모형과 GRU 모형을 활용하여 수위 및 유량의 예측성능 평가를 실시하였고 개선된 유량 예측법을 제안하기 위해 예측된 수위 자료와 수위-유량관계곡선을 결합한 유량예측법에 대한 예측성능 평가를 실시하였다. 본 연구의 주요 연구결과는 다음과 같다.

LSTM 모형과 GRU 모형에 의해 학습된 변동성이 큰 수위 및 유량의 학습 정확도를 나타내는 R² 지표는 0.9876~0.9953 범위이며, NSE는 0.9876~0.9953 범위로 학습 정확도는 “매우 좋음에 해당한다. 또한 변동성이 큰 수위 예측 결과는 LSTM 모형의 경우, R²지표는 0.6944이고 NSE는 0.6953으로 “좋음”에 해당된다. 아울러, GRU 모형의 경우, R²는 0.6447이고 NSE는 0.6457로 다소 정확도가 낮아졌으나 두 모형의 예측된 수위 결과는 홍수예경보 등에서 활용가능성이 매우 높다. 하지만, LSTM 모형을 이용하여 직접 유량을 예측할 경우, R²는 0.5530이고 NSE는 0.5532로 두 모형 모두 예측 정확도는 크게 악화되었다.

따라서, 본 연구에서는 변동성이 매우 큰 시계열 유량 예측의 한계성을 극복하기 위하여 유량에 비해 예측 정확도가 높은 시계열 수위자료와 수위-유량관계곡선의 활용한 새로운 유량 예측방법을 제안하였다. 수위-유량관계곡선을 활용한 변동성이 큰 유량 예측 결과는 LSTM 모형의 R²지표는 0.6870으로 수위 예측 정확도로 유량 예측 정확도가 크게 개선되었다. 마찬가지로 GRU 모형에서도 예측된 수위와 수위-유량관계곡선을 활용할 경우, 유량의 예측정확도 R²는 0.6034로 개선되었다. 따라서, 데이터 모형을 통해 생산된 예측된 수위 결과와 수위-유량관계곡선을 함께 활용한다면, 정확도가 향상된 시계열 유량자료를 생산할 수 있다. 또한 본 연구에서는 2년 7개월의 짧은 자료길이를 이용했음에도 불구하고 제안된 유량 예측기법의 정확도는 크게 향상됨을 확인할 수 있었다. 즉, 2~3년으로 관측된 수위자료가 매우 짧다고 하더라도 수위-유량관계곡선을 통해 정확한 유량을 예측할 수 있었다. 따라서, 본 연구결과는 급변하는 시계열 유량의 변동양상을 비교적 정확하게 예측할 수 있는 새로운 유량 예측방법으로 평가된다. 본 연구성과의 가장 큰 장점은 한국수문조사연보를 통해 이미 고시된 수위-유량관계곡선 자료를 활용하여 별도의 RNN 모형의 알고리즘 개선이나 자료의 직접적인 처리없이도 고수위 유량예측에 대한 정확도를 향상시킬 수 있는 매우 획기적인 방법으로 평가할 수 있다.

본 연구 성과는 관측소에서 충분한 자료 길이가 확보되지 않았다고 하더라도 최소 2년 이상의 수위 자료와 수위-유량관계곡선만으로도 비교적 정확한 고유량 예측이 가능하였다. 따라서, 수문량 관측자료가 충분히 확보되는 않는 중소하천이나 해외 저개발 국가의 유량 예측에도 활용할 수 있을 뿐만 아니라 도시하천의 홍수예경보시스템에서 활용될 수 있는 정확한 수위 및 유량 예측방법으로 평가된다. 본 연구성과를 범용적으로 활용하기 위해서는 수위-유량관계곡선의 정확도 확보가 선행되어야 한다. 따라서, 국내의 하천별로 수립된 수위-유량관계곡선을 활용하여 수위관측자료에 따른 유량예측의 정확도 검증을 향후에 지속적으로 수행한다면 국내의 고수위 예측 정확도를 향상시킬 수 있는 예측기법으로 활용될 수 있다.

Acknowledgements

이 논문은 2021년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No.2021R1I1A3050803).

Conflicts of Interest

The authors declare no conflict of interest.

References

Adamowski, J., and Chan, H.F. (2011). "A wavelet neural network conjunction model for groundwater level forecasting." Journal of Hydrology, Vol. 407, pp. 28-40. 10.1016/j.jhydrol.2011.06.013

Chen, P.-A., Chang, L.-C., and Chang, L.-C. (2013). "Reinforced recurrent neural networks for multi-step-ahead flood forecasts." Journal of Hydrology, Vol. 497, pp. 71-79. 10.1016/j.jhydrol.2013.05.038

Cho, K., Van Merrienboer, B., Bahdanau, D., and Bengio, Y. (2014). "On the properties of neural machine translation: Encoder-decoder approaches." Proceedings of the SSST-8, Eighth Workshop on Syntax, Semantics and Structure in Statistical Translation, Doha, Qatar, pp. 103-111. 10.3115/v1/W14-4012

Guo, F., Yang, J., Li, H., Li, G., and Zhang, Z. (2021). "A convLSTM conjunction model for groundwater level forecasting in a karst aquifer considering connectivity characteristics." Water, Vol. 13, No. 19, 2759. 10.3390/w13192759

Hipni, A., El-Shafie, A., Najah, A., Karim, O.A., Hussain, A., and Mukhlisin, M. (2013). "Daily forecasting of dam water levels: Comparing a support vector machine (SVM) model with adaptiveneuro fuzzy inference system (ANFIS)." Water Resources Management, Vol. 27, pp. 3803-3823. 10.1007/s11269-013-0382-4

Hochreiter, S., and Schmidhuber, J. (1997). "Long short-term memory." Neural Computation, Vol. 9, pp. 1735-1780. 10.1162/neco.1997.9.8.17359377276

Jung, S., Cho, H., Kim, J., and Lee, G. (2018). "Prediction of water level in a tidal river using a deep-learning based LSTM model." Journal of Korea Water Resources Association, Vol. 51, pp. 1207-1216. 10.3741/JKWRA.2018.51.12.1207

Kisi, O., Shiri, J., and Nikoofar, B. (2012). "Forecasting daily lake levels using artificial intelligence approaches." Computers & Geosciences, Vol. 41, pp. 169-180. 10.1016/j.cageo.2011.08.027

Kumar, D.N., Raju, K.S., and Sathish, T. (2004). "River flow forecasting using recurrent neural networks." Water Resources Management, Vol. 18, pp. 143-161. 10.1023/B:WARM.0000024727.94701.12

Ministry of Environment (ME) (2018). Korean hydrological survey yearbook.

Mok, J.-Y., Choi, J.-H., and Moon, Y.-I. (2020). "Prediction of multipurpose dam inflow using deep learning." Journal of Korea Water Resources Association, Vol. 53, pp. 97-105. 10.3741/JKWRA.2020.53.2.97

Park, K., Jung, Y., Kim, K., and Park, S.K. (2020). "Determination of deep learning model and optimum length of training data in the river with large fluctuations in flow rates." Water, Vol. 12, No. 12, 3537. 10.3390/w12123537

Park, K., Jung, Y., Seong, Y., and Lee, S. (2022). "Development of deep learning models to improve the accuracy of water levels time series prediction through multivariate hydrological data." Water, Vol. 14, No. 3, 469. 10.3390/w14030469

Sung, J.Y., Lee J., Chung, I.-M., and Heo, J.-H. (2017). "Hourly water level forecasting at tributary affected by main river condition." Water, Vol. 9, No. 9, 644. 10.3390/w9090644

Tran, Q.-K., and Song, S.-K. (2017). "Water level forecasting based on deep learning: A use case of Trinity River-Texas-the United States." Journal of KIISE, Vol. 44, pp. 607-612. 10.5626/JOK.2017.44.6.607

Zhang, D., Lin, J., Peng, Q., Wang, D., Yang, T., Sorooshian, S., Liu, X., and Zhuang, J. (2018). "Modeling and simulating of reservoir operation using the artificial neural network, support vector regression, deep learning algorithm." Journal of Hydrology, Vol. 565, pp. 720-736. 10.1016/j.jhydrol.2018.08.050

Zhang, D., Peng, Q., Lin, J., Wang, D., Liu, X., and Zhuang, J. (2019). "Simulating reservoir operation using a recurrent neural network algorithm." Water, Vol. 11, No.4, 865. 10.3390/w11040865

Journal of Korea Water Resources Association ISSN:2799-8746(Print) 2799-8754(Online) 한국수자원학회 논문집

Preview

Flow rate prediction at Paldang Bridge using deep learning models

ABSTRACT

MAIN

Fig. 1.

Long Short-Term Memory (LSTM)

(1)

(2)

(3)

(4)

(5)

(6)

Fig. 2.

Gated Recurrent Unit (GRU)

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(16)

Table 1.

Performance ratings for adopted statistics (Park et al., 2020)

Fig. 3.

Map of the Han River basin at Paldang bridge

Table 2.

Statistical characteristics of water levels and flow rate at the Paldang Bridge Station (period: 2018-2020)

Table 3.

Configuration of models

(17)

(18)

(19)

Table 4.

Comparison of the performance of the models on the water levels

Table 5.

Comparison of the performance of the models on the flow rates

Fig. 4.

Trainings and predictions of LSTM

Fig. 5.

Trainings and predictions of GRU

Table 6.

Comparison of the performance of the models and rating curves on the flow rates

Fig. 6.

Flow rate simulations using LSTM and rating curve

Fig. 7.

Flow rate simulations using GRU and rating curve

Acknowledgements

Conflicts of Interest

References