Radar-based rainfall prediction using generative adversarial network

Seongsim Yoon; Hongjoon Shin; Jae-Yeong Heo

doi:10.3741/JKWRA.2023.56.8.471

Preview

Research Article

Journal of Korea Water Resources Association. 31 August 2023. 471-484
https://doi.org/10.3741/JKWRA.2023.56.8.471

Radar-based rainfall prediction using generative adversarial network

적대적 생성 신경망을 이용한 레이더 기반 초단시간 강우예측

Seongsim Yoon^a^*

Hongjoon Shin^b

Jae-Yeong Heo^c

윤 성심^a^*

신 홍준^b

허 재영^c

^aSenior Researcher, Department of Hydro Science and Engineering Research, Korea Institute of Civil Engineering and Building Technology, Goyang, Korea

^bSenior Researcher, Hydro Power Department, Korea Hydro & Nuclear Power Co. Ltd., Gapyeong, Korea

^cPost-doc, Department of Civil and Environmental Engineering, Sejong University, Seoul, Korea

^a한국건설기술연구원 수자원하천연구본부 수석연구원

^b한국수력원자력 수력처 선임연구원

^c세종대학교 공과대학 건설환경공학과 박사후연구원

^{*Corresponding Author}

ABSTRACT

Deep learning models based on generative adversarial neural networks are specialized in generating new information based on learned information. The deep generative models (DGMR) model developed by Google DeepMind is an generative adversarial neural network model that generates predictive radar images by learning complex patterns and relationships in large-scale radar image data. In this study, the DGMR model was trained using radar rainfall observation data from the Ministry of Environment, and rainfall prediction was performed using an generative adversarial neural network for a heavy rainfall case in August 2021, and the accuracy was compared with existing prediction techniques. The DGMR generally resembled the observed rainfall in terms of rainfall distribution in the first 60 minutes, but tended to predict a continuous development of rainfall in cases where strong rainfall occurred over the entire area. Statistical evaluation also showed that the DGMR method is an effective rainfall prediction method compared to other methods, with a critical success index of 0.57 to 0.79 and a mean absolute error of 0.57 to 1.36 mm in 1 hour advance prediction. However, the lack of diversity in the generated results sometimes reduces the prediction accuracy, so it is necessary to improve the diversity and to supplement it with rainfall data predicted by a physics-based numerical forecast model to improve the accuracy of the forecast for more than 2 hours in advance.

Keywords

Radar

Rainfall prediction

Generative adversarial neural networks

Deep learning

적대적 생성 신경망 기반의 딥러닝 모델은 학습된 정보를 바탕으로 새로운 정보를 생성하는데 특화되어 있다. 구글 딥마인드에서 개발한 deep generative model of rain (DGMR) 모델은 대규모 레이더 이미지 데이터의 복잡한 패턴과 관계를 학습하여, 예측 레이더 이미지를 생성하는 적대적 생성 신경망 모델이다. 본 연구에서는 환경부 레이더 강우관측자료를 이용하여 DGMR 모델을 학습하고, 2021년 8월 호우사례를 대상으로 적대적 생성 신경망을 이용하여 강우예측을 수행하고 기존 예측기법들과 정확도를 비교하였다. DGMR은 대체적으로 선행 60분까지는 강우 분포 위치가 관측강우와 가장 유사하였으나, 전체 영역에서 강한 강우가 발생한 사례에서는 강우가 지속적으로 발달하는 것으로 예측하는 경향이 있었다. 통계적 평가에서도 DGMR 기법이 1시간 선행예측에서 임계성공지수 0.57~0.79, 평균절대오차 0.57~1.36 mm로 나타나 타 기법 대비 효과적인 강우예측 기법임을 보여주었다. 다만, 생성 결과의 다양성이 부족한 경우가 발생하여 예측 정확도를 저하하므로 다양성을 개선하기 위한 연구와 2시간 이상의 선행예측에 대한 정확도 개선을 위해 물리기반 수치예보모델 예측강우 자료를 이용한 보완이 필요할 것으로 판단되었다.

키워드

레이더

강우예측

적대적 생성 신경망

딥러닝

MAIN

1. 서 론
2. 자료 구축 및 방법론
2.1 자료 구축
2.2 적용모델
2.3 비교 대상 예측모델
3. 강우예측 정확도 평가
3.1 사전학습된 딥러닝 모델을 이용한 강우예측
3.2 예측강우의 평가
4. 결 론

1. 서 론

이상기후로 인해 돌발적이고 국지적인 호우 발생의 빈도가 증가하게 되면서 초단시간 강우예측자료가 홍수의 조기경보를 위해 유용하게 사용되고 있다(Lin et al., 2005; Sun et al., 2014).

레이더 자료 기반의 외삽기법을 활용하여 생산되는 초단시간 강우예측 자료는 3시간 이내의 짧은 선행시간 범위에서 역학 ․ 물리 방정식을 사용하여 모의하는 기상추치 예보모델에 비해 높은 정확도를 갖기 때문이다. 최근에는 장기간 레이더 관측자료의 확보와 충분한 컴퓨터 연산자원으로 인해 레이더 자료를 활용한 인공지능 심층학습 기반(RNN (Recurrent Neural Network), CNN (Convolutional Neural Network), ConvLSTM 등)의 강우예측 연구가 국외에서 확대되고 있고(Shi et al., 2015, 2017; Reichstein et al., 2019), 국내에서도 ConvLSTM 등을 활용한 연구들이 진행되었다(Tran and Song, 2019; Yoon et al., 2020; Shin et al., 2021). 기존 연구들에서 언급되었듯 CNN 심층신경망 기반의 초단기 예측 모델의 경우 대체적으로 외삽기반의 예측성능보다 우수한 경향이 있었다. 그러나 예측시간이 길어질수록 공간 평활화되는 경향이 크게 나타나므로 고강도의 뚜렷한 강수 특징을 예측하는 것이 제한적이다. 따라서 예측정확도를 향상시키는데 중요한 소규모 기상현상을 왜곡하게 된다(Shi et al., 2017; Ayzel et al., 2020; Yoon et al., 2020). 또한 전체 강수장의 강우 이동 및 위치의 결정론적 예측에 기반하는 기존 방법은 시공간적인 복잡성을 동시에 고려한 일관된 예측이 어려워 활용성이 제한되므로, 확률론적 예측이 결정론적 예측보다 더 높은 경제적 및 의사 결정 가치를 제공하는 것으로 알려져 있다(Palmer and Räisänen, 2002; Richardson, 2000; Ravuri et al., 2021). Ravuri et al. (2021)은 확률론적 레이더 초단시간 강우 예측을 위해 적대적 생성 신경망(Generative adversarial networks, GAN) 기반의 심층 생성 모델(deep generative model of rain, DGMR)을 개발하였다. DGMR은 데이터의 확률 분포를 학습하고 학습된 분포에서 샘플을 쉽게 생성할 수 있도록 하는 통계 모델이라고도 할 수 있다. 영국 기상청 레이더 자료를 이용하여 DGMR을 학습하고, 선행시간 5~90분의 예측을 수행한 결과, 기존 강우예측 모델인 PySTEPS와 CNN 기반의 딥러닝 모델인 U-Net에 비해 상대적으로 향상된 정확도를 확보하였다. DGMR 이후 강우예측 분야에서는 GAN 알고리즘을 훈련할 때 안정성을 확보하는 측면으로 기법들이 개발되었는데, Energy-Based Generative Adversarial Forecaster (EB GANForecaster)는 컨볼루션 구조와 코덱 프레임워크를 결합하여 안정성을 향상시켰으며(Xie et al., 2022), GAN-argc PredNet v1.0은 예측된 에코 세부 사항을 개선하고 GAN 훈련을 안정화하는 데 장점이 있는 것을 보여 주었다(Zheng et al., 2022). 또한 국내에서도 GAN과 기상청 레이더 자료를 이용하여 강우예측 연구가 수행되어 외삽기반 모델, ConvLSTM 및 U-Net 모델 보다 개선된 성능을 확인한 바 있다(Kim and Hong, 2022; Choi and Kim, 2022). 다만, 학습된 예측모델의 평가가 태풍 솔릭이나 집중호우 기간의 특정 시점에 대해서만 평가가 진행되어 다양한 호우 사상에 대한 평가가 필요하다.

본 연구에서는 적대적 생성 신경망 기반의 강우예측 기법 중 가장 우수하다고 알려진 DGMR 모델을 환경부 강우레이더 자료를 이용하여 학습하고, 강우예측을 수행하여 강우장의 생성 가능성을 고려하는 딥러닝 모델의 국내 활용성을 검토하고자 한다. 여기서, DGMR 모델 예측강우의 성능은 시간 연속을 고려하는 딥러닝 모델인 ConvLSTM U-Net과 환경부에서 생산하고 있는 강우예측 결과를 기준으로 평가하고자 한다.

2. 자료 구축 및 방법론

2.1 자료 구축

본 연구에서는 환경부의 대형 S-band 강우레이더(비슬산(BSL), 소백산(SBS), 모후산(MHS), 서대산(SDS), 가리산(GRS), 예봉산(YBS), 감악산(GAS) 레이더)의 2차원 합성 강우자료(Quantitative Precipitation Estimates, QPE)를 이용하여 딥러닝 기반의 강우예측 모델을 학습 및 평가하였다.

자료 기간은 2018년부터 2021년 사이에 강우가 발생한 호우사례 274일을 선정하였다. 또한, 무강우 학습을 수행하지 않기 위해 매 10분단위로 강우면적을 계산하여 0 mm 초과하는 강우면적이 1% 이상인 학습용 강우레이더 자료 구축 시점 21,495개를 선정하였다. 자료의 시간 해상도는 10분 간격이며 강우자료의 단위는 mm/hr이다. 실제 환경부의 합성강우레이더의 격자는 500 m, 격자 규모는 1050×1250이나, 연산자원의 한계와 모델 학습시간의 단축을 위해 Fig. 1과 같이 자료 활용 범위를 한강영역(빨간색 사각형)으로 제한하였으며, 공간 해상도를 1 km로 변환하여 256×256 격자 규모를 갖도록 하였다.

구축된 자료 중 모델의 학습에 사용된 데이터셋은 17,200개(80%)이고, 검정에 사용된 데이터셋은 2,149개(10%)이다. 나머지는 2,147개(10%) 데이터셋은 사전학습된 딥러닝 모델을 이용한 강우예측 정확도를 평가하는데 사용하였다.

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F1.jpg

Fig. 1.

Study area

2.2 적용모델

2.2.1 적대적 생성신경망 기반 예측모델

본 연구에서는 적대적 생성 신경망(GAN)을 적용한 초단시간 예측기법을 활용하였다. GAN은 생성자(generator)와 판별자(discriminator)라는 두 신경망이 서로간의 적대적인 경쟁을 통해 학습하는 신경망으로, 데이터의 확률분포를 학습하고 학습된 분포에서 샘플을 쉽게 생성할 수 있는 기법이다. 특히, 본 연구에서 사용한 DGMR은 조건부 적대적 생성 신경망을 기반으로 한다. 조건부 적대적 생성 신경망(conditional Generative Adversarial Network, cGAN)은 생성자와 판별자가 훈련하는 동안 추가 정보를 사용해 조건이 설정된 적대적 생성 신경망으로, 생성자와 판별자에 특정 조건을 나타내는 정보를 추가해서 인위적으로 원하는 데이터를 생성할 수 있다. 따라서 DGMR도 예측시점의 관측강우정보를 조건으로 설정하여 랜덤 노이즈가 예측강우장과 유사하게 생성될 수 있도록 한다.

DGMR은 다음 Fig. 2와 같이 생성자와 2개의 판별자, 그리고 각각의 블록들로 구성되어 있으며, 모델의 학습 과정은 다음과 같이 서술할 수 있다.

우선 10분 간격으로 과거 40분 전부터 관측한 레이더 강우장이 생성자에 컨텍스트 벡터(context vector)로 사용되며, 두 손실함수(loss function)와 하나의 가중치 규제(regularization)를 통해 학습된다. 생성자에 컨텍스트 벡터가 들어가면 이미지가 생성되며, 이 중 8개 프레임이 랜덤으로 선택되어 공간적 판별자(spatial discriminator)에 적용되고 실제 데이터와 비교해 손실값을 얻게 된다. 여기서 생성자는 이미지 생성 시 입력받은 무작위 잡음 벡터를 실제 이미지의 패턴과 일치하도록 의도된 정보로 변환한다. 생성자는 실제 레이더 이미지와 구별하기 어렵게 이미지를 생성하는 것이 목표이므로, 생성된 이미지의 현실성을 평가하는 판별자를 이용하여 적대적 방식으로 학습된다. 공간적 판별자는 CNN 구조를 가지는 모델로써, 관측된 레이더 강우장과 생성된 강우장을 구별하여 공간적 일관성(spatial consistency)을 확보하고 모호한 예측을 방지하는 데 중점을 둔다. 시간적 판별자(temporal discriminator)에는 생성된 이미지가 랜덤하게 추출되어 입력되며, 관측된 레이더 시퀀스와 생성된 레이더 시퀀스를 구별해서 시간적 일관성(temporal consistency)을 확보하여 모델이 과적합되었거나 불안정한 경우에 발생하는 jumpy prediction을 저감하는 목적이 있다.

또한 정확도를 향상시키기 위해 관측값과 모델이 생성한 평균값들에 대한 격자셀 정규화(grid cell regularization)를 수행하여 둘 사이 간 차이에 불이익을 주는 항을 도입하였다. 이 항은 모델이 위치에 따른 정확한 예측을 하게 함으로써 성능 향상에 있어 중요한 역할을 한다.

특히, 생성 신경망 모델은 기본적으로 확률에 기반하여 입력된 레이더 정보의 조건부 확률분포를 이용하여 다수의 데이터 생성 모의가 가능하다. 따라서 앙상블 기법과 유사한 예측 집합을 생성할 수 있다. DGMR은 관측 데이터로부터 학습하고 여러 공간 및 시간 척도에 걸쳐 불확실성을 나타낼 수 있다는 장점이 있다. 그러나 강우의 발달 및 소멸과 관련된 물리적 특성을 예측하기 어려워 대류셀 예측이나 90분 이상의 예측에서는 성능이 급격히 저하되는 단점이 있다(Ravuri et al., 2021; Zhang et al., 2023).

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F2.jpg

Fig. 2.

Modified DGMR overview (Ravuri et al., 2021)

2.2.2 모델 학습 최적화

DGMR은 생성자와 판별자의 목적 함수를 구분하여 학습한다. 생성자는 다음 Eqs. (1) and (2)을 최대화하는 방식으로 학습된다. 각 식은 재구성 손실(L_G)과 정규화 항(L_R)을 의미하며, 강우 패턴의 시간적 변화가 고려된 높은 품질의 레이더 이미지를 생성하는 것이 목적이다. 식에서 D와 T는 판별자의 공간과 시간판별자의 손실을 의미하며, Eq. (2)의 정규화 항의 R은 생성된 샘플의 평균을 구하여, 더 많은 강우 시나리오에 대한 최종 손실을 반영한다. $G_{θ}$ 는 매개변수 $θ$ 를 갖는 생성자를 의미한다.

(1)

L_{G} (θ) = E_{X_{1 : M + N}} [E_{X} [D (G_{θ} (Z; X_{1 : M})) + T (\{X_{1 : M}; G_{θ} (Z : X_{1 : M})\})] - λ L_{R} (θ)];

(2)

L_{R} (θ) = \frac{1}{H W N} {||(E_{Z} [G_{θ} (Z; X_{1 : M})] - X_{M + 1 : M + N}) ⊙ w (X_{1; M + N})||}_{1}

Eqs. (1) and (2)에서 잠재공간 Z에 대한 기댓값을 추정하기 위해 Monte Carlo 추정치를 사용하는데, M개의 레이더 관측치로 이루어진 입력 X_1:M에 대해 임의로 6개의 샘플이 계산된다. 본 연구에서 M은 과거 4개의 연속된 레이더 관측치를 사용하므로 4이다. 격자 셀 정규화는 평균적인 예측이 실측값에 가깝게 유지되고 높이 H, 너비 W 및 리드 타임 N 축을 따라 모든 격자 셀에서 정규화 되도록 한다. 또한 강우 강도에 따라 가중치를 부여하기 위해 함수 $w (y) = \max (y + 1, 24)$ 가 입력 벡터에 대해 요소별로 작동하며, 이상치 처리를 위해 24로 클리핑(clipping)이 수행된다. 이렇게 함으로써, 입력값이 일부 이상치를 포함하더라도 결과가 안정적으로 유지될 수 있다. DGMR은 강한 강수량 예측 시 선행시간이 길어질수록 부자연스러운 움직임과 강도, 위치 오류가 발생하기 쉽다고 알려져 있는데, 이와 같은 이상치 처리 과정은 극한 강우 정보가 손실되어 강한 강우현상에서의 예측정확도를 저하시키는 요인이 될 수 있다(Ravuri et al., 2021; Zhang et al., 2023).

판별자는 다음 Eq. (3) and (4)과 같이 공간판별자 손실과 시간판별자 손실을 최소화함으로써 최적화된다. 공간판별자( $D_{ϕ}$ )는 매개변수 ϕ를 갖고, 시간판별자( $T_{ψ}$ )는 매개변수 ψ를 가진다. 여기서, 활성화 함수로 ReLU (Rectified Linear Unit)를 사용한다. ReLU 함수는 입력값이 0보다 작을 경우는 0을, 0보다 클 경우는 입력값을 그대로 출력한다.

(3)

L_{D} (ϕ) = E_{X_{1 : M + N}} [R e L U (1 - D_{ϕ} (X_{M + 1 : M + N})) + R e L U (1 + D_{ϕ} (G (Z; X_{1 : M})))]

(4)

L_{T} (ψ) = E_{X_{1 : M + N}} [R e L U (1 - T_{ψ} (X_{1 : M + N})) + R e L U (1 + T_{ψ} (\{X_{1 : M}; G (Z; X_{1 : M})\}))]

판별자 손실은 GAN에서 일반적으로 사용되는 힌지(hinge) 손실 공식을 사용하여 판별자 네트워크에서 실제 데이터와 가짜 데이터를 구별한다. 판별자의 목표는 실제 데이터와 가짜 데이터를 정확하게 분류하는 것이므로 실제 데이터의 목표 레이블은 1, 가짜 데이터의 목표 레이블은 -1이 되며, 힌지 손실은 판별자 네트워크가 실제 데이터에 높은 점수를 부여하고 가짜 데이터에 낮은 점수를 부여하도록 함으로써, 목표에서 벗어날수록 손실이 증가하게 된다(Clark et al., 2019).

DGMR은 Ravuri et al. (2021)에서 제시한 대로 최대 5×10⁵개의 생성자 스텝으로 학습하였고. 각 생성자 스텝 당 두 개의 판별자 스텝이 수행되도록 하였다. 생성자의 학습률은 5×10^-5이며, 판별자의 학습률은 2×10^-4이다. Adam optimizer를 사용하였으며, β₁ = 0.0 및 β₂ = 0.999로 설정하였다. 그리드 셀 정규화에 대한 스케일링 매개변수는 λ = 20으로 설정하였다.

본 연구의 딥러닝 기반 강우 예측모델은 파이토치(PyTorch) 프레임워크(https://pytorch.org)를 사용하였으며, 듀얼 GPU (NVIDIA RTX A6000) 환경에서 학습을 수행하였다. 다음 Fig. 3은 DGMR의 학습 및 검증 결과를 나타낸 것으로, epoch 130에서 모델이 최적화되었다고 판단되어 학습을 중단하였다. 특히, GAN의 경우 단순히 loss로만 최적화 여부를 판단하기 어려워 학습된 모델의 강우예측 이미지를 확인하여 모드붕괴가 일어나지 않았는지를 같이 확인하여 최적화 여부를 판단하였다.

또한 본 연구에서는 비교모델로 사용된 ConvLSTM2D U-Net의 최적화는 평균절대오차(Mean Absolute Error, MAE)를 최소화하는 방식으로 수행된 결과를 사용하였다(Shin et al., 2021).

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F3.jpg

Fig. 3.

Model training result of each epoch ((a): Training, (b): Validation)

2.3 비교 대상 예측모델

본 연구에서는 DGMR과의 성능 비교를 위해서 Conv LSTM2D U-Net 모델을 사용하였다(Shin et al., 2021). Conv LSTM2D U-Net은 U-Net 구조와 ConvLSTM2D의 구조로 학습을 각각 진행한 후 최종단계에서 합쳐서 Convolution 층을 배치하여 예측하는 모델이다. 여기서, U-Net은 이미지의 전반적인 특징 정보를 얻기 위해 축소 네트워크와 정확한 지역화를 위한 확장 네트워크가 U자형의 대칭 형태를 갖으며, ConvLSTM2D는 시공간적 상관관계를 포착할 수 있는 네트워크 구조이다.

또한 환경부에서 생산하고 있는 강우레이더 기반 초단기 예측강수 자료도 딥러닝 기반 예측결과와의 비교를 위해 함께 사용하였다. 환경부에서는 내부적으로 홍수예보 업무를 위해 환경부 강우레이더 합성자료를 이용하여 세미 라그랑지안 개념에 따른 이동벡터를 산정 후 강우장 이동을 예측한다(Seo et al., 2020). 세미 라그랑지안은 총 강도를 보존하면서 강우를 바람장에 의해 이송하는 라그랑지안 연속성을 바탕으로 레이더 전체를 작은 크기 영역으로 분할하고 바람장을 추출하여 반영할 수 있다(Turner et al., 2004). 이동벡터 산정 측면에서 MAPLE과 유사하여 초기에 구해진 이동벡터를 전체 예측시간에 활용하기 때문에 예측시간 확장에 한계가 있다. 격자해상도는 500 m이며, 1050×1050 격자규모로 최대 6시간 선행예측을 10분 간격으로 수행한다. 본 연구에서 생산하는 레이더 예측강우와 동일한 격자 해상도를 갖도록 환경부의 예측강우는 선형보간을 통해 1 km로 변경하였습니다.

3. 강우예측 정확도 평가

3.1 사전학습된 딥러닝 모델을 이용한 강우예측

강우예측의 정확도를 평가하여 제시하고자, 모형의 학습과 검정에서 제외한 데이터셋 중 2021년에 발생한 5개 호우 사례를 Table 1과 같이 선정하였다. 선정된 호우사례는 저기압성 강우, 장마전선, 태풍으로 인한 호우와 같은 특징을 갖고 있다. 선정된 호우 사례에 대해 학습된 DGMR과 ConvLSTM2D U-Net을 이용하여 강우발생 기간동안 매 10분 간격으로 선행 10분에서 180분까지 강우예측을 수행하였다. 강우예측과정에서 기존 ConvLSTM2D U-Net이 10분 선행예측을 목표로 학습되는 구조를 가지고 있기 때문에 재귀적 추론과정을 통해 180분까지의 선행예측을 수행하는 반면, DGMR은 과거 30분전부터 예측시점 4개의 자료를 입력으로 받아 재귀적인 추론과정 없이 18개의 예측 강우가 생성되는 모델 구조를 갖고 있다는 차이가 있다. 비교를 위해 동일 기간에 대해 환경부에서 생산한 강우레이더 기반 초단기 예측강수 자료(HFC QPF)를 구축하여 예측성능을 평가하였다.

Fig. 4는 2021년 8월 14일 07:00 시점에 생산된 결과이다, 전선성 강우가 강원영동 지역 중심으로 발생한 사례로써 레이더 관측강우를 보면 전선이 강한 동풍으로 인해 동해안에서 서쪽 내륙쪽으로 이동하는 것을 확인할 수 있다. HFC QPF의 경우 입력강우의 강우강도를 유지하면서 내륙으로 이동하여 이동 거리가 관측과 비교했을 때 상대적으로 짧았다. ConvLSTM2D U-Net 예측 강우는 강우강도가 약해지면서, 선행 180분까지 동해안 지역에 정체되는 양상을 보였다. DGMR 예측 강우는 레이더 관측강우와 유사하게 내륙 쪽으로 전선이 이동하면서 약화되는 것으로 보였다.

Fig. 5는 2021년 8월 21일 12:10 시점에 생산된 결과이다. 강한 저기압으로 발달한 비구름의 영향을 수도권 지역을 중심으로 강한 강우가 넓게 발생하다가 동해로 이동하면서 약화되어 선행 180분 시점에서는 약한 강우가 북한강 지역으로 남아있다. 선행 60분까지는 HFC QPF와 DGMR 예측 강우는 관측 강우와 유사한 강우 분포를 보였으나, ConvLSTM2D U-Net은 수도권의 강한 강우영역을 유지하면서 그 외 지역에서는 강우가 약화되는 것으로 강우영역을 예측하였다. 선행 120분과 180분에는 강우 중심이 북쪽으로 이동하는 것을 HFC QPF는 잘 예측하였으나, DGMR은 강우영역이 확대되면서 강우강도가 증가하는 것으로 예측하였다.

Fig. 6은 2021년 8월 23일 18:00 시점에 생산된 결과이다, 태풍 오마이스의 북상으로 인해서 전국적으로 강한 강우의 비가 발생한 사례이다. 관측강우는 비가 서쪽으로 이동하면서 약화되는데 DGMR로 예측된 강우의 선행 60분까지는 관측강우와 유사하게 약하게 변화하나, 선행시간이 길어질수록 다시 발달하였다. 반면, ConvLSTM2D U-Net은 강우 관측영역이 축소되면서 강우가 소산되는 것으로 예측하였으며, HFC QPF는 입력자료의 강우강도를 유지하면서 강우영역이 북쪽으로 이동되는 것으로 예측하였다.

Fig. 7은 2021년 8월 29일 03:20 시점에 생산된 결과이다, 정체전선의 영향으로 인해서 강한 강우의 비가 발생한 사례이다. DGMR로 예측된 강우의 선행 60분까지는 관측강우와 유사한 강우 분포 특성을 보이면서 강우강도도 유사하였다. HFC QPF는 선행시간이 길어질수록 약한 강우강도가 지속적으로 확장하는 것으로 예측하였고, ConvLSTM2D U-Net은 강우 전선이 이동하지 않고 강우가 약화되는 것으로 예측하였다.

Fig. 8은 2021년 8월 31일 16:40 시점에 생산된 결과이다. 서해에서 강하게 발달한 비구름이 유입되면서 중부지방에 강한 강우를 유발한 사례이다. 시간이 진행되면서 강우 강도가 약해지면서 동쪽으로 이동하다가 3시간 후에는 다시 서해에서 강한 강우가 다시 발달하였다. HFC QPF는 강도를 유지하면서 강우가 이동하였고, ConvLSTM2D U-Net은 전체적으로 강우면적이 축소되나 강도를 유지하였다. DGMR 예측강우는 강우가 계속 발달하는 것으로 예측하였다.

예측된 강우 분포에 대한 도식적인 분석을 종합하면, HFC QPF는 외삽기반 예측모델의 특징대로 강우의 발달 및 쇠약을 반영하지 못하였으며, ConvLSTM2D U-Net은 대체적으로 강우영역이 축소되는 경향을 크게 나타났다. DGMR의 경우는 대체적으로 선행 60분까지는 강우 분포 위치가 관측강우와 가장 유사하였으나, 전체 영역에서 강한 강우가 발생한 사례(Event 2, Event 3, Event 5)에서는 강우가 지속적으로 발달하는 것으로 예측하는 경향이 있었다. 이는 적대적 생성 신경망 모형이 입력자료의 확률분포와 유사한 결과물을 생성하는 목적으로 학습되므로 생성된 데이터가 입력자료가 발달하는 경향을 갖고 있으면, 지속적으로 발달하는 경향을 갖게되기 때문이라고 사료된다.

Table 1.

Characteristics of the evaluated events

Event #	Start	End	Duration, hours	Rain type
Event 1	2021-08-14 06:00	2021-08-14 10:50	5	Stationary front
Event 2	2021-08-21 06:00	2021-08-21 15:50	10	Low pressure precipitation
Event 3	2021-08-23 09:00	2021-08-23 23:50	15	Typhoon
Event 4	2021-08-28 23:00	2021-08-29 06:50	8	Stationary front
Event 5	2021-08-31 12:00	2021-08-31 19:50	8	Summer Monsoonal Front

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F4.jpg

Fig. 4.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 07:00 14 August 2021)

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F5.jpg

Fig. 5.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 12:10 21 August 2021)

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F6.jpg

Fig. 6.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 18:00 23 August 2021)

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F7.jpg

Fig. 7.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 03:20 29 August 2021)

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F8.jpg

Fig. 8.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 16:40 31 August 2021)

3.2 예측강우의 평가

본 절에서는 예측강우의 평가를 임계성공지수(Critical Success Index, CSI)와 평균절대오차(Mean Absolute Error, MAE)를 이용하여 수행하였다. CSI는 특정 값 이상의 강우에 대해 관측과 예측 모두 일치한 격자 수를 강수 발생과 관련된 전체 경우로 나눈 것이다. CSI는 예측강수와 관측강수의 유무행렬로 이루어진 강수분할표(rain contingency table)에 기초하여 산정된다. MAE는 같이 예측강우와 관측강우의 정량적 차이를 나타낸다(Yoon et al., 2020). 임계강우강도는 0.1 mm/hr를 적용하였다(Shin et al., 2021).

Fig. 9는 각 호우사례별로 레이더 관측강우를 기준으로 각 방법의 강우예측 결과물의 CSI와 MAE를 예측선행별로 도시한 것이다. DGMR의 경우 CSI는 모든 호우사례에서 HFC QPF와 ConvLSTM2D U-Net보다 높은 정확도를 보였다. 반면, MAE는 DGMR이 전반적으로 작게 나타났으나, Event 2와 Event 4는 선행시간이 길어지면서 다른 예측모델보다 크게 나타났다.

Table 2는 각 예측모델 HFC QPF, ConvLSTM2D U-Net 및 DGMR의 정확도를 수치로 표현한 것이다. 5개의 서로 다른 호우사례에 대한 CSI 및 MAE 평가지표의 결과로, 0-1시간, 1-2시간 및 2-3시간 선행시간별 평균 평가표이다. CSI는 모든 예측기법의 성능이 선행시간이 증가함에 따라 감소하였으며 MAE는 증가하였다. 이는 강수량 예측의 불확실성이 일반적으로 선행시간이 길어질수록 증가하기 때문에 예상했던 결과이다.

CSI 기준에서 DGMR 기법이 모든 사례 및 선행시간에 대해 다른 두 예측기법을 능가하는 것으로 나타났다. MAE를 보면, DGMR 모델은 대부분의 사례 및 선행시간 범위에서 가장 낮았으나 일부 사례(Event 2, Event 4)에서는 선행시간 2-3시간 예측에 대해 타 기법이 낮았다. 이는 4.1절의 분석에서 확인된 것처럼 DGMR이 강우가 지속적으로 발달하는 것으로 예측하였기 때문이다. 대부분의 경우, ConvLSTM2D U-Net은 HFC QPF 기법보다 오차가 낮아 딥러닝 기반 예측 기법이 종래의 예측 기법을 적용한 HFC QPF보다 예측 정확도가 높은 것을 확인할 수 있다. 종합적으로 판단하면 DGMR 기법은 세 가지 예측 기법 중 가장 효과적인 강우예측 기법으로 판단되었다.

https://cdn.apub.kr/journalsite/sites/kwra/2023-056-08/N0200560801/images/kwra_56_08_01_F9.jpg

Fig. 9.

Mean Absolute Error (MAE) and Critical Success Index (CSI) for 0.1 mm/hr thresholds. The metrics are shown as a function of lead time for DGMR, ConvLSTM2D U-Net, HFC-QPF. All values represent the average of the corresponding metric over each event

Table 2.

Evaluation of QPF accuracy

Model Metric		HFC QPF			ConvLSTM2D U-Net			DGMR
Model Metric		FCST 0-1H	FCST 2H	FCST 3H	FCST 0-1H	FCST 2H	FCST 3H	FCST 0-1H	FCST 2H	FCST 3H
CSI	Event 1	0.26	0.17	0.14	0.60	0.31	0.20	0.67	0.50	0.34
	Event 2	0.25	0.10	0.05	0.63	0.30	0.15	0.71	0.55	0.45
	Event 3	0.26	0.14	0.09	0.65	0.33	0.18	0.72	0.61	0.58
	Event 4	0.28	0.18	0.14	0.41	0.18	0.12	0.57	0.43	0.34
	Event 5	0.41	0.38	0.39	0.69	0.40	0.25	0.79	0.71	0.67
MAE	Event 1	1.93	2.43	2.47	0.69	0.86	1.06	0.57	0.66	0.60
	Event 2	2.31	2.46	1.96	1.67	2.47	3.36	1.36	2.02	2.70
	Event 3	1.05	1.27	1.57	0.77	1.12	1.59	0.74	1.11	1.56
	Event 4	1.17	1.76	1.96	0.69	0.93	1.15	0.62	1.04	1.48
	Event 5	2.74	3.33	3.73	1.36	2.11	3.05	1.21	1.91	2.76

4. 결 론

본 연구에서는 적대적 생성 신경망 기반의 DGMR 모델을 환경부 강우레이더 자료를 이용하여 학습하고, 강우예측을 수행하여 강우장의 생성 가능성을 고려할 수 있는 딥러닝 모델의 활용성을 검토하였다. 예측성능은 기존 시간 연속을 고려하는 딥러닝 모델인 ConvLSTM U-Net과 환경부에서 생산하고 있는 강우예측 결과를 기준으로 비교하였다. 2021년 8월의 5개의 호우사례를 선정하여 학습된 DGMR과 ConvLSTM2D U-Net을 이용하여 강우예측을 수행하였으며, HFC QPF와의 예측성능 비교를 수행하였다. 도식적인 분석 결과, HFC QPF는 강우의 발달 및 쇠약을 반영하지 못하였으며, ConvLSTM2D U-Net은 대체적으로 강우영역이 축소되는 경향을 보였다. DGMR의 경우는 대체적으로 선행 60분까지는 강우 분포 위치가 관측강우와 가장 유사하였으나, 전체 영역에서 강한 강우가 발생한 사례에서는 강우가 지속적으로 발달하는 것으로 예측하는 경향이 있었다. CSI와 MAE를 이용한 평가 결과, DGMR 기법이 대부분 사례 에서 다른 두 예측기법을 능가하는 것으로 나타났다. 본 연구에서는 DGMR 기법이 효과적인 강우예측 기법임을 보여주었으나, 강우 이미지 생성 시 불확실성 역시 존재하는 것을 확인할 수 있었다. 다만, 이러한 적대적 생성 신경망 모형은 실제와 유사한 데이터를 생성하는 데 효과적이고 종종 생성된 데이터가 유사한 경향이 있다. 따라서 GAN 기법을 활용할 때 생성 데이터의 다양성을 개선하기 위한 방법의 적용이 필요하다. 이러한 방법에는모델 생성기의 입력에 랜덤 노이즈 벡터를 추가하는 방식, 생성기의 입력으로 변형 오토인코더의 샘플링된 잠재 벡터(latent vector)를 사용하는 방식, 생성기와 판별기 사이에 더 많은 계층(layer)을 추가하는 방식, 생성된 이미지와 실제 이미지 사이의 차이를 최소화하면서 생성된 이미지들 간 차이를 최대화하는 방식으로 판별기를 학습하는 등의 방식이 있다(Karras et al., 2017).

또한 최근에는 딥러닝 강우예측 기법에 물리적 해석을 반영하여 극한 호우와 긴 예측 선행시간에 대한 예측 정확도를 확보하는 연구들이 개발되고 있다(Espeholt et al., 2022; Zhang et al., 2023). 향후 연구에서는 임계강우 설정을 다양하게 하여 호우 특성과 강우강도별 모델을 최적화하는 방법과 선행 예측시간이 2시간 이상으로 길어질수록 정확도가 저하되는 한계를 물리기반의 수치예보모델 예측강우와 병합하거나 물리적 해석을 반영하는 기법을 적용하여 딥러닝 기반의 강우예측 기법을 개선할 계획이다.

Acknowledgements

본 논문은 한국수력원자력(주)에서 재원을 부담하여 한국건설기술연구원에서 수행한 연구결과입니다(No. 2018-기술-20).

Conflicts of Interest

The authors declare no conflict of interest.

References

Ayzel, G., Scheffer, T., and Heistermann, M. (2020). "RainNet v1.0: A convolutional neural network for radar-based precipitation nowcasting." Geoscientific Model Development, Vol. 13, pp. 2631-2644. 10.5194/gmd-13-2631-2020

Choi, S., and Kim, Y. (2022). "Rad-cGAN v1.0: Radar-based precipitation nowcasting model with conditional generative adversarial networks for multiple dam domains." Geoscientific Model Development, Vol. 15, No. 15, pp. 5967-5985. doi: 10.5194/gmd-15-5967-2022. 10.5194/gmd-15-5967-2022

Clark, A., Donahue, J., and Simonyan, K. (2019). "Adversarial video generation on complex datasets." arXiv:1907.06571. doi: 10.48550/arXiv.1907.06571. 10.48550/arXiv.1907.06571

Espeholt, L., Agrawal, S., Sønderby, C., Kumar, M., Heek, J., Bromberg, C., Gazen, C., Carver, R., Andrychowicz, M., Hickey, J., Bell, A., and Kalchbrenner, N., (2022). "Deep learning for twelve hour precipitation forecasts." Nature Communications, Vol. 13, 5145. doi: 10.1038/s41467-022-32483-x. 10.1038/s41467-022-32483-x36050311PMC9436943

Karras, T., Aila, T., Laine, S., and Lehtinen, J. (2017). "Progressive growing of gans for improved quality, stability, and variation." arXiv preprint arXiv:1710.10196.

Kim, Y., and Hong, S. (2022). "Very short-term rainfall prediction using ground radar observations and conditional generative adversarial networks," IEEE Transactions on Geoscience and Remote Sensing, Vol. 60, 4104308. doi: 10.1109/TGRS.2021.3108812. 10.1109/TGRS.2021.3108812

Lin, C., Vasic, S., Kilambi, A., Turner, B., and Zawadzki, I. (2005). "Precipitation forecast skill of numerical weather prediction mod?els and radar nowcasts." Geophysical Research Letters, Vol. 32, No. 14, L14801, doi: 10.1029/2005GL023451. 10.1029/2005GL023451

Palmer, T.N., and Räisänen, J. (2002). "Quantifying the risk of extreme seasonal precipitation events in a changing climate." Nature, Vol. 415, pp. 512-514. doi: 10.1038/415512a. 10.1038/415512a11823856

Ravuri, S., Lenc, K., Willson, M, Kangin, D., Lam, R., Mirowski, P., Fitzsimons, M., Athanassiadou, M., Kashem, S., Madge, S., Prudden, R., Mandhane, A., Clark, A., Brock, A., Simonyan, K., Hadsell, R., Robinson, N., Clancy, E., Arribas, A., and Mohamed, S. (2021). "Skilful precipitation nowcasting using deep generative models of radar." Nature, Vol. 597, pp. 672-677. doi: 10.1038/s41586-021-03854-z. 10.1038/s41586-021-03854-z34588668PMC8481123

Reichstein, M., Camps-Valls, G., Stevens, B., Jung, M., Denzler, J., Carvalhais, N., and Prabhat. (2019). "Deep learning and process understanding for data-driven Earth system science." Nature, Vol. 566, pp. 195-204. doi: 10.1038/s41586-019-0912-1. 10.1038/s41586-019-0912-130760912

Richardson, D.S. (2000). " Skill and relative economic value of the ECMWF ensemble prediction system." Quarterly Journal of the Royal Meteorological Society, Vol. 126, pp. 649-667. 10.1002/qj.49712656313

Seo, H.Y., Lee, G.H., Hyein, M.S., and Won, Y.S. (2020). "Current status of improvement of rainfall radar utilization." Water for future, Korea Water Resources Association, Vol. 53, p. 35-45.

Shi, X., Chen, Z., Wang, H., Yeung, D., Wong, W., and Woo, W. (2015). "Convolutional LSTM Network: A machine learning approach for precipitation nowcasting." In Proceedings of the 28th International Conference on Neural Information Processing Systems - Volume 1 (NIPS'15), Montreal, Canada, MIT Press, Cambridge, MA, U.S., pp. 802-810.

Shi, X., Gao, Z., Lausen, L., Wang, H., Yeung D., Wong, W., and Woo, W. (2017). "Deep learning for precipitation nowcasting: A benchmark and a new model." 31st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, CA, U.S.

Shin, H.J., Yoon, S.S., and Choi, J.M. (2021). "Radar rainfall prediction based on deep learning considering temporal consistency." Journal of Korea Water Resources Association, Vol. 54, No. 5, pp. 301-309. 10.3741/JKWRA.2021.54.5.301

Sun, J., Xue, M., Wilson, J.W., Zawadzki, I., Ballard, S.P., OnvleeHooimeyer, J., Joe, P., Barker, D.M., Li, P.-W., Golding, B., Xu, M., and Pinto, J. (2014). "Use of NWP for nowcasting convective precipitation: recent progress and challenges." Bulletin of the American Meteorological Society, Vol. 95, No. 3 pp. 409-426, doi: 10.1175/BAMS-D-11-00263.1. 10.1175/BAMS-D-11-00263.1

Tran, Q.K., and Song, S.K. (2019). "Computer vision in precipitation nowcasting: applying image quality assessment metrics for training deep neural networks." Atmosphere, Vol. 10, No. 5, 244. doi: 10.3390/atmos10050244. 10.3390/atmos10050244

Turner, B.J., Zawadzki, I., and Germann, U. (2004). "Predictability of precipitation from continental radar images. Part III: Operational Nowcasting Implementation (MAPLE)." Journal of Applied Meteorology, Vol. 43, No. 2, pp. 231-248. 10.1175/1520-0450(2004)043<0231:POPFCR>2.0.CO;2

Xie, P.F., Li, X.T., Ji, X.Y., Chen, X.L., Chen, Y.Z., Liu, J., and Ye, Y.M. (2022). "An energy-based generative adversarial forecaster for radar echo map extrapolation." IEEE Geoscience and Remote Sensing Letters, Vol. 19, 3500505. doi: 10.1109/lgrs.2020.3023950. 10.1109/LGRS.2020.3023950

Yoon, S.S., Park, H.S., and Shin, H.J. (2020). "Very short-term rainfall prediction based on radar image learning using deep neural network." Journal of Korea Water Resources Association, Vol. 53, No. 12, pp. 1159-1172.

Zhang, Y., Long, M., Chen, K, Xing, L., Jin, R., Jordan, M.I., and Wang, J. (2023). "Skilful nowcasting of extreme precipitation with NowcastNet." Nature, Vol. 619, pp. 526-532. doi: 10.1038/s41586-023-06184-4 10.1038/s41586-023-06184-437407824PMC10356617

Zheng, K., Liu, Y., Zhang, J.B., Luo, C., Tang, S.Y., Ruan, H.H., Tan, Q.Y., Yi, Y.L., and Ran, X.T. (2022). "GAN-argcPredNet v1.0: A generative adversarial model for radar echo extrapolation based on convolutional recurrent units." Geoscientific Model Development, Vol. 15, No. 4, pp. 1467-1475. doi: 10.5194/ gmd-15-1467-2022. 10.5194/gmd-15-1467-2022

Journal of Korea Water Resources Association ISSN:2799-8746(Print) 2799-8754(Online) 한국수자원학회 논문집

Preview

Radar-based rainfall prediction using generative adversarial network

ABSTRACT

MAIN

Fig. 1.

Study area

Fig. 2.

Modified DGMR overview (Ravuri et al., 2021)

(1)

(2)

(3)

(4)

Fig. 3.

Model training result of each epoch ((a): Training, (b): Validation)

Table 1.

Characteristics of the evaluated events

Fig. 4.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 07:00 14 August 2021)

Fig. 5.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 12:10 21 August 2021)

Fig. 6.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 18:00 23 August 2021)

Fig. 7.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 03:20 29 August 2021)

Fig. 8.

Forecasted radar rainfall distributions for lead time from 10 to 180 minutes (predicted at 16:40 31 August 2021)

Fig. 9.

Mean Absolute Error (MAE) and Critical Success Index (CSI) for 0.1 mm/hr thresholds. The metrics are shown as a function of lead time for DGMR, ConvLSTM2D U-Net, HFC-QPF. All values represent the average of the corresponding metric over each event

Table 2.

Evaluation of QPF accuracy

Acknowledgements

Conflicts of Interest

References