Impact of an ensemble of artificial intelligence models on improving groundwater level prediction in mid-mountainous region of Jeju Island

Mun-Ju Shin; Jeong-Hun Kim; Jeong Wook Kim; Hyuk Joon Koh; Soo-Hyoung Moon

doi:10.3741/JKWRA.2025.58.10.911

Preview

Research Article

Journal of Korea Water Resources Association. 31 October 2025. 911-926
https://doi.org/10.3741/JKWRA.2025.58.10.911

Impact of an ensemble of artificial intelligence models on improving groundwater level prediction in mid-mountainous region of Jeju Island

인공지능 모델의 앙상블이 제주도 중산간지역 지하수위 예측 향상에 미치는 영향

Mun-Ju Shin^a^*

Jeong-Hun Kim^b

Jeong Wook Kim^c

Hyuk Joon Koh^d

Soo-Hyoung Moon^e

신 문주^a^*

김 정훈^b

김 정욱^c

고 혁준^d

문 수형^e

^aSenior Researcher, Drinking Water Research Laboratory, Jeju Special Self-Governing Province Development Corporation, Jeju, Korea

^bResearcher, Drinking Water Research Laboratory, Jeju Special Self-Governing Province Development Corporation, Jeju, Korea

^cResearcher, Drinking Water Research Laboratory, Jeju Special Self-Governing Province Development Corporation, Jeju, Korea

^dChief Researcher, Drinking Water Research Laboratory, Jeju Special Self-Governing Province Development Corporation, Jeju, Korea

^eDirector, R&D Innovation Division, Jeju Special Self-Governing Province Development Corporation, Jeju, Korea

^a제주특별자치도개발공사 먹는물연구소 선임연구원

^b제주특별자치도개발공사 먹는물연구소 연구원

^c제주특별자치도개발공사 먹는물연구소 연구원

^d제주특별자치도개발공사 먹는물연구소 책임연구원

^e제주특별자치도개발공사 R&D혁신본부 본부장

^{*Corresponding Author}

License (open-access, https://creativecommons.org/licenses/by/4.0):

©It is identical to the Creative Commons Attribution Non-commercial License (https://creativecommons.org/licenses/by/4.0)

ABSTRACT

Groundwater is a water resource that can be used for various purposes along with surface water. In the case of Jeju Island, groundwater is an essential water resource, so accurate groundwater level prediction and management for the distant future are necessary for sustainable groundwater use. In this study, groundwater levels were predicted using three artificial intelligence(LSTM, GRU, ANN) models for accurate long-term(1-3 months) future monthly groundwater level predictions for two groundwater level monitoring wells located in the mid-mountainous region of the Pyoseon watershed in Jeju Island. Afterwards, an ensemble model was used to analyze the improvement in groundwater level prediction for the entire data period and the low groundwater level period(November to May). As a result, the AI models and the ensemble model appropriately predicted future groundwater levels(1 to 3 months) for the entire data period, and the ensemble model showed higher prediction performance than the individual AI models. The superiority of the groundwater level prediction performance of the three AI models varied by monitoring well and future prediction period, and a specific AI model did not always show the highest groundwater level prediction performance. Therefore, for more improved groundwater level prediction, an ensemble model that utilizes the results of different artificial intelligence models is needed. The groundwater level prediction performance for the low groundwater level period was higher than that for the entire data period. This means that the AI models and the ensemble model are more suitable for groundwater level prediction during the low groundwater level period, which mostly corresponds to the groundwater level recession curve period. In particular, the ensemble model showed an appropriate NSE value of 0.7184 or higher for 3-month predictions, and this model produced prediction results with an NSE value that was improved by up to 0.1434 compared to individual AI models. This supports the importance and necessity of using ensemble models for accurate prediction of low groundwater levels in the distant future.

Keywords

Improvement of long-term groundwater level prediction

LSTM

GRU

ANN

Ensemble

지하수는 지표수와 함께 다양한 용수로 사용할 수 있는 수자원이며, 제주도의 경우 지하수는 필수불가결한 수자원이므로 지속가능한 지하수 이용을 위해 가능한 먼 미래의 정확한 지하수위 예측 및 관리가 필요하다. 본 연구에서는 제주도 내 표선유역 중산간지역에 위치한 2개 지하수위 관측정에 대해 정확한 장기간(1~3개월) 미래 월단위 지하수위 예측을 위해 3개 인공지능(LSTM, GRU, ANN) 모델을 사용하여 지하수위를 예측하고, 앙상블 모델을 사용하여 지하수위 예측 개선효과를 전체 데이터 기간과 낮은 지하수위 기간(11~5월)에 대해 분석하였다. 그 결과, 전체 데이터 기간에 대해 인공지능 모델과 앙상블 모델은 1~3개월 미래 지하수위를 적절히 예측하였으며, 앙상블 모델은 개별 인공지능 모델보다 높은 예측성능을 나타냈다. 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 달라 특정 인공지능 모델이 항상 가장 높은 지하수위 예측성능을 나타내지 않았으며, 따라서 더욱 개선된 지하수위 예측을 위해서는 서로 다른 인공지능 모델의 결과를 활용하는 앙상블 모델이 필요하다. 낮은 지하수위 기간에 대한 지하수위 예측성능은 전체 데이터 기간에 대한 결과보다 높았으며, 이것은 인공지능 모델과 앙상블 모델이 대부분 지하수위 감수곡선 기간에 해당하는 낮은 지하수위 기간의 지하수위 예측에 대해 더욱 적합하다는 것을 의미한다. 특히, 앙상블 모델은 3개월 예측에 대해 0.7184 이상의 적절한 NSE 값을 나타내었으며, 개별 인공지능 모델 대비 NSE 값이 최대 0.1434만큼 개선된 예측결과를 도출하였다. 이것은 먼 미래 낮은 지하수위의 보다 정확한 예측을 위한 앙상블 모델 사용의 중요성 및 필요성을 뒷받침한다.

키워드

장기 지하수위 예측 개선

LSTM

GRU

ANN

앙상블

MAIN

1. 서 론
2. 자료 및 방법
2.1 연구대상 지역 및 자료
2.2 인공지능 모델
2.3 연구 방법
3. 결과 및 고찰
3.1 전체 데이터 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
3.2 낮은 지하수위 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
3.3 앙상블 모델의 지하수위 예측성능 개선효과 분석
4. 결 론

1. 서 론

지하수는 지표수와 함께 생활용수, 농업용수 및 공업용수 등으로 사용할 수 있는 수자원이며, 기후변화 시대에 수자원 확보에 있어 그 중요성이 더욱 증가하고 있다. 제주도의 경우 지하수는 전체 수자원의 82%를 차지하므로(JSSGP, 2022) 지속가능한 지하수자원의 이용을 위해 지하수량의 예측 및 관리는 중요하다. 특히 지하수의 안정적인 사용을 위한 선제적인 취수량 관리를 위해서는 가능한 먼 미래의 정확한 지하수위 예측 연구가 반드시 필요하다.

지하수위 변동성을 예측하기 위해 물리적 기반 개념모델과 MODFLOW (McDonald and Harbaugh, 1988) 등 지하수 수치모델을 사용할 수 있다(Mohanty et al., 2013; Bizhanimanzar et al., 2019). 하지만 이러한 프로세스 기반 모델은 대수층의 특성, 지하 지질 및 지형 등 수문지질학적 시공간 데이터의 충분한 가용 여부와 품질에 따라 모의결과의 정밀성과 정확성이 달라지므로 데이터의 취득이 제한된 지역의 경우 모의 결과의 신뢰성은 제한된다(Adamowski and Chan, 2011; Barthel and Banzhaf, 2016; Sun et al., 2016; Tao et al., 2022). 만약, 수문지질학적 시공간 데이터의 취득에 제한이 있거나 시공간적인 수문학적 프로세스의 이해보다 특정 지점의 정확한 지하수위 예측이 주된 연구의 목적인 경우에는 데이터 기반 블랙박스 모델인 인공지능 모델의 활용이 적합하다(Adamowski and Chan, 2011).

인공지능 모델은 지하수위 예측을 위해 전 세계적으로 다양한 연구에서 성공적으로 사용되었다(Rajaee et al., 2019; Tao et al., 2022). 국외에서는 인공신경망 모델(Artificial Neural Network, ANN)(Lallahem et al., 2005), 유전자 프로그래밍(Genetic Programming)(Fallah-Mehdipour et al., 2013), 지원 벡터 머신(Support Vector Machine, SVM)(Gong et al., 2016), 극단 학습 머신(Extreme Learning Machine)(Alizamir et al., 2018), 퍼지 기반 모델(Adaptive Neuro Fuzzy Inference System, ANFIS)(Jeihouni et al., 2019), 트리 기반 모델(Random Forest)(Davoudi Moghaddam et al., 2020) 등이 지하수위 예측을 위해 널리 사용되었다. 최근에는 순환신경망을 사용하는 딥러닝 인공지능 모델인 게이트 순환 유닛(Gated Recurrent Unit, GRU)(Gharehbaghi et al., 2022) 모델과 장단기기억(Long Short-Term Memory, LSTM)(Kow et al., 2024) 모델 등이 지하수위 예측을 위해 적용되었다. 국내에서도 지하수위 예측을 위해 ANN, SVM, ANFIS, GRU, LSTM 등의 인공지능 모델을 사용한 연구를 지속적으로 수행하였으나 국외 연구 사례보다는 상대적으로 적은 편이다(Yoon et al., 2011, 2013, 2014, 2016; Park and Chung, 2020; Kim et al., 2021; Jeong and Jeong, 2024). 특히, LSTM, GRU 및 ANN 모델은 지하수위 예측을 포함한 다양한 수문학 및 수자원분야 연구에 사용된 빈도가 매우 높으며(Sit et al., 2020) 점차 증가하는 추세이다. 이와 더불어 개별 인공지능 모델에 의한 지하수위 예측 결과를 더욱 개선하기 위해 앙상블 기법을 적용한 연구가 수행되었다(Afan et al., 2021; Roy et al., 2021). Afan et al. (2021)은 ANN 모델에 Bagging 기법 적용을 통해 도출된 다양한 데이터 샘플 기반 지하수위 예측 결과들을 사용하여 앙상블 모델을 개발한 결과 앙상블 모델이 ANN 모델보다 일반적으로 더 높은 지하수위 예측능력을 보인다고 제시하였고, Roy et al. (2021)은 ANFIS 모델에 3개의 최적화 기법 적용을 통해 도출된 지하수위 예측 결과들을 사용하여 앙상블 모델을 개발한 결과 앙상블 모델이 개별 ANFIS 모델보다 더 높은 지하수위 예측성능을 도출하는 것을 확인하였다. 하지만 일반적으로 높은 예측성능을 보이는 LSTM과 GRU 모델 등 다양한 딥러닝 인공지능 모델을 사용한 앙상블 모델 개발 및 활용 연구사례는 카르스트 지역에 대한 샘물 유출량 예측(Zhou and Zhang, 2023) 등이 있으나 지하수위 예측에 대한 연구사례는 충분하지 않다는 한계가 있다.

제주도의 중산간 지역은 오랜 기간 동안 수차례의 화산활동에 의해 지층이 겹겹이 쌓여 지하지질이 매우 복잡하게 형성되어 있으며, 이로 인해 인근 지역의 관측정이라 하더라도 지표면부터 대수층까지 형성된 두꺼운 화산지층의 수리지질학적 특성이 서로 달라 지하수위의 변동특성이 서로 다르다. 또한 유역의 상류지역에 해당하는 한라산 국립공원 지역의 경우 지하지질에 대한 데이터가 충분하지 않아 프로세스 기반 모델에 필요한 데이터의 취득에 한계가 있다. 선행 연구로 인공지능 모델을 적용한 섬 지역의 지하수위 예측 연구가 있었지만(Mohanty et al., 2010; Payne et al., 2022; Kim et al., 2023) 섬 지역의 정확한 장기간 지하수위 예측을 위해 딥러닝을 포함한 다양한 인공지능 모델 및 앙상블 모델을 적용한 연구는 충분하지 않다.

본 연구의 목적은 제주도 내 표선유역 중산간지역에 위치한 2개 지하수위 관측정에 대해 정확한 장기간 미래 월단위 지하수위 예측을 위해 딥러닝을 포함한 3개 인공지능 모델을 사용하여 지하수위를 예측하고 앙상블 모델을 사용하여 지하수위 예측성능의 개선효과를 비교분석 하는 것에 있다. 인공지능 모델은 수문학 및 수자원분야 연구에 널리 사용되고 있는 LSTM, GRU 및 ANN 모델을 사용하였다. 앙상블 모델 구축을 위해 각각의 인공지능 모델 결과의 중요도에 따라 다른 가중치를 주는 가중평균 앙상블 기법을 적용하였다. 기존 연구와의 차이점으로 본 연구에서는 장기간 지하수위 예측성능을 개선하기 위해 딥러닝을 포함한 3개 인공지능 모델을 사용하여 앙상블 모델을 개발한다는 점과, 극한 가뭄 등에 선제적인 대응을 위한 최저 지하수위 예측 등 낮은 지하수위의 예측이 중요하므로 낮은 지하수위 기간(11~5월)에 대한 예측 성능을 추가적으로 평가하여 더욱 정확한 지하수위 예측 기법 제공에 기여한다는 점에 있다. 본 연구의 연구방법은 2절에 설명하였으며 연구결과와 결론은 각각 3절과 4절에 기술하였다.

2. 자료 및 방법

2.1 연구대상 지역 및 자료

연구대상 지역은 대한민국 제주도 남동쪽 표선유역 내 중산간 지역에 위치한 2개 지하수위 관측정 지점이다(Fig. 1). 본 연구에 사용된 데이터는 연구대상 지역 인근의 2개 강우관측소(성판악, 교래) 일단위 강수량 데이터, 2개 지하수위 관측정 일단위 지하수위 데이터와 2개 지하수 취수원 일단위 취수량 데이터이다(Table 1). 이 일단위 데이터는 인공지능 모델을 이용한 월단위 지하수위 모의를 위해 월단위 데이터로 변환하였다. 성판악 강우관측소는 자동기상관측소(Automatic Weather System)로서 기상청(http://www.weather.go.kr/)에서 운영하고 있으며, 교래 강우관측소는 제주도 재난안전대책본부(http://bangjae.jeju119.go.kr/)에서 운영하고 있다. 본 연구에서 사용한 강우관측소들의 데이터는 해당 웹사이트에서 다운받아 사용할 수 있다. 제주특별자치도개발공사에서 실시간으로 관측 및 관리하고 있는 지하수위 및 취수량 데이터는 공개적으로 제공되지 않는 자료이다.

Table 1.

Period of precipitation, groundwater withdrawal and groundwater level data

Classification	Station name	Data period	Remarks
Rainfall station	Seongpanak	1992. 01. 01. ~ 2023. 12. 31.	Precipitation (mm/day)
Rainfall station	Gyorae	1992. 01. 01. ~ 2023. 12. 31.	Precipitation (mm/day)
Pumping well	PW1	2001. 01. 01. ~ 2023. 12. 31.	Pumping rate (m³/day)
Pumping well	PW2	2013. 07. 31. ~ 2023. 12. 31.	Pumping rate (m³/day)
Monitoring well	MW1	2015. 05. 13. ~ 2023. 12. 31.	Groundwater level (m/day)
Monitoring well	MW2	2012. 03. 13. ~ 2023. 12. 31.	Groundwater level (m/day)

성판악 강우관측소의 일단위 강수량은 전반적으로 교래 강우관측소의 일단위 강수량보다 많은 것을 확인할 수 있다(Figs. 2 and 3). 이것은 성판악 강우관측소(El. 763 m)의 고도가 교래 강우관측소(El. 400 m)의 고도보다 높아(Fig. 1) 산지효과로 인해 더 많은 강수량을 나타내는 것으로 판단된다. 관측정1(MW1)과 관측정2(MW2)의 이격거리는 직선거리로 약 1.2km 이며, 관측정1의 표고는 관측정2의 표고보다 낮다(Fig. 1). 하지만, 관측정1의 지하수위는 관측정2의 지하수위보다 높게 형성되어 있으며, 일단위 지하수위 최대 변동폭의 경우 관측정1은 42.5 m 이고 관측정2는 17.5 m 로 나타나 25 m의 차이를 보인다(Fig. 4). 이러한 현상은 제주도에서 발생한 수차례 화산활동이 복잡한 지하지질을 형성하여 관정별 수리지질학적 특성에 영향을 미치기 때문인 것으로 판단된다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F1.jpg

Fig. 1.

Schematic diagram of the locations of precipitation observation stations, groundwater withdrawal wells, and groundwater level monitoring wells

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F2.jpg

Fig. 2.

Comparison of precipitation at Seongpanak and Gyorae rainfall stations

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F3.jpg

Fig. 3.

Precipitation time series data from Seongpanak and Gyorae rainfall stations

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F4.jpg

Fig. 4.

Fluctuation range of groundwater level in groundwater level monitoring wells

2.2 인공지능 모델

2.2.1 장단기기억 모델

장단기기억(LSTM)(Hochreiter and Schmidhuber, 1997) 모델은 순환신경망 모델의 일종으로 인공지능 모델이 시계열 데이터 정보의 학습 시 장기간 데이터의 기억을 위한 능력(long- term dependencies)을 저해하는 경사소멸(vanishing gradients) 문제(Bengio et al., 1994)를 해결하기 위해 개발된 딥러닝 인공지능이다. 이 모델은 최근 지하수 및 지표수 예측 등 다양한 수자원 연구 분야에 널리 사용되고 있다(Müller et al., 2021; Sun et al., 2022; Gholizadeh et al., 2023; Kow et al., 2024; Han et al., 2025). LSTM 모델은 장기간 데이터의 기억을 위해 carry track이라는 독특한 기능을 사용한다. 이 carry track은 일종의 컨베이어벨트로 시계열 데이터 내의 각 계산시간(time step, t)에서 추출한 정보를 장기간 저장한다(Fig. 5). 따라서 데이터에서 추출한 정보를 시계열 데이터의 시간대별 처리 과정과 평행하게 배치한 carry track을 통해 이동시키고, 각 계산 시간대에서 필요할 때마다 추출한 정보를 재사용한다. 이 과정을 통해 LSTM 모델은 장기간 시계열 데이터 모의 시 오래된 정보가 사라지는 문제를 해결한다(Chollet and Allaire, 2018). LSTM 모델은 데이터 내 장기간의 정보를 학습 시 아래와 같은 네 가지 변환을 사용한다. 이 모델 내 각 뉴런에서 t 시간대의 결과( $o u t p u t_{t}$ )는 아래와 같이 계산된다.

(1)

{output}_{t} = activation (W o ∙ {input}_{t} + U o ∙ {state}_{t} + V o ∙ c_{t} + b o)

여기에서 ${input}_{t}$ 는 t 시간대의 입력 데이터, ${state}_{t}$ 는 t 시간대의 상태로써 t-1 시간대의 결과의 상태, $c_{t}$ 는 t 시간대의 carry 값, $W o$ , $U o$ , $V o$ 는 결과 계산을 위한 ${input}_{t}$ , ${state}_{t}$ , $c_{t}$ 각각의 가중치 행렬, •은 내적(dot product)을 의미한다. 가중치는 LSTM 모델의 매개변수이고, $b o$ 는 뉴런의 편이이며, $activation$ 은 sigmoid 함수와 tanh 함수를 사용하는 활성화함수이다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F5.jpg

Fig. 5.

The structure of LSTM model (Shin et al., 2020)

carry 값은 아래와 같은 세 가지의 개별적인 변환을 통해 업데이트된다.

(2)

i_{t} = sigmoid (W i ∙ {input}_{t} + U i ∙ {state}_{t} + b i)

(3)

f_{t} = sigmoid (W f ∙ {input}_{t} + U f ∙ {state}_{t} + b f)

(4)

k_{t} = tanh (W k ∙ {input}_{t} + U k ∙ {state}_{t} + b k)

(5)

c_{t + 1} = i_{t} k_{t} + c_{t} f_{t}

여기에서 $i_{t}$ 는 sigmoid 함수([0, 1]의 범위)를 통해 새롭게 추가된 정보, $f_{t}$ 는 sigmoid 함수를 통해 삭제된 정보, $k_{t}$ 는 $t a n h$ 함수([-1, 1]의 범위)를 통한 정보의 중요도를 나타낸다. 따라서, $i_{t}$ 와 $k_{t}$ 를 곱하여 새로운 정보를 얻고, $c_{t}$ 와 $f_{t}$ 를 곱하여 연관성이 없는 carry 내 정보를 제거하며, $i_{t} k_{t}$ 와 $c_{t} f_{t}$ 를 더하여 새로운 carry 값을 계산한다. LSTM 모델의 특징은 carry track 기능을 사용하여 다음 번 출력과 다음 번 상태를 변조한다는 점에 있다(Chollet and Allaire, 2018).

2.2.2 게이트 순환 유닛 모델

게이트 순환 유닛(GRU)(Cho et al., 2014) 모델은 LSTM 모델로부터 영감을 받아 개발된 딥러닝 인공지능 모델로, 순환신경망을 사용하여 출력값을 해당 뉴런에 다시 입력함으로써 모의결과를 개선하는 모델이다. 이 모델은 LSTM 모델과 함께 최근 지하수 및 지표수 예측 등 다양한 수자원 연구 분야에 널리 사용되고 있다(Zhang et al., 2021; Gharehbaghi et al., 2022; Nan et al., 2023; Huan, 2024; Chidepudi et al, 2025). GRU 모델은 LSTM 모델과 같은 원리로 작동하며, 구조가 다소 간단하여 LSTM 모델만큼 데이터 해석 능력은 나타내지 못하지만 더욱 빠르게 연산할 수 있다는 장점이 있다(Chollet and Allaire, 2018). GRU 모델은 LSTM 모델의 구조를 단순화함으로 인해 많은 매개변수로 인한 학습기간의 모의결과가 과적합되어 검증기간의 모의성능이 낮아지는 단점을 개선할 수 있다. GRU 모델은 reset gate ( $r_{t}$ )와 update gate ( $z_{t}$ )라는 두 개의 연산 프로세스를 사용한다(Fig. 6). reset gate와 update gate는 각각 현재로부터 가까운 기간과 먼 기간 정보를 학습하여 모사할 때 더욱 활성화 된다(Cho et al., 2014; Lin et al., 2022). reset gate는 이전 상태를 얼마나 잊어야 하는지를 결정하며(0에서 1의 범위), reset gate의 값이 0에 가까울수록 이전 상태의 정보를 잊고 현재 입력정보를 가져온다(Cho et al., 2014). update gate는 이전 상태의 정보를 얼마나 가져와야 할지를 결정하며(0에서 1의 범위), LSTM 모델의 forget gate와 input gate가 결합한 memory cell과 비슷한 역할을 함으로써 장기간 정보를 기억하는데 도움을 준다(Cho et al., 2014). update gate의 값이 1에 가까울수록 이전 상태의 정보를 우선적으로 가져오고, 0에 가까울수록 새로운 정보를 우선적으로 가져온다. 만약 update gate의 값이 1일 경우 1- $z_{t}$ 연산을 통과한 신호는 0이 되어 새로운 정보는 사용되지 않으며, 값이 0일 경우 이전 상태의 정보는 사용되지 않고 새로운 정보만 사용된다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F6.jpg

Fig. 6.

The structure of GRU model

GRU 모델의 연산구조는 아래 식과 같이 나타낼 수 있다(Cho et al., 2014).

(6)

r_{t} = σ (W r i n p u t_{t} + U r s t a t e_{t - 1} + b r)

(7)

z_{t} = σ (W z i n p u t_{t} + U z ` ` s t a t e_{t - 1} + b z)

(8)

g_{t} = tanh (W_{g} {input}_{t} + U g (r_{t} ∙ {state}_{t - 1}) + b g)

(9)

{output}_{t} = z_{t} ∙ {state}_{t - 1} + (1 - z_{t}) ∙ g_{t}

여기에서 ${input}_{t}$ 는 t 시간대의 입력자료, ${state}_{t - 1}$ 는 t-1 시간대의 결과의 상태, $W$ 와 $U$ 는 결과계산을 위한 ${input}_{t}$ 와 ${state}_{t - 1}$ 각각의 가중치 행렬, $b$ 는 가중치 행렬에 뒤따르는 편이(bias), 𝜎는 sigmoid함수, $t a n h$ 는 hyperbolic tangent 함수, •은 내적(dot product), $o u t p u t_{t}$ 는 t 시간대의 결과를 의미한다.

2.2.3 인공신경망 모델

인공신경망(ANN) 모델은 순전파(feed-forward) 모델로 인간 뇌의 수많은 뉴런과 시냅스의 결합을 통해 반응을 전달하는 구조를 모방한 기계학습 방법으로서 복잡한 비선형적인 문제들을 병렬적 학습을 통해 효율적으로 자연현상을 모사한다(Haykin, 2009). 지하수 및 지표수 모의 등 수자원 분야에 널리 사용되어 온 ANN 모델(Yin et al., 2021; Kim and Lee, 2022; Seidu et al., 2023; Mirzaei and Shirmohammadi, 2024; Sušanj Čule et al., 2025)은 복수의 입력변수들을 수많은 뉴런(노드)로 연결된 네트워크를 사용하여 목표변수를 모의함으로써 비선형적인 자연현상을 모사한다(Adamowski and Chan, 2011). 즉, 이 모델은 복수의 입력 관측 시계열 데이터와 목표 관측 시계열 데이터 간의 상관관계를 이용하여 목표 관측 시계열 데이터를 모사한다(Jha and Sahoo, 2014). ANN 모델은 입력층(input layer), 단수 또는 복수의 은닉층(hidden layer), 출력층(output layer)의 순서로 구성된다(Fig. 7). 각 층에는 단수 또는 복수의 뉴런으로 구성된다. 계산 과정으로 입력층의 입력변수 값에 가중치(매개변수)를 곱하고 편이(bias)를 더한 값에 활성화함수를 곱한 값을 다음 층에 전달하며, 이 과정을 출력층까지 순차적으로 수행하여 목표 관측 시계열 데이터를 모사하는 최종 출력값을 계산한다. ANN 모델의 계산과정은 아래 식과 같이 나타낼 수 있다(Kim and Valdés, 2003).

(10)

\hat{y_{k}} = f_{o} [\sum_{j = 1}^{m} w_{k j} \cdot f_{h} (\sum_{i = 1}^{n} w_{j i} x_{i} + w_{j o}) + w_{k o}]

여기에서 $w_{j i}$ 는 입력층의 $i$ 번째 뉴런에서 은닉층의 $j$ 번째 뉴런으로의 연결강도(가중치), $x_{i}$ 는 입력층의 $i$ 번째 입력변수, $w_{j o}$ 는 $j$ 번째 은닉뉴런의 편이, $f_{h}$ 는 은닉뉴런의 활성화함수, $w_{k j}$ 는 은닉층의 $j$ 번째 뉴런에서 출력층의 $k$ 번째 뉴런으로의 연결강도, $w_{k o}$ 는 $k$ 번째 출력뉴런의 편이, $f_{o}$ 는 출력뉴런의 활성화함수, $\hat{y_{k}}$ 는 출력변수로써 모의결과를 나타낸다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F7.jpg

Fig. 7.

The structure of ANN model (Shin et al., 2021)

ANN 모델의 학습을 위해 매개변수인 가중치들은 역전파(backpropagation) 알고리즘(Rumelhart et al., 1986)을 통해 모의 시계열 결과와 관측 시계열 데이터 간의 오차가 최소화 되도록 최적의 값으로 업데이트된다(Haykin, 2009). 회귀모델에서 절편의 역할을 하는 뉴런의 편이는 가중된 입력신호의 합을 증가 또는 감소시키는 역할을 한다(Haykin, 2009; Sahoo et al., 2017). 은닉뉴련의 활성화함수로 최근 다양한 인공지능 연구에 사용되는 Rectified Linear Unit(ReLU)(Hahnloser et al., 2000)를 적용하였다. 본 연구에서는 R 언어 기반 딥러닝 프레임워크인 Keras 패키지(Falbel et al., 2019)에서 제공하는 ANN, LSTM 및 GRU 모델을 사용하였다.

2.2.4 앙상블 모델

본 연구에서는 지하수위 예측 향상을 위해 가중평균(weighted average) 앙상블 모델을 적용하였다. 앙상블이란 복수의 모델의 결과를 결합하여 개선된 결과를 도출하는 기법(Afan et al., 2021)으로써, 1개의 모델을 사용하는 것보다 복수의 모델의 결과에서 정보를 추출하는 것이 더욱 신뢰할 만한 결과를 도출한다(Yin and Tsai, 2018; Yin et al., 2021). 결과의 중요도에 따라 각각의 모델의 결과에 다른 가중치 계수를 부여하는 가중평균 앙상블은 각각의 모델의 결과에 동일한 가중치를 주는 단순평균(simple average) 앙상블보다 더 나은 예측결과를 도출한다(Georgakakos et al., 2004; Kim et al., 2006; Roy et al., 2021). 인공지능 모델의 가중평균 앙상블은 아래 식과 같이 나타낼 수 있다.

(11)

Y_{t} = β_{0} + β_{M 1} F_{t, M 1} + β_{M 2} F_{t, M 2} + β_{M 3} F_{t, M 3}

여기에서 $Y_{t}$ 는 앙상블 모델의 시계열 결과, $β_{0}$ 는 조정계수(intercept), $β_{M 1}$ 는 첫 번째 인공지능 모델의 가중치계수, $F_{t, M 1}$ 는 첫 번째 인공지능 모델의 시계열 결과, $β_{M 2}$ 는 두 번째 인공지능 모델의 가중치계수, $F_{t, M 2}$ 는 두 번째 인공지능 모델의 시계열 결과, $β_{M 3}$ 는 세 번째 인공지능 모델의 가중치계수, $F_{t, M 3}$ 는 세 번째 인공지능 모델의 시계열 결과를 나타낸다.

본 연구에서 사용되는 인공지능 모델은 3개(LSTM, GRU 및 ANN)로써 가중평균 할 모델의 개수가 적으므로, 가중평균 앙상블을 위해 널리 사용되는 다중 선형 회귀(multiple linear regression) 모델을 사용하였다. 다중 선형 회귀식의 계수들은 아래에서 나타낸 최소제곱법(ordinary least-squares)을 사용하여 추정하였다.

(12)

Min (\sum_{t = 1}^{n} {(Y_{t} - {\hat{Y}}_{t})}^{2})

여기에서 ${\hat{Y}}_{t}$ 는 관측지하수위 시계열자료이며, 관측지하수위와 앙상블 모델의 시계열 결과의 차이인 잔차의 제곱합을 최소로 하는 계수를 추정하였다. 가중평균 앙상블 모델은 R 패키지의 통계 모듈에 있는 다중 선형 회귀모델을 사용하였다.

2.3 연구 방법

지하수위 변동특성이 서로 다른 2개 지하수위 관측정에 대해 인공지능 모델들과 앙상블 모델을 사용하여 미래 1~3개월 후 지하수위를 예측하였다. 각 관측정에 대한 인공지능 모델의 미래 지하수위 예측을 위한 입력자료로 과거 강수량, 취수량, 그리고 예측 대상 관측정의 지하수위 자료를 사용하였다. 예를 들어 미래 1개월 지하수위 예측의 경우, 관측정1의 2022년 1월 지하수위를 예측하기 위해 입력자료로 2021년 12월까지의 월단위 강수량, 취수량, 그리고 관측정1의 지하수위 자료를 입력자료로 사용하였다. 참고 사항으로, 변수별로 이전의 정보를 사용하기 위한 1개월(t-1), 2개월(t-2) 등 지체된 시계열자료(lag time)를 입력자료로 테스트한 결과 예측성능 개선에 미치는 영향이 미미하여 본 연구에 사용하지 않았다. 특히 순전파 모델인 ANN 모델과 달리 LSTM 모델과 같은 순환신경망 모델은 구조적으로 시계열 데이터 내 이전의 정보를 기억하는 능력이 있으므로(Zhang et al., 2018) 지체된 시계열자료의 추가적인 사용은 필요하지 않다. 또한 기온 및 잠재증발산량을 입력자료로 사용하지 않았는데 그 이유는 이 기상자료들을 입력자료로 테스트한 결과 지하수위 예측성능 개선에 미치는 영향이 거의 없었기 때문이다. 앙상블 모델의 각 인공지능(LSTM, GRU, ANN) 모델 대비 미래 1~3개월 후 지하수위 예측 개선 효과를 분석하였으며, 각 인공지능 모델의 지하수위 예측성능을 지하수위 관측정별로 비교분석하였다. 장기간 예측인 미래 3개월 후 지하수위 예측은 미래 1개월 후 지하수위 예측보다 선제적인 취수량 관리를 위한 준비기간 마련을 위해 필요하다. 결과 분석 시, 지하수위 관측정별로 전체 데이터 기간과 일반적으로 낮은 지하수위 기간(11~5월)에 대한 지하수위 모의결과를 사용하여 예측 성능을 통계분석 하였다. 극한 가뭄 등에 선제적으로 대응하기 위해서는 최저 지하수위 예측 등 낮은 지하수위 기간의 지하수위 예측이 중요하므로 낮은 지하수위 기간에 대한 예측 성능을 추가적으로 평가하였다. 여기에서 낮은 지하수위 기간이란 일반적인 건기(비 강수기)를 의미하며 제주도의 태풍에 따른 강우 시기와 두꺼운 화산암의 비포화대 지질특성에 따른 강우-지하수위 반응 시간 등의 특성을 고려하여 설정하였다.

인공지능 모델의 지하수위 관측정별 월단위 학습, 검증 및 테스트 기간은 서로 독립된 기간을 사용하였다. 관측정1과 관측정2의 학습기간은 각각 2015년 7월 ~ 2021년 12월, 2012년 7월 ~ 2021년 12월로 설정하였다. 검증기간은 관측정1과 관측정2 모두 2022년 1월 ~ 2022년 12월이며, 테스트기간은 관측정1과 관측정2 모두 2023년 1월 ~ 2023년 12월로 설정하였다. 사용된 월단위 강수량, 취수량, 지하수위 데이터의 샘플수는 관측정1의 경우 510개(5개 관측소), 관측정2의 경우 690개(5개 관측소)로 총 1200개이다. 사용된 데이터의 총 기간은 관측정1은 8.5년, 관측정2는 11.5년으로 짧아 충분한 학습을 위해 대부분의 데이터를 인공지능 모델의 학습과 검증에 사용하였다. 테스트 기간이 상대적으로 짧아 인공지능 모의성능 통계분석을 위해 사용되는 데이터의 개수가 적어 테스트 기간 모의성능에 대한 정확한 판단이 어려울 수 있다. 또한 3개 인공지능 모델의 전체기간(학습, 검증, 테스트) 지하수위 예측결과를 사용하여 앙상블 모델의 계수를 추정 및 지하수위를 예측하며, 앙상블 모델에 의한 전체적인 지하수위 예측성능 개선효과 분석이 본 연구의 목적이므로, 인공지능 모델과 앙상블 모델의 전체기간 모의결과를 사용하여 모의성능 통계값을 도출하였다.

3개 인공지능 모델의 학습절차는 다음과 같다(Fig. 8). 각 인공지능 모델은 활성화함수와 가중치(매개변수)를 사용하여 입력 시계열 데이터를 모의 지하수위 시계열 데이터로 변환한다. 그 후, 모의 지하수위 시계열 데이터와 관측 지하수위 시계열 데이터의 비교 과정을 통해 목적함수(loss function)를 계산한다. 본 연구에서 사용한 목적함수는 평균절대오차(mean absolute error)이다. 만약 모의 지하수위와 관측 지하수위 간의 큰 차이로 인해 목적함수 값이 크게 되면 역전파 알고리즘 기반 최적화기(optimizer)를 사용하여 모의 지하수위가 관측 지하수위에 가장 근사하도록(목적함수 값이 최소가 되도록) 가중치를 업데이트(학습)한다. 학습기간에 대한 인공지능 모의결과의 과적합(overfitting)을 방지하기 위해 본 연구에서는 콜백(callback) 기능과 드롭아웃(dropout) 기능을 사용하였다. 콜백 기능은 학습기간의 매개변수 보정과정 중에 추정된 매개변수를 검증기간에 대해 검증하여 학습 및 검증 기간의 모의결과가 모두 적절히 도출되도록 하기 위한 기법으로, 임의로 설정한 반복횟수(patience)만큼 학습기간에 대해 매개변수를 업데이트하여도 검증기간의 모의결과가 더 이상 개선되지 않을 때 학습을 조기종료(early-stopping) (Prechelt, 2012) 한다. 드롭아웃 기능은 인공지능 모델의 학습 시 은닉뉴런을 임의로 설정한 비율만큼 무작위로 비활성화시킴으로써 과적합 문제를 해결한다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F8.jpg

Fig. 8.

Groundwater level learning procedure of artificial intelligence models

인공지능 모델의 학습을 위해서는 매개변수(가중치)의 추정 이외에 모델 구축에 필요한 하이퍼매개변수(hyper-parameter) 값의 설정이 중요하다. 하이퍼매개변수 값의 설정에 대한 명확한 방법과 기준은 없으며(Chollet and Allaire, 2018), 본 연구에서는 시행착오 방법을 사용하여 설정하였다(Table 2). 인공지능 모델별로 2개의 은닉층을 사용하였으며, 충분한 학습을 위해 은닉층별 은닉뉴런의 개수(n_units)는 100개를 사용하였다. 은닉뉴런을 많이 사용할수록 데이터의 복잡한 특성을 충분히 학습할 수 있을 뿐만 아니라 목적함수 값의 수렴 속도가 빨라진다는 장점이 있다. 하지만 인공지능 모델의 연산시간이 증가하고 학습 중 과적합 문제가 발생할 수 있는 단점 또한 존재한다. 이러한 과적합 문제를 해결하기 위해 앞서 기술한 바와 같이 드롭아웃 및 콜백 기능을 사용하였다. 드롭아웃과 재귀적 드롭아웃(recurrent_dropout)의 비율은 각각 0.5로 설정하였으며 콜백 기능 사용을 위한 매개변수(가중치) 업데이트 반복횟수(patience)는 10으로 설정하였다. batch_size는 인공지능 모델이 효율적으로 학습하기 위해 한번에 처리할 수 있는 소규모 입력 시계열 데이터의 개수를 의미하며, 월단위 데이터의 길이를 고려하여 6개로 설정하였다. 인공지능 매개변수의 최적값을 추정하기 위해 딥러닝 분야에서 널리 사용되고 있는 최적화기인 Adam (Kingma and Ba, 2014)을 사용하였으며, 최적화기의 학습률(learning_rate)에는 0.001을 적용하였다. epoch는 전체 학습 데이터에 대해 매개변수를 1번 업데이트 하는 것을 의미하며, 효율적인 학습을 위해 최대 업데이트 횟수(n_epochs)에 50회를 적용하였다. 마지막 출력층에 대한 활성화 함수는 출력층으로 수신되는 입력신호를 그대로 출력신호로 전달하는 선형함수(Maier and Dandy, 2000)를 적용하였다.

Table 2.

Hyper-parameters of artificial intelligence models

Hyper- Parameter	Range	Setting Value	Description
n_units	-	100	Number of hidden units in hidden layer
batch_size	-	6	Number of samples fed to LSTM or GRU in one sub-simulation
dropout	0~1	0.5	Fraction of the units to drop for the linear transformation of the inputs
recurrent_dropout	0~1	0.5	Fraction of the units to drop for the linear transformation of the recurrent state in LSTM or GRU
learning_ rate	0.001~ 0.00001	0.001	Learning rate of Adam optimizer
n_epochs	-	50	Number of iterations
patience	-	10	Number of epochs for early termination of training when simulation values do not improve

인공지능 모델과 앙상블 모델의 예측성능 평가를 위해 수문학 분야에서 널리 사용되고 있는 평가지수인 Nash-Sutcliffe efficiency (NSE)(Nash and Sutcliffe, 1970)와 Root Mean Square Error (RMSE)를 사용하였다. NSE는 모의결과의 전반적인 적절성을 나타내며(Moriasi et al., 2007) RMSE는 모의 결과가 관측 데이터에 대해 근사한 정도를 나타낸다(Le et al., 2019). NSE와 RMSE는 아래의 식과 같이 나타낼 수 있다.

(13)

N S E = 1 - \frac{\sum_{i = 1}^{n} {(Q_{o b s, i} - Q_{s i m, i})}^{2}}{\sum_{i = 1}^{n} {(Q_{o b s, i} - \bar{Q_{o b s}})}^{2}}

(14)

R M S E = \sqrt{\frac{1}{n} \sum_{i = 1}^{n} {(Q_{o b s, i} - Q_{s i m, i})}^{2}}

여기에서 $n$ 은 시계열 데이터의 개수, $Q_{o b s, i}$ 와 $Q_{s i m, i}$ 는 각각 $i$ 시간대의 관측 및 모의 지하수위, $\bar{Q_{o b s}}$ 는 관측 지하수위의 평균값이다. NSE의 범위는 -∞에서 1이며, 모의 결과가 관측 데이터에 정확히 일치하는 경우 1의 값을 갖고, 모의 결과가 관측 데이터의 평균값과 동일한 경우 0의 값을 갖는다. RMSE는 모의 결과가 관측 데이터에 일치하는 경우 0의 값을 갖는다.

3. 결과 및 고찰

3.1 전체 데이터 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석

인공지능 모델과 앙상블 모델의 2개 관측정 지하수위에 대한 1~3개월 예측 결과는 Table 3과 같다. 이 결과는 2.3절에서 기술한 바와 같이 학습, 검증 및 테스트 기간을 포함한 전체 모의 기간 데이터를 사용한 통계값이다. 지하수위 변동폭이 상대적으로 큰 관측정1(MW1)의 경우 1개월 예측은 NSE 값이 0.8961 이상을 보여 높은 모의 성능을 나타내었다(Figs. 9(a) ~9(d)). 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 특히 저수위와 중수위에 대한 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 9(d)). 2개월 및 3개월 예측의 NSE 값은 각각 0.7154 및 0.5086 이상을 보여 적절한 모의 성능을 나타내었으며(Moriasi et al., 2007) 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 1.9940 m, 3.2622 m, 4.2650 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 3.8176 m의 RMSE 값을 나타내었다. 이 지하수위 예측성능은 관측정1의 월단위 관측 지하수위 최대 변동폭(26.2 m)을 고려 시 수용 가능하다고 판단된다. 관련 선행 연구 사례로, ANN 모델을 사용하여 관측 지하수위 최대 변동폭이 14 m인 이란의 Shiraz 평원에 대해 월단위 지하수위를 예측한 결과 약 2 m의 RMSE를 도출하였다(Rakhshandehroo et al., 2012).

Table 3.

Statistics on the groundwater level prediction performance of artificial intelligence models for the entire data period of the observation wells^a

Number of prediction months	Monitoring well	Performance statistics	LSTM	GRU	ANN	Ensemble
1	MW1	NSE	0.9136	0.8961	0.9056	0.9191
	MW1	RMSE	1.8181	1.9940	1.9014	1.7599
	MW2	NSE	0.9348	0.9300	0.9131	0.9469
	MW2	RMSE	0.7257	0.7521	0.8380	0.6547
2	MW1	NSE	0.7256	0.7154	0.7544	0.7731
	MW1	RMSE	3.2032	3.2622	3.0304	2.9128
	MW2	NSE	0.8061	0.8071	0.8126	0.8222
	MW2	RMSE	1.2540	1.2510	1.2329	1.2009
3	MW1	NSE	0.5086	0.5189	0.5872	0.6063
	MW1	RMSE	4.2650	4.2200	3.9091	3.8176
	MW2	NSE	0.6547	0.6529	0.6636	0.6791
	MW2	RMSE	1.6676	1.6720	1.6461	1.6075

^aBold and underlined numbers represent the best and worst results, respectively.

지하수위 변동폭이 상대적으로 작은 관측정2(MW2)의 경우 1개월 예측은 NSE 값이 0.9131 이상을 보여 높은 모의 성능을 나타내었다(Figs. 9(e)~9(h)). 관측정 1의 경우와 마찬가지로 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 9(h)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8061 및 0.6529 이상을 보여 적절한 모의 성능을 나타내었으며 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 0.8380 m, 1.2540 m, 1.6720 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 1.6075 m의 RMSE 값을 나타내었다. 이 RMSE 값은 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적절한 지하수위 예측능력을 도출하였다고 판단된다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F9.jpg

Fig. 9.

One-month-ahead groundwater level predictions from AI and ensemble models for the entire data period of two monitoring wells. 1 M represents one-month-ahead prediction

2개 관측정 모두 인공지능 모델 및 앙상블 모델의 지하수위 예측성능은 예측기간이 길어질수록 낮아졌다. 현재 데이터의 정보를 사용하여 미래의 지하수위를 예측하므로, 예측이 더욱 어려운 먼 미래의 지하수위를 예측할수록 예측성능이 낮아지는 현상은 예상된 결과라고 판단된다. 본 연구 대상 지역의 경우 Moriasi et al. (2007)의 적절성 평가 기준(NSE > 0.5)을 고려 시 최대 3개월까지 월단위 미래 지하수위의 예측이 가능하다고 판단된다. 그리고 Shin et al. (2024)의 연구에서 주장된 바와 같이 관측 지하수위의 변동폭이 상대적으로 크고 복잡한 관측정(MW1)의 지하수위 예측성능은 그 반대의 경우(MW2)보다 낮았다. 지하수위의 변동폭이 상대적으로 크고 복잡한 관측정에 대해 인공지능 모델의 지하수위 예측성능이 상대적으로 낮은 이유는, 제주도에서 발생한 수차례 화산활동에 의해 이 관측정 주변 지역에 복잡한 지하지질을 형성하여 이로 인한 복잡한 수리지질학적 특성이 상대적으로 크고 복잡한 지하수위를 형성함에 따라 인공지능 모델이 이러한 지하수위 변동 특성을 학습하기에 상대적으로 어렵기 때문인 것으로 판단된다.

주목할만한 점은 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 다르다는 점이다(Table 3). 관측정1(MW1)의 경우 1개월, 2개월, 3개월 예측에 대해 가장 낮은 예측성능을 보이는 인공지능 모델은 각각 GRU, GRU, LSTM이었으며, 관측정2(MW2)의 경우에는 각각 ANN, LSTM, GRU 모델이었다. 따라서 특정 인공지능 모델이 항상 가장 높은 지하수위 예측성능을 나타내는 것은 아니었으며, 모델의 구조가 상대적으로 단순한 ANN 모델이라도 항상 가장 낮은 예측성능을 도출하지는 않았다. 이것은 더욱 개선된 지하수위 예측을 위해서는 서로 다른 인공지능 모델의 결과를 활용하는 앙상블 모델이 필요하다는 것을 의미하며, 실제로 앙상블 모델은 3개 인공지능 모델보다 더욱 높은 예측결과를 도출하였다. 3개 인공지능 모델의 예측성능이 서로 다른 이유는 2.2절에서 기술한 바와 같이 인공지능 모델들 간의 구조적 차이점에 의한 것으로 판단된다. 특히 구조가 상대적으로 단순한 ANN 모델의 예측성능이 상대적으로 복잡한 LSTM 및 GRU 모델들의 예측성능과 대등한 점은 주목할 만한 사항이다. 앙상블 모델의 예측 성능이 3개 인공지능 모델보다 높은 이유는 상대적으로 낮은 예측성능을 보이는 결과들을 결합하는 앙상블 기법을 통해 더욱 강한 예측 알고리즘을 개발하기 때문인 것으로 판단된다(Afan et al., 2021; Yariyan et al., 2020).

3.2 낮은 지하수위 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석

2개 관측정 지하수위에 대해 인공지능 모델과 앙상블 모델의 전체 모의 기간 데이터 중 낮은 지하수위 기간(11~5월)의 결과를 추출하여 사용한 1~3개월 예측성능 통계 결과는 Table 4와 같다. 지하수위 변동폭이 상대적으로 큰 관측정1(MW1)의 경우 1개월 예측은 NSE 값이 0.9411 이상을 보여 우수한 모의 성능을 나타내었다(Figs. 10(a)~10(d)). 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 10(d)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8126 및 0.5750 이상을 보여 적절한 모의 성능을 나타내었으며 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 1.3298 m, 2.3709 m, 3.5709 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 2.9067 m의 RMSE 값을 나타내었다. 3.1절에서 기술한 바와 같이 이 지하수위 예측성능은 관측정1의 월단위 관측 지하수위 최대 변동폭(26.2 m)을 고려 시 수용 가능하다고 판단된다.

지하수위 변동폭이 상대적으로 작은 관측정2(MW2)의 경우 1개월 예측은 NSE 값이 0.9287 이상을 보여 우수한 모의 성능을 나타내었다(Figs. 10(e)~10(h)). 관측정 1의 경우처럼 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 10(h)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8997 및 0.7534 이상을 보여 적절한 모의 성능을 나타내었으며, 앙상블 모델은 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 0.7856 m, 0.9320 m, 1.4612 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 1.3898 m의 RMSE 값을 나타내었다. 이 RMSE 값은 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적절한 지하수위 예측성능으로 판단된다.

낮은 지하수위 기간(11~5월)의 결과(Table 4)는 전체 모의 기간 데이터를 사용한 결과(Table 3)의 결과보다 높은 지하수위 예측성능을 보였다. 이것은 인공지능 모델과 앙상블 모델이 낮은 지하수위 기간(11~5월)의 월단위 지하수위 예측에 대해 더욱 적합하다는 것을 의미한다. 제주도와 같이 지하수를 대부분의 용수로 사용하는 경우에는 지속가능한 지하수의 이용을 위한 관리를 위해 최저 지하수위 예측 등 미래 낮은 지하수위의 예측이 중요하며, 높은 지하수위 예측의 중요성은 상대적으로 낮을 수 있다. 특히 앙상블 모델은 관측정1(MW1)과 관측정2(MW2)의 3개월 예측에 대해 각각 0.7184와 0.7769의 적절한 NSE 값을 나타내어 지하수위 예측 및 관리를 위해 활용이 가능하다. 따라서 본 연구의 인공지능 모델 및 앙상블 모델을 사용한 낮은 지하수위 예측 및 평가 방법은 지하수 이용의 비중이 높은 지역에 유용하게 사용될 수 있다.

Table 4.

Statistics on the groundwater level prediction performance of artificial intelligence models for the low groundwater level period (November to May) of the observation wells^a

Number of prediction months	Monitoring well	Performance statistics	LSTM_lowQ	GRU_lowQ	ANN_lowQ	Ensemble_lowQ
1	MW1	NSE	0.9555	0.9411	0.9534	0.9581
	MW1	RMSE	1.1561	1.3298	1.1822	1.1214
	MW2	NSE	0.9470	0.9410	0.9287	0.9553
	MW2	RMSE	0.6772	0.7148	0.7856	0.6217
2	MW1	NSE	0.8168	0.8126	0.8498	0.8529
	MW1	RMSE	2.3447	2.3709	2.1227	2.1008
	MW2	NSE	0.8997	0.9095	0.9082	0.9118
	MW2	RMSE	0.9320	0.8851	0.8914	0.8739
3	MW1	NSE	0.5750	0.6420	0.6723	0.7184
	MW1	RMSE	3.5709	3.2775	3.1356	2.9067
	MW2	NSE	0.7695	0.7765	0.7534	0.7769
	MW2	RMSE	1.4126	1.3910	1.4612	1.3898

^aBold and underlined numbers represent the best and worst results, respectively.

주목할만한 점은 낮은 지하수위 기간(11~5월)에 대한 모의결과의 분포(Fig. 10)가 전체 모의 기간에 대한 모의결과의 분포(Fig. 9)보다 1:1 선에 근사하다는 점이다. 낮은 지하수위 기간(11~5월)은 대부분 지하수위 감수곡선 기간에 해당한다. 이것은 인공지능 모델과 앙상블 모델은 지하수위 감수곡선 기간에 대해 더욱 높은 지하수위 예측성능을 나타낸다는 것을 의미한다. 역으로 본 연구에서 설정한 우기(6~10월)의 관측 지하수위 상승기간에 대해서는 인공지능 모델과 앙상블 모델의 지하수위 예측성능은 상대적으로 낮아지는 것으로 해석할 수 있다. 참고로 낮은 지하수위 기간(11~5월)이라도 상대적으로 높은 지하수위가 관측되는데(Fig. 10) 10월의 태풍에 의한 많은 강수량이 11월의 관측 지하수위에 영향을 미친 결과로 판단된다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F10.jpg

Fig. 10.

One-month-ahead groundwater level predictions from AI and ensemble models for the low groundwater level period (November to May) of two monitoring wells. 1 M represents one-month-ahead prediction

낮은 지하수위 기간에 대해 예측성능이 더 높은 이유는, 이 기간은 대부분 무강우에 따른 지하수위 감수곡선 기간에 해당하여 시간에 따른 변동성이 큰 강수라는 외부 인자가 영향을 미치지 않고 시간에 따라 변동성이 거의 없는 수 겹의 화산지층 등 지하지질 특성에 따른 중력 흐름이 지하수위의 점진적 감소 패턴에 지배적인 영향을 미치므로 인공지능 모델은 이러한 예측가능한 지하수위 하강 패턴을 상대적으로 쉽게 학습하여 미래 지하수위를 예측하기 때문인 것으로 판단된다. 반면, 본 연구에서 개발한 인공지능 모델은 현재까지의 강수량, 취수량, 지하수위 데이터를 학습하여 미래 지하수위를 예측하므로 제주도의 잦은 태풍 등 시간에 따른 변동성이 큰 미래 강수량에 대한 정보를 알 수 없어 미래 지하수위 상승 구간의 경우 지하수위 예측성능이 상대적으로 낮은 것으로 판단된다.

3.3 앙상블 모델의 지하수위 예측성능 개선효과 분석

앙상블 모델의 사용이 개별 인공지능 모델 대비 지하수위 예측성능 개선에 미치는 영향은 Tables 5 and 6과 같다. 3.1절에서 기술한 바와 같이 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 다르기 때문에 인공지능 모델 대비 앙상블 모델에 의한 예측성능 개선 효과도 관측정별 및 예측기간별로 서로 다르다. 전체 모의 기간 데이터를 사용한 결과의 경우(Table 5) 최대 지하수위 예측개선 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델 대비 앙상블 모델에서 나타났으며, NSE 값은 0.0977, RMSE 값은 0.4474 m만큼 개선되었다. 낮은 지하수위 기간(11~5월)의 결과의 경우(Table 6)에서도 최대 지하수위 예측개선 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델 대비 앙상블 모델에서 나타났으며, NSE 값은 0.1434, RMSE 값은 0.6642 m만큼 개선되었다. 특히 이 낮은 지하수위 기간(11~5월)의 경우에 대한 높은 NSE 개선효과(LSTM 모델 NSE 0.5750 대비 앙상블 모델 NSE 0.7184)는 먼 미래 낮은 지하수위의 정확한 예측을 위한 앙상블 모델 사용의 타당성을 뒷받침한다.

Table 5.

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the entire data period of the observation wells^a

Number of prediction months	Monitoring Well	Performance statistics	Ensemble - LSTM	Ensemble - GRU	Ensemble - ANN
1	MW1	∆NSE	0.0055	0.0230	0.0135
	MW1	∆RMSE	-0.0582	-0.2341	-0.1415
	MW2	∆NSE	0.0121	0.0169	0.0338
	MW2	∆RMSE	-0.0710	-0.0974	-0.1833
2	MW1	∆NSE	0.0475	0.0577	0.0187
	MW1	∆RMSE	-0.2904	-0.3494	-0.1176
	MW2	∆NSE	0.0161	0.0151	0.0096
	MW2	∆RMSE	-0.0531	-0.0501	-0.032
3	MW1	∆NSE	0.0977	0.0874	0.0191
	MW1	∆RMSE	-0.4474	-0.4024	-0.0915
	MW2	∆NSE	0.0244	0.0262	0.0155
	MW2	∆RMSE	-0.0601	-0.0645	-0.0386

^aBold numbers indicate the greatest improvement.

Table 6.

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the low groundwater level period (November to May) of the observation wells^a

Number of prediction months	Monitoring Well	Performance statistics	Ensemble_ lowQ - LSTM_lowQ	Ensemble_ lowQ - GRU_lowQ	Ensemble_ lowQ - ANN_lowQ
1	MW1	∆NSE	0.0026	0.0170	0.0047
	MW1	∆RMSE	-0.0347	-0.2084	-0.0608
	MW2	∆NSE	0.0083	0.0143	0.0266
	MW2	∆RMSE	-0.0555	-0.0931	-0.1639
2	MW1	∆NSE	0.0361	0.0403	0.0031
	MW1	∆RMSE	-0.2439	-0.2701	-0.0219
	MW2	∆NSE	0.0121	0.0023	0.0036
	MW2	∆RMSE	-0.0581	-0.0112	-0.0175
3	MW1	∆NSE	0.1434	0.0764	0.0461
	MW1	∆RMSE	-0.6642	-0.3708	-0.2289
	MW2	∆NSE	0.0074	0.0004	0.0235
	MW2	∆RMSE	-0.0228	-0.0012	-0.0714

^aBold numbers indicate the greatest improvement.

앙상블 모델에 의한 관측정별 및 미래 예측기간별 최대 예측개선의 경우에 대한 지하수위 비교 결과는 Figs. 11 and 12와 같다. 전체 모의 기간 데이터에 대한 결과(Fig. 11)에서 앙상블 모델의 모의 지하수위(빨간색 점)는 개별 인공지능 모델의 모의 지하수위(파란색 점) 보다 1:1선에 근사한 것을 확인할 수 있다. 이 개선효과는 낮은 지하수위 기간(11~5월)의 결과(Fig. 12)에서 더욱 뚜렷이 확인할 수 있는데, 앙상블 모델이 예측한 1~3개월 미래 지하수위는 저수위부터 고수위까지 1:1선에 더욱 근사한 것을 확인할 수 있다. 따라서 먼 미래의 지하수위 예측에 대해 더욱 정확한 결과를 도출하기 위해서는 다양한 인공지능 모델의 결과를 사용한 앙상블 모델의 사용이 필요하다.

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F11.jpg

Fig. 11.

Comparison plots of groundwater level predictions from AI and ensemble models for the entire data period of two monitoring wells. 1 M, 2 M and 3 M represent one-month-, two-month-, and three-month-ahead predictions respectively

https://cdn.apub.kr/journalsite/sites/kwra/2025-058-10/N0200581007/images/kwra_58_10_07_F12.jpg

Fig. 12.

Comparison plots of groundwater level predictions from AI and ensemble models for the low groundwater level period (November to May) of two monitoring wells. 1 M, 2 M and 3 M represent one-month-, two-month-, and three-month-ahead predictions respectively

4. 결 론

본 연구에서는 제주도의 남동쪽 표선유역 내 중산간 지역에 위치한 2개 관측정을 대상으로 앙상블 모델의 사용이 각 인공지능(LSTM, GRU, ANN) 모델 대비 미래 1~3개월 후 지하수위 예측 개선 효과를 전체 데이터 기간과 낮은 지하수위 기간(11~5월)에 대해 각각 분석하였다. 분석 결과, 전체 데이터 기간에 대해 인공지능 모델과 앙상블 모델은 1~3개월 미래 지하수위를 적절히 예측하였으며 앙상블 모델은 개별 인공지능 모델보다 높은 예측성능을 나타냈다. 지하수위 예측성능은 예측기간이 길어질수록 그리고 관측 지하수위의 변동폭이 상대적으로 큰 관측정일수록 낮았다. 지하수위의 변동폭이 상대적으로 큰 관측정에 대해 인공지능 모델의 지하수위 예측성능이 상대적으로 낮은 이유는, 제주도에서 발생한 수차례 화산활동에 의해 이 관측정 주변 지역에 복잡한 지하지질을 형성하여 이로 인한 복잡한 수리지질학적 특성이 상대적으로 크고 복잡한 지하수위를 형성함에 따라 인공지능 모델이 이러한 지하수위 변동 특성을 학습하기에 상대적으로 어렵기 때문인 것으로 판단된다. 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 달라 특정 인공지능 모델이 항상 가장 높은 지하수위 예측성능을 나타내지 않았으며, 따라서 더욱 개선된 지하수위 예측을 위해서는 서로 다른 인공지능 모델의 결과를 활용하는 앙상블 모델이 필요하다.

낮은 지하수위 기간(11~5월)에 대한 지하수위 예측성능은 전체 데이터 기간에 대한 결과보다 높았으며, 이것은 인공지능 모델과 앙상블 모델이 대부분 지하수위 감수곡선 기간에 해당하는 낮은 지하수위 기간(11~5월)의 지하수위 예측에 대해 더욱 적합하다는 것을 의미한다. 낮은 지하수위 기간에 대해 예측성능이 더 높은 이유는, 이 기간은 대부분 무강우에 따른 지하수위 감수곡선 기간에 해당하여 시간에 따른 변동성이 큰 강수라는 외부 인자가 영향을 미치지 않고 시간에 따라 변동성이 거의 없는 수 겹의 화산지층 등 지하지질 특성에 따른 중력 흐름이 지하수위의 점진적 감소 패턴에 지배적인 영향을 미치므로 인공지능 모델은 이러한 예측가능한 지하수위 하강 패턴을 상대적으로 쉽게 학습하여 미래 지하수위를 예측하기 때문인 것으로 판단된다. 반면, 본 연구에서 개발한 인공지능 모델은 현재 강수량, 취수량, 지하수위 데이터를 학습하여 미래 지하수위를 예측하므로 제주도의 잦은 태풍 등 시간에 따른 변동성이 큰 미래 강수량에 대한 정보를 알 수 없어 미래 지하수위 상승 구간의 경우 지하수위 예측성능이 상대적으로 낮은 것으로 판단된다. 특히 앙상블 모델은 관측정1(MW1)과 관측정2(MW2)의 3개월 예측에 대해 각각 0.7184와 0.7769의 적절한 NSE 값을 나타내어 본 연구대상 지역의 낮은 지하수위 기간(11~5월)에 대한 장기간 지하수위 예측 및 관리를 위해 활용이 가능하다. 앙상블 모델에 의한 예측성능 개선 최대 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델(NSE 0.5750) 대비 앙상블 모델(NSE 0.7184)에서 나타났으며 NSE 값이 0.1434만큼 개선되었다. 이 높은 NSE 개선효과는 먼 미래 낮은 지하수위의 보다 정확한 예측을 위한 앙상블 모델 사용의 필요성을 뒷받침한다. 본 연구에서 제시한 인공지능 모델 및 앙상블 모델을 사용한 낮은 지하수위 예측 및 평가 방법은 제주도와 같이 지하수 이용의 비중이 높은 지역의 지하수위 관리에 유용하게 사용될 수 있다.

본 연구는 제주도 중산간지역 내 지하수위 관측정 2개소에 대해 연구를 수행하여 복수의 다른 지역에 대해 테스트를 수행하지 않아 연구결과의 일반화에 대한 한계점이 있다. 그리고 사용한 데이터의 기간이 짧아 데이터 개수의 제약으로 인해 대부분 자료를 학습에 활용하였다는 점과 지하수위 예측결과의 불확실성 평가를 수행하지 않은 한계점이 있다. 향후 다른지역에 대한 본 연구방법의 적용성 평가와 학습, 검증, 테스트 자료 비중에 따른 예측성능 평가 및 예측결과의 불확실성 평가 연구를 수행할 예정이다.

Conflicts of Interest

The authors declare no conflict of interest.

References

Adamowski, J., and Chan, H.F. (2011). “A wavelet neural network conjunction model for groundwater level forecasting.” Journal of Hydrology, Vol. 407, No. 1-4, pp. 28-40.

10.1016/j.jhydrol.2011.06.013

Afan, H.A., Ibrahem Ahmed Osman, A., Essam, Y., Ahmed, A.N., Huang, Y.F., Kisi, O., Sherif, M., Sefelnasr, A., Chau, K., and El-Shafie, A. (2021). “Modeling the fluctuations of groundwater level by employing ensemble deep learning techniques.” Engineering Applications of Computational Fluid Mechanics, Vo. 15, No. 1, pp. 1420-1439.

10.1080/19942060.2021.1974093

Alizamir, M., Kisi, O., and Zounemat-Kermani, M. (2018). “Modelling long-term groundwater fluctuations by extreme learning machine using hydro-climatic data.” Hydrological Sciences Journal, Vol. 63, No. 1, pp. 63-73.

10.1080/02626667.2017.1410891

Barthel, R., and Banzhaf, S. (2016). “Groundwater and surface water interaction at the regional-scale - a review with focus on regional integrated models.” Water Resources Management, Vol. 30, No. 1, pp. 1-32.

10.1007/s11269-015-1163-z

Bengio, Y., Simard, P., and Frasconi, P. (1994). “Learning long-term dependencies with gradient descent is difficult.” IEEE Transactions on Neural Networks, Vol. 5, No. 2, pp. 157-166.

10.1109/72.279181

Bizhanimanzar, M., Leconte, R., and Nuth, M. (2019). “Modelling of shallow water table dynamics using conceptual and physically based integrated surface-water - groundwater hydrologic models.” Hydrology and Earth System Sciences, Vol. 23, No. 5, pp. 2245-2260.

10.5194/hess-23-2245-2019

Chidepudi, S.K.R., Massei, N., Jardani, A., Dieppois, B., Henriot, A., and Fournier, M. (2025). “Training deep learning models with a multi-station approach and static aquifer attributes for groundwater level simulation: what is the best way to leverage regionalised information?.” Hydrology and Earth System Sciences, Vol. 29, No. 4, pp. 841-861.

10.5194/hess-29-841-2025

Cho, K., Van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., and Bengio, Y. (2014). “Learning phrase representations using RNN encoder-decoder for statistical machine translation.” arXiv preprint arXiv., 1406.1078.

10.3115/v1/D14-1179

Chollet, F., and Allaire, J.J. (2018). Deep learning with R; Manning Publications, Shelter Island, NY, U.S.

Davoudi Moghaddam, D., Rahmati, O., Haghizadeh, A., and Kalantari, Z. (2020). “A modeling comparison of groundwater potential mapping in a mountain bedrock aquifer: QUEST, GARP, and RF models.” Water, Vol. 12, No. 3, 679.

10.3390/w12030679

Falbel, D., Allaire, J.J., Chollet, F., Tang, Y., Van Der Bijl, W., Studer, M., Keydana, S. (2019). R interface to ‘Keras’. R Package Version 2.2.4.1, accessed 5 April 2019, <https://CRAN.R-project.org/package=keras>.

Fallah-Mehdipour, E., Haddad, O.B., and Mariño, M.A. (2013). “Prediction and simulation of monthly groundwater levels by genetic programming.” Journal of Hydro-Environment Research, Vol. 7, No. 4, pp. 253-260.

10.1016/j.jher.2013.03.005

Georgakakos, K.P., Seo, D.J., Gupta, H., Schaake, J., and Butts, M.B. (2004). “Towards the characterization of streamflow simulation uncertainty through multimodel ensembles.” Journal of Hydrology, Vol. 298, No. 1-4, pp. 222-241.

10.1016/j.jhydrol.2004.03.037

Gharehbaghi, A., Ghasemlounia, R., Ahmadi, F., and Albaji, M. (2022). “Groundwater level prediction with meteorologically sensitive Gated Recurrent Unit (GRU) neural networks.” Journal of Hydrology, Vol. 612, 128262.

10.1016/j.jhydrol.2022.128262

Gholizadeh, H., Zhang, Y., Frame, J., Gu, X., and Green, C.T. (2023). “Long short-term memory models to quantify long-term evolution of streamflow discharge and groundwater depth in Alabama.” Science of the Total Environment, Vol. 901, 165884.

10.1016/j.scitotenv.2023.165884

Gong, Y., Zhang, Y., Lan, S., and Wang, H. (2016). “A comparative study of artificial neural networks, support vector machines and adaptive neuro fuzzy inference system for forecasting groundwater levels near Lake Okeechobee, Florida.” Water Resources Management, Vol. 30, pp. 375-391.

10.1007/s11269-015-1167-8

Hahnloser, R.H., Sarpeshkar, R., Mahowald, M.A., Douglas, R.J., and Seung, H.S. (2000). “Digital selection and analogue amplification coexist in a cortex-inspired silicon circuit.” Nature, Vol. 405, No. 6789, pp. 947-951.

10.1038/35016072

Han, Z., Li, F., Zhao, Y., and Liu, C. (2025). “Investigation into groundwater level prediction within a deep learning framework: Incorporating the spatial dynamics of adjacent wells.” Journal of Hydrology, Vol. 657, 133097.

10.1016/j.jhydrol.2025.133097

Haykin, S. (2009). Neural networks and learning machines. Pearson Prentice Hall, Upper Saddle River, NJ, U.S.

Hochreiter, S., and Schmidhuber, J. (1997). “Long short-term memory.” Neural Computation, Vol. 9, No. 8, pp. 1735-1780.

10.1162/neco.1997.9.8.1735

Huan, S. (2024). “Geographic heterogeneity of activation functions in urban real-time flood forecasting: Based on seasonal trend decomposition using Loess-temporal convolutional network- gated recurrent unit model.” Journal of Hydrology, Vol. 636, 131279.

10.1016/j.jhydrol.2024.131279

Jeihouni, E., Mohammadi, M., Eslamian, S., and Zareian, M.J. (2019). “Potential impacts of climate change on groundwater level through hybrid soft-computing methods: A case study - Shabestar Plain, Iran.” Environmental Monitoring and Assessment, Vol. 191, No. 10, 620.

10.1007/s10661-019-7784-6

Jeju Special Self-Governing Province (JSSGP) (2022). Basic plan for integrated water management for Jeju special self- governing province.

Jeong, J., and Jeong, J. (2024). “Applying transfer learning to improve the performance of deep learning - based groundwater level prediction model with insufficient training data.” Economic and Environmental Geology, Vol. 57, No. 5, pp. 551-562.

10.9719/EEG.2024.57.5.551

Jha, M.K., and Sahoo, S. (2014). “Efficacy of neural network and genetic algorithm techniques in simulating spatio-temporal fluctuations of groundwater.” Hydrological Processes, Vol. 29, No. 5, pp. 671-691.

10.1002/hyp.10166

Kim, D., Jang, C., Choi, J., and Kwak, J. (2023). “A case study: Groundwater level forecasting of the gyorae area in actual practice on jeju island using deep-learning technique.” Water, Vol. 15, No. 5, 972.

10.3390/w15050972

Kim, I., and Lee, J. (2022). “Performance analysis of ANN prediction for groundwater level considering regional‐specific influence components.” Groundwater, Vol. 60, No. 3, pp. 344-361.

10.1111/gwat.13156

Kim, I., Lee, J., Kim, J., Lee, H., and Lee, J. (2021). “Analysis of groundwater level prediction performance with influencing factors by artificial neural network.” Journal of the Korean Geotechnical Society, Vol. 37, No. 5, pp. 19-31.

Kim, T.W., and Valdés, J.B. (2003). “Nonlinear model for drought forecasting based on a conjunction of wavelet transforms and neural networks.” Journal of Hydrologic Engineering, Vol. 8, No. 6, pp. 319-328.

10.1061/(ASCE)1084-0699(2003)8:6(319)

Kim, Y.O., Jeong, D., and Ko, I.H. (2006). “Combining rainfall- runoff model outputs for improving ensemble streamflow prediction.” Journal of Hydrologic Engineering, Vol. 11, No. 6, pp. 578-588.

10.1061/(ASCE)1084-0699(2006)11:6(578)

Kingma, D.P., and Ba, J. (2014). “Adam: A method for stochastic optimization.” arXiv preprint arXiv:1412.6980.

Kow, P.Y., Liou, J.Y., Sun, W., Chang, L.C., and Chang, F.J. (2024). “Watershed groundwater level multistep ahead forecasts by fusing convolutional-based autoencoder and LSTM models.” Journal of Environmental Management, Vol. 351, 119789.

10.1016/j.jenvman.2023.119789

Lallahem, S., Mania, J., Hani, A., and Najjar, Y. (2005). “On the use of neural networks to evaluate groundwater levels in fractured media.” Journal of Hydrology, Vol. 307, No. 1-4, pp. 92-111.

10.1016/j.jhydrol.2004.10.005

Le, X.H., Ho, H.V., Lee, G., and Jung, S. (2019). “Application of long short-term memory (LSTM) neural network for flood forecasting.” Water, Vol. 11, No. 7, 1387.

10.3390/w11071387

Lin, H., Gharehbaghi, A., Zhang, Q., Band, S.S., Pai, H. T., Chau, K.W., and Mosavi, A. (2022). “Time series-based groundwater level forecasting using gated recurrent unit deep neural networks.” Engineering Applications of Computational Fluid Mechanics, Vol. 16, No. 1, pp. 1655-1672.

10.1080/19942060.2022.2104928

Maier, H.R., and Dandy, G.C. (2000). “Neural networks for the prediction and forecasting of water resources variables: a review of modelling issues and applications.” Environmental Modelling & Software, Vol. 15, No. 1, pp. 101-124.

10.1016/S1364-8152(99)00007-9

McDonald, M.G., and Harbaugh, A.W. (1988). A modular three- dimensional finite-difference ground-water flow model. Vol. 6. US Geological Survey, Reston, VA, U.S.

Mirzaei, M., and Shirmohammadi, A. (2024). “Utilizing data-driven approaches to forecast fluctuations in groundwater table.” Water, Vol. 16, No. 11, 1500.

10.3390/w16111500

Mohanty, S., Jha, M.K., Kumar, A., and Panda, D.K. (2013). “Comparative evaluation of numerical model and artificial neural network for simulating groundwater flow in Kathajodi-Surua Inter-basin of Odisha, India.” Journal of Hydrology, Vol. 495, pp. 38-51.

10.1016/j.jhydrol.2013.04.041

Mohanty, S., Jha, M.K., Kumar, A., and Sudheer, K.P. (2010). “Artificial neural network modeling for groundwater level forecasting in a river island of eastern India.” Water Resources Management, Vol. 24, pp. 1845-1865.

10.1007/s11269-009-9527-x

Moriasi, D.N., Arnold, J.G., Van Liew, M.W., Bingner, R.L., Harmel, R.D., and Veith, T.L. (2007). “Model evaluation guidelines for systematic quantification of accuracy in watershed simulations.” Transactions of the ASABE, Vol. 50, No. 3, pp. 885-900.

10.13031/2013.23153

Müller, J., Park, J., Sahu, R., Varadharajan, C., Arora, B., Faybishenko, B., and Agarwal, D. (2021). “Surrogate optimization of deep neural networks for groundwater predictions.” Journal of Global Optimization, Vol. 81, No. 1, pp. 203-231.

10.1007/s10898-020-00912-0

Nan, T., Cao, W., Wang, Z., Gao, Y., Zhao, L., Sun, X., and Na, J. (2023). “Evaluation of shallow groundwater dynamics after water supplement in North China Plain based on attention- GRU model.” Journal of Hydrology, Vol. 625, 130085.

10.1016/j.jhydrol.2023.130085

Nash, J.E., and Sutcliffe, J.V. (1970). “River flow forecasting through conceptual models part I - A discussion of principles.” Journal of Hydrology, Vol. 10, No. 3, pp. 282-290.

10.1016/0022-1694(70)90255-6

Park, C., and Chung, I.M. (2020). “Evaluating the groundwater prediction using LSTM model.” Journal of Korea Water Resources Association, Vol. 53, No. 4, pp. 273-283.

10.3741/JKWRA.2020.53.4.273

Payne, K., Chami, P., Odle, I., Yawson, D.O., Paul, J., Maharaj- Jagdip, A., and Cashman, A. (2022). “Machine learning for surrogate groundwater modelling of a small carbonate island.” Hydrology, Vol. 10, No. 1, 2.

10.3390/hydrology10010002

Prechelt, L. (2012) “Early stopping - but when?.” Neural Networks: Tricks of the Trade, Edited by Montavon G., Orr G.B., and Müller KR., Springer, Berlin, pp. 53-67.

10.1007/978-3-642-35289-8_5

Rajaee, T., Ebrahimi, H., and Nourani, V. (2019). “A review of the artificial intelligence methods in groundwater level modeling.” Journal of Hydrology, Vol. 572, pp. 336-351.

10.1016/j.jhydrol.2018.12.037

Rakhshandehroo, G.R., Vaghefi, M., and Aghbolaghi, M.A. (2012). “Forecasting groundwater level in Shiraz plain using artificial neural networks.” Arabian Journal for Science and Engineering, Vol. 37, No. 7, pp. 1871-1883.

10.1007/s13369-012-0291-5

Roy, D.K., Biswas, S.K., Mattar, M.A., El-Shafei, A.A., Murad, K.F.I., Saha, K.K., Datta, B., and Dewidar, A.Z. (2021). “Groundwater level prediction using a multiple objective genetic algorithm-grey relational analysis based weighted ensemble of ANFIS models.” Water, Vol. 13, No. 21, 3130.

10.3390/w13213130

Rumelhart, D.E., Hinton, G.E., and Williams, R.J. (1986). “Learning representations by back-propagating errors.” Nature, Vol. 323, No. 6088, pp. 533-536.

10.1038/323533a0

Sahoo, S., Russo, T.A., Elliott, J., and Foster, I. (2017). “Machine learning algorithms for modeling groundwater level changes in agricultural regions of the US.” Water Resources Research, Vol. 53, No. 5, pp. 3878-3895.

10.1002/2016WR019933

Seidu, J., Ewusi, A., Kuma, J.S.Y., Ziggah, Y.Y., and Voigt, H.J. (2023). “Impact of data partitioning in groundwater level prediction using artificial neural network for multiple wells.” International Journal of River Basin Management, Vol. 21, No. 4, pp. 639-650.

10.1080/15715124.2022.2079653

Shin, M.J., Kim, J.H., Kang, S.Y., Moon, S.H., and Hyun, E.H. (2024). “Impact of Baekrokdam precipitation observation data on improving groundwater level prediction in mid-mountainous region of Jeju Island.” Journal of Korea Water Resources Association, Vol. 57, No. 10, pp. 673-686.

10.3741/JKWRA.2024.57.10.673

Shin, M.J., Kim, J.W., Moon, D.C., Lee, J.H., and Kang, K.G. (2021). “Comparative analysis of activation functions of artificial neural network for prediction of optimal groundwater level in the middle mountainous area of Pyoseon watershed in Jeju Island.” Journal of Korea Water Resources Association, Vol. 54, No. 12, pp. 1143-1154.

10.3741/JKWRA.2021.54.S-1.1143

Shin, M.J., Moon, S.H., Kang, K.G., Moon, D.C., and Koh, H.J. (2020). “Analysis of groundwater level variations caused by the changes in groundwater withdrawals using long short-term memory network.” Hydrology, Vol. 7, No. 3, 64.

10.3390/hydrology7030064

Sit, M., Demiray, B.Z., Xiang, Z., Ewing, G.J., Sermet, Y., and Demir, I. (2020). “A comprehensive review of deep learning applications in hydrology and water resources.” Water Science and Technology, Vol. 82, No. 12, pp. 2635-2670.

10.2166/wst.2020.369

Sun, J., Hu, L., Li, D., Sun, K., and Yang, Z. (2022). “Data-driven models for accurate groundwater level prediction and their practical significance in groundwater management.” Journal of Hydrology, Vol. 608, 127630.

10.1016/j.jhydrol.2022.127630

Sun, Y., Wendi, D., Kim, D.E., and Liong, S.Y. (2016). “Application of artificial neural networks in groundwater table forecasting - A case study in a Singapore swamp forest.” Hydrology and Earth System Sciences, Vol. 20, No. 4. pp. 1405-1412.

10.5194/hess-20-1405-2016

Sušanj Čule, I., Ožanić, N., Volf, G., and Karleuša, B. (2025). “Artificial Neural Network (ANN) water-level prediction model as a tool for the sustainable management of the Vrana Lake (Croatia) water supply system.” Sustainability, Vol. 17, 722.

10.3390/su17020722

Tao, H., Hameed, M.M., Marhoon, H.A., Zounemat-Kermani, M., Heddam, S., Kim, S., Sulaiman, S.O., Tan, M.L., Sa’adi, Z. Mehr, A.D., et al. (2022). “Groundwater level prediction using machine learning models: A comprehensive review.” Neurocomputing, Vol. 489, pp. 271-308.

10.1016/j.neucom.2022.03.014

Yariyan, P., Janizadeh, S., Van Phong, T., Nguyen, H.D., Costache, R., Van Le, H., and Tiefenbacher, J.P. (2020). “Improvement of best first decision trees using Bagging and dagging ensembles for flood probability mapping.” Water Resources Management, Vol. 34, No. 9, pp. 3037-3053.

10.1007/s11269-020-02603-7

Yin, J., and Tsai, F.T.C. (2018). “Saltwater scavenging optimization under surrogate uncertainty for a multi-aquifer system.” Journal of Hydrology, Vol. 565, pp. 698-710.

10.1016/j.jhydrol.2018.08.021

Yin, J., Medellín-Azuara, J., Escriva-Bou, A., and Liu, Z. (2021). “Bayesian machine learning ensemble approach to quantify model uncertainty in predicting groundwater storage change.” Science of The Total Environment, Vol. 769, 144715.

10.1016/j.scitotenv.2020.144715

Yoon, H., Hyun, Y., Ha, K., Lee, K.K., and Kim, G.B. (2016). “A method to improve the stability and accuracy of ANN-and SVM-based time series models for long-term groundwater level predictions.” Computers & Geosciences, Vol. 90, pp. 144-155.

10.1016/j.cageo.2016.03.002

Yoon, H., Jun, S.C., Hyun, Y., Bae, G.O., and Lee, K.K. (2011). “A comparative study of artificial neural networks and support vector machines for predicting groundwater levels in a coastal aquifer.” Journal of Hydrology, Vol. 396, No. 1-2, pp. 128-138.

10.1016/j.jhydrol.2010.11.002

Yoon, H., Kim, Y., Ha, K., and Kim, G.B. (2013). “Application of groundwater-level prediction models using data-based learning algorithms to national groundwater monitoring network data.” The Journal of Engineering Geology, Vol. 23, No. 2, pp. 137-147.

10.9720/kseg.2013.2.137

Yoon, P., Yoon, H., Kim, Y., and Kim, G.B. (2014). “A comparative study on forecasting groundwater level fluctuations of national groundwater monitoring networks using TFNM, ANN, and ANFIS.” Journal of Soil and Groundwater Environment, Vol. 19, No. 3, pp. 123-133.

10.7857/JSGE.2014.19.3.123

Zhang, J., Chen, X., Khan, A., Zhang, Y. K., Kuang, X., Liang, X., Taccari, M., and Nuttall, J. (2021). “Daily runoff forecasting by deep recursive neural network.” Journal of Hydrology, Vol. 596, 126067.

10.1016/j.jhydrol.2021.126067

Zhang, J., Zhu, Y., Zhang, X., Ye, M., and Yang, J. (2018). “Developing a Long Short-Term Memory (LSTM) based model for predicting water table depth in agricultural areas.” Journal of Hydrology, Vol. 561, pp. 918-929.

10.1016/j.jhydrol.2018.04.065

Zhou, R., and Zhang, Y. (2023). “Linear and nonlinear ensemble deep learning models for karst spring discharge forecasting.” Journal of Hydrology, Vol. 627, 130394.

10.1016/j.jhydrol.2023.130394

Journal of Korea Water Resources Association ISSN:2799-8746(Print) 2799-8754(Online) 한국수자원학회 논문집

Preview

Impact of an ensemble of artificial intelligence models on improving groundwater level prediction in mid-mountainous region of Jeju Island

ABSTRACT

MAIN

Table 1.

Period of precipitation, groundwater withdrawal and groundwater level data

Fig. 1.

Schematic diagram of the locations of precipitation observation stations, groundwater withdrawal wells, and groundwater level monitoring wells

Fig. 2.

Comparison of precipitation at Seongpanak and Gyorae rainfall stations

Fig. 3.

Precipitation time series data from Seongpanak and Gyorae rainfall stations

Fig. 4.

Fluctuation range of groundwater level in groundwater level monitoring wells

(1)

Fig. 5.

The structure of LSTM model (Shin et al., 2020)

(2)

(3)

(4)

(5)

Fig. 6.

The structure of GRU model

(6)

(7)

(8)

(9)

(10)

Fig. 7.

The structure of ANN model (Shin et al., 2021)

(11)

(12)

Fig. 8.

Groundwater level learning procedure of artificial intelligence models

Table 2.

Hyper-parameters of artificial intelligence models

(13)

(14)

Table 3.

Statistics on the groundwater level prediction performance of artificial intelligence models for the entire data period of the observation wellsa

Fig. 9.

One-month-ahead groundwater level predictions from AI and ensemble models for the entire data period of two monitoring wells. 1 M represents one-month-ahead prediction

Table 4.

Statistics on the groundwater level prediction performance of artificial intelligence models for the low groundwater level period (November to May) of the observation wellsa

Fig. 10.

One-month-ahead groundwater level predictions from AI and ensemble models for the low groundwater level period (November to May) of two monitoring wells. 1 M represents one-month-ahead prediction

Table 5.

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the entire data period of the observation wellsa

Table 6.

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the low groundwater level period (November to May) of the observation wellsa

Fig. 11.

Comparison plots of groundwater level predictions from AI and ensemble models for the entire data period of two monitoring wells. 1 M, 2 M and 3 M represent one-month-, two-month-, and three-month-ahead predictions respectively

Fig. 12.

Comparison plots of groundwater level predictions from AI and ensemble models for the low groundwater level period (November to May) of two monitoring wells. 1 M, 2 M and 3 M represent one-month-, two-month-, and three-month-ahead predictions respectively

Conflicts of Interest

References

Statistics on the groundwater level prediction performance of artificial intelligence models for the entire data period of the observation wells^a

Statistics on the groundwater level prediction performance of artificial intelligence models for the low groundwater level period (November to May) of the observation wells^a

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the entire data period of the observation wells^a

Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the low groundwater level period (November to May) of the observation wells^a