1. 서 론
2. 자료 및 방법
2.1 연구대상 지역 및 자료
2.2 인공지능 모델
2.3 연구 방법
3. 결과 및 고찰
3.1 전체 데이터 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
3.2 낮은 지하수위 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
3.3 앙상블 모델의 지하수위 예측성능 개선효과 분석
4. 결 론
1. 서 론
지하수는 지표수와 함께 생활용수, 농업용수 및 공업용수 등으로 사용할 수 있는 수자원이며, 기후변화 시대에 수자원 확보에 있어 그 중요성이 더욱 증가하고 있다. 제주도의 경우 지하수는 전체 수자원의 82%를 차지하므로(JSSGP, 2022) 지속가능한 지하수자원의 이용을 위해 지하수량의 예측 및 관리는 중요하다. 특히 지하수의 안정적인 사용을 위한 선제적인 취수량 관리를 위해서는 가능한 먼 미래의 정확한 지하수위 예측 연구가 반드시 필요하다.
지하수위 변동성을 예측하기 위해 물리적 기반 개념모델과 MODFLOW (McDonald and Harbaugh, 1988) 등 지하수 수치모델을 사용할 수 있다(Mohanty et al., 2013; Bizhanimanzar et al., 2019). 하지만 이러한 프로세스 기반 모델은 대수층의 특성, 지하 지질 및 지형 등 수문지질학적 시공간 데이터의 충분한 가용 여부와 품질에 따라 모의결과의 정밀성과 정확성이 달라지므로 데이터의 취득이 제한된 지역의 경우 모의 결과의 신뢰성은 제한된다(Adamowski and Chan, 2011; Barthel and Banzhaf, 2016; Sun et al., 2016; Tao et al., 2022). 만약, 수문지질학적 시공간 데이터의 취득에 제한이 있거나 시공간적인 수문학적 프로세스의 이해보다 특정 지점의 정확한 지하수위 예측이 주된 연구의 목적인 경우에는 데이터 기반 블랙박스 모델인 인공지능 모델의 활용이 적합하다(Adamowski and Chan, 2011).
인공지능 모델은 지하수위 예측을 위해 전 세계적으로 다양한 연구에서 성공적으로 사용되었다(Rajaee et al., 2019; Tao et al., 2022). 국외에서는 인공신경망 모델(Artificial Neural Network, ANN)(Lallahem et al., 2005), 유전자 프로그래밍(Genetic Programming)(Fallah-Mehdipour et al., 2013), 지원 벡터 머신(Support Vector Machine, SVM)(Gong et al., 2016), 극단 학습 머신(Extreme Learning Machine)(Alizamir et al., 2018), 퍼지 기반 모델(Adaptive Neuro Fuzzy Inference System, ANFIS)(Jeihouni et al., 2019), 트리 기반 모델(Random Forest)(Davoudi Moghaddam et al., 2020) 등이 지하수위 예측을 위해 널리 사용되었다. 최근에는 순환신경망을 사용하는 딥러닝 인공지능 모델인 게이트 순환 유닛(Gated Recurrent Unit, GRU)(Gharehbaghi et al., 2022) 모델과 장단기기억(Long Short-Term Memory, LSTM)(Kow et al., 2024) 모델 등이 지하수위 예측을 위해 적용되었다. 국내에서도 지하수위 예측을 위해 ANN, SVM, ANFIS, GRU, LSTM 등의 인공지능 모델을 사용한 연구를 지속적으로 수행하였으나 국외 연구 사례보다는 상대적으로 적은 편이다(Yoon et al., 2011, 2013, 2014, 2016; Park and Chung, 2020; Kim et al., 2021; Jeong and Jeong, 2024). 특히, LSTM, GRU 및 ANN 모델은 지하수위 예측을 포함한 다양한 수문학 및 수자원분야 연구에 사용된 빈도가 매우 높으며(Sit et al., 2020) 점차 증가하는 추세이다. 이와 더불어 개별 인공지능 모델에 의한 지하수위 예측 결과를 더욱 개선하기 위해 앙상블 기법을 적용한 연구가 수행되었다(Afan et al., 2021; Roy et al., 2021). Afan et al. (2021)은 ANN 모델에 Bagging 기법 적용을 통해 도출된 다양한 데이터 샘플 기반 지하수위 예측 결과들을 사용하여 앙상블 모델을 개발한 결과 앙상블 모델이 ANN 모델보다 일반적으로 더 높은 지하수위 예측능력을 보인다고 제시하였고, Roy et al. (2021)은 ANFIS 모델에 3개의 최적화 기법 적용을 통해 도출된 지하수위 예측 결과들을 사용하여 앙상블 모델을 개발한 결과 앙상블 모델이 개별 ANFIS 모델보다 더 높은 지하수위 예측성능을 도출하는 것을 확인하였다. 하지만 일반적으로 높은 예측성능을 보이는 LSTM과 GRU 모델 등 다양한 딥러닝 인공지능 모델을 사용한 앙상블 모델 개발 및 활용 연구사례는 카르스트 지역에 대한 샘물 유출량 예측(Zhou and Zhang, 2023) 등이 있으나 지하수위 예측에 대한 연구사례는 충분하지 않다는 한계가 있다.
제주도의 중산간 지역은 오랜 기간 동안 수차례의 화산활동에 의해 지층이 겹겹이 쌓여 지하지질이 매우 복잡하게 형성되어 있으며, 이로 인해 인근 지역의 관측정이라 하더라도 지표면부터 대수층까지 형성된 두꺼운 화산지층의 수리지질학적 특성이 서로 달라 지하수위의 변동특성이 서로 다르다. 또한 유역의 상류지역에 해당하는 한라산 국립공원 지역의 경우 지하지질에 대한 데이터가 충분하지 않아 프로세스 기반 모델에 필요한 데이터의 취득에 한계가 있다. 선행 연구로 인공지능 모델을 적용한 섬 지역의 지하수위 예측 연구가 있었지만(Mohanty et al., 2010; Payne et al., 2022; Kim et al., 2023) 섬 지역의 정확한 장기간 지하수위 예측을 위해 딥러닝을 포함한 다양한 인공지능 모델 및 앙상블 모델을 적용한 연구는 충분하지 않다.
본 연구의 목적은 제주도 내 표선유역 중산간지역에 위치한 2개 지하수위 관측정에 대해 정확한 장기간 미래 월단위 지하수위 예측을 위해 딥러닝을 포함한 3개 인공지능 모델을 사용하여 지하수위를 예측하고 앙상블 모델을 사용하여 지하수위 예측성능의 개선효과를 비교분석 하는 것에 있다. 인공지능 모델은 수문학 및 수자원분야 연구에 널리 사용되고 있는 LSTM, GRU 및 ANN 모델을 사용하였다. 앙상블 모델 구축을 위해 각각의 인공지능 모델 결과의 중요도에 따라 다른 가중치를 주는 가중평균 앙상블 기법을 적용하였다. 기존 연구와의 차이점으로 본 연구에서는 장기간 지하수위 예측성능을 개선하기 위해 딥러닝을 포함한 3개 인공지능 모델을 사용하여 앙상블 모델을 개발한다는 점과, 극한 가뭄 등에 선제적인 대응을 위한 최저 지하수위 예측 등 낮은 지하수위의 예측이 중요하므로 낮은 지하수위 기간(11~5월)에 대한 예측 성능을 추가적으로 평가하여 더욱 정확한 지하수위 예측 기법 제공에 기여한다는 점에 있다. 본 연구의 연구방법은 2절에 설명하였으며 연구결과와 결론은 각각 3절과 4절에 기술하였다.
2. 자료 및 방법
2.1 연구대상 지역 및 자료
연구대상 지역은 대한민국 제주도 남동쪽 표선유역 내 중산간 지역에 위치한 2개 지하수위 관측정 지점이다(Fig. 1). 본 연구에 사용된 데이터는 연구대상 지역 인근의 2개 강우관측소(성판악, 교래) 일단위 강수량 데이터, 2개 지하수위 관측정 일단위 지하수위 데이터와 2개 지하수 취수원 일단위 취수량 데이터이다(Table 1). 이 일단위 데이터는 인공지능 모델을 이용한 월단위 지하수위 모의를 위해 월단위 데이터로 변환하였다. 성판악 강우관측소는 자동기상관측소(Automatic Weather System)로서 기상청(http://www.weather.go.kr/)에서 운영하고 있으며, 교래 강우관측소는 제주도 재난안전대책본부(http://bangjae.jeju119.go.kr/)에서 운영하고 있다. 본 연구에서 사용한 강우관측소들의 데이터는 해당 웹사이트에서 다운받아 사용할 수 있다. 제주특별자치도개발공사에서 실시간으로 관측 및 관리하고 있는 지하수위 및 취수량 데이터는 공개적으로 제공되지 않는 자료이다.
Table 1.
Period of precipitation, groundwater withdrawal and groundwater level data
성판악 강우관측소의 일단위 강수량은 전반적으로 교래 강우관측소의 일단위 강수량보다 많은 것을 확인할 수 있다(Figs. 2 and 3). 이것은 성판악 강우관측소(El. 763 m)의 고도가 교래 강우관측소(El. 400 m)의 고도보다 높아(Fig. 1) 산지효과로 인해 더 많은 강수량을 나타내는 것으로 판단된다. 관측정1(MW1)과 관측정2(MW2)의 이격거리는 직선거리로 약 1.2km 이며, 관측정1의 표고는 관측정2의 표고보다 낮다(Fig. 1). 하지만, 관측정1의 지하수위는 관측정2의 지하수위보다 높게 형성되어 있으며, 일단위 지하수위 최대 변동폭의 경우 관측정1은 42.5 m 이고 관측정2는 17.5 m 로 나타나 25 m의 차이를 보인다(Fig. 4). 이러한 현상은 제주도에서 발생한 수차례 화산활동이 복잡한 지하지질을 형성하여 관정별 수리지질학적 특성에 영향을 미치기 때문인 것으로 판단된다.
2.2 인공지능 모델
2.2.1 장단기기억 모델
장단기기억(LSTM)(Hochreiter and Schmidhuber, 1997) 모델은 순환신경망 모델의 일종으로 인공지능 모델이 시계열 데이터 정보의 학습 시 장기간 데이터의 기억을 위한 능력(long- term dependencies)을 저해하는 경사소멸(vanishing gradients) 문제(Bengio et al., 1994)를 해결하기 위해 개발된 딥러닝 인공지능이다. 이 모델은 최근 지하수 및 지표수 예측 등 다양한 수자원 연구 분야에 널리 사용되고 있다(Müller et al., 2021; Sun et al., 2022; Gholizadeh et al., 2023; Kow et al., 2024; Han et al., 2025). LSTM 모델은 장기간 데이터의 기억을 위해 carry track이라는 독특한 기능을 사용한다. 이 carry track은 일종의 컨베이어벨트로 시계열 데이터 내의 각 계산시간(time step, t)에서 추출한 정보를 장기간 저장한다(Fig. 5). 따라서 데이터에서 추출한 정보를 시계열 데이터의 시간대별 처리 과정과 평행하게 배치한 carry track을 통해 이동시키고, 각 계산 시간대에서 필요할 때마다 추출한 정보를 재사용한다. 이 과정을 통해 LSTM 모델은 장기간 시계열 데이터 모의 시 오래된 정보가 사라지는 문제를 해결한다(Chollet and Allaire, 2018). LSTM 모델은 데이터 내 장기간의 정보를 학습 시 아래와 같은 네 가지 변환을 사용한다. 이 모델 내 각 뉴런에서 t 시간대의 결과()는 아래와 같이 계산된다.
여기에서 는 t 시간대의 입력 데이터, 는 t 시간대의 상태로써 t-1 시간대의 결과의 상태, 는 t 시간대의 carry 값, , , 는 결과 계산을 위한 , , 각각의 가중치 행렬, •은 내적(dot product)을 의미한다. 가중치는 LSTM 모델의 매개변수이고, 는 뉴런의 편이이며, 은 sigmoid 함수와 tanh 함수를 사용하는 활성화함수이다.
carry 값은 아래와 같은 세 가지의 개별적인 변환을 통해 업데이트된다.
여기에서 는 sigmoid 함수([0, 1]의 범위)를 통해 새롭게 추가된 정보, 는 sigmoid 함수를 통해 삭제된 정보, 는 함수([-1, 1]의 범위)를 통한 정보의 중요도를 나타낸다. 따라서, 와 를 곱하여 새로운 정보를 얻고, 와 를 곱하여 연관성이 없는 carry 내 정보를 제거하며, 와 를 더하여 새로운 carry 값을 계산한다. LSTM 모델의 특징은 carry track 기능을 사용하여 다음 번 출력과 다음 번 상태를 변조한다는 점에 있다(Chollet and Allaire, 2018).
2.2.2 게이트 순환 유닛 모델
게이트 순환 유닛(GRU)(Cho et al., 2014) 모델은 LSTM 모델로부터 영감을 받아 개발된 딥러닝 인공지능 모델로, 순환신경망을 사용하여 출력값을 해당 뉴런에 다시 입력함으로써 모의결과를 개선하는 모델이다. 이 모델은 LSTM 모델과 함께 최근 지하수 및 지표수 예측 등 다양한 수자원 연구 분야에 널리 사용되고 있다(Zhang et al., 2021; Gharehbaghi et al., 2022; Nan et al., 2023; Huan, 2024; Chidepudi et al, 2025). GRU 모델은 LSTM 모델과 같은 원리로 작동하며, 구조가 다소 간단하여 LSTM 모델만큼 데이터 해석 능력은 나타내지 못하지만 더욱 빠르게 연산할 수 있다는 장점이 있다(Chollet and Allaire, 2018). GRU 모델은 LSTM 모델의 구조를 단순화함으로 인해 많은 매개변수로 인한 학습기간의 모의결과가 과적합되어 검증기간의 모의성능이 낮아지는 단점을 개선할 수 있다. GRU 모델은 reset gate ()와 update gate ()라는 두 개의 연산 프로세스를 사용한다(Fig. 6). reset gate와 update gate는 각각 현재로부터 가까운 기간과 먼 기간 정보를 학습하여 모사할 때 더욱 활성화 된다(Cho et al., 2014; Lin et al., 2022). reset gate는 이전 상태를 얼마나 잊어야 하는지를 결정하며(0에서 1의 범위), reset gate의 값이 0에 가까울수록 이전 상태의 정보를 잊고 현재 입력정보를 가져온다(Cho et al., 2014). update gate는 이전 상태의 정보를 얼마나 가져와야 할지를 결정하며(0에서 1의 범위), LSTM 모델의 forget gate와 input gate가 결합한 memory cell과 비슷한 역할을 함으로써 장기간 정보를 기억하는데 도움을 준다(Cho et al., 2014). update gate의 값이 1에 가까울수록 이전 상태의 정보를 우선적으로 가져오고, 0에 가까울수록 새로운 정보를 우선적으로 가져온다. 만약 update gate의 값이 1일 경우 1- 연산을 통과한 신호는 0이 되어 새로운 정보는 사용되지 않으며, 값이 0일 경우 이전 상태의 정보는 사용되지 않고 새로운 정보만 사용된다.
GRU 모델의 연산구조는 아래 식과 같이 나타낼 수 있다(Cho et al., 2014).
여기에서 는 t 시간대의 입력자료, 는 t-1 시간대의 결과의 상태, 와 는 결과계산을 위한 와 각각의 가중치 행렬, 는 가중치 행렬에 뒤따르는 편이(bias), 𝜎는 sigmoid함수, 는 hyperbolic tangent 함수, •은 내적(dot product), 는 t 시간대의 결과를 의미한다.
2.2.3 인공신경망 모델
인공신경망(ANN) 모델은 순전파(feed-forward) 모델로 인간 뇌의 수많은 뉴런과 시냅스의 결합을 통해 반응을 전달하는 구조를 모방한 기계학습 방법으로서 복잡한 비선형적인 문제들을 병렬적 학습을 통해 효율적으로 자연현상을 모사한다(Haykin, 2009). 지하수 및 지표수 모의 등 수자원 분야에 널리 사용되어 온 ANN 모델(Yin et al., 2021; Kim and Lee, 2022; Seidu et al., 2023; Mirzaei and Shirmohammadi, 2024; Sušanj Čule et al., 2025)은 복수의 입력변수들을 수많은 뉴런(노드)로 연결된 네트워크를 사용하여 목표변수를 모의함으로써 비선형적인 자연현상을 모사한다(Adamowski and Chan, 2011). 즉, 이 모델은 복수의 입력 관측 시계열 데이터와 목표 관측 시계열 데이터 간의 상관관계를 이용하여 목표 관측 시계열 데이터를 모사한다(Jha and Sahoo, 2014). ANN 모델은 입력층(input layer), 단수 또는 복수의 은닉층(hidden layer), 출력층(output layer)의 순서로 구성된다(Fig. 7). 각 층에는 단수 또는 복수의 뉴런으로 구성된다. 계산 과정으로 입력층의 입력변수 값에 가중치(매개변수)를 곱하고 편이(bias)를 더한 값에 활성화함수를 곱한 값을 다음 층에 전달하며, 이 과정을 출력층까지 순차적으로 수행하여 목표 관측 시계열 데이터를 모사하는 최종 출력값을 계산한다. ANN 모델의 계산과정은 아래 식과 같이 나타낼 수 있다(Kim and Valdés, 2003).
여기에서 는 입력층의 번째 뉴런에서 은닉층의 번째 뉴런으로의 연결강도(가중치), 는 입력층의 번째 입력변수, 는 번째 은닉뉴런의 편이, 는 은닉뉴런의 활성화함수, 는 은닉층의 번째 뉴런에서 출력층의 번째 뉴런으로의 연결강도, 는 번째 출력뉴런의 편이, 는 출력뉴런의 활성화함수, 는 출력변수로써 모의결과를 나타낸다.
ANN 모델의 학습을 위해 매개변수인 가중치들은 역전파(backpropagation) 알고리즘(Rumelhart et al., 1986)을 통해 모의 시계열 결과와 관측 시계열 데이터 간의 오차가 최소화 되도록 최적의 값으로 업데이트된다(Haykin, 2009). 회귀모델에서 절편의 역할을 하는 뉴런의 편이는 가중된 입력신호의 합을 증가 또는 감소시키는 역할을 한다(Haykin, 2009; Sahoo et al., 2017). 은닉뉴련의 활성화함수로 최근 다양한 인공지능 연구에 사용되는 Rectified Linear Unit(ReLU)(Hahnloser et al., 2000)를 적용하였다. 본 연구에서는 R 언어 기반 딥러닝 프레임워크인 Keras 패키지(Falbel et al., 2019)에서 제공하는 ANN, LSTM 및 GRU 모델을 사용하였다.
2.2.4 앙상블 모델
본 연구에서는 지하수위 예측 향상을 위해 가중평균(weighted average) 앙상블 모델을 적용하였다. 앙상블이란 복수의 모델의 결과를 결합하여 개선된 결과를 도출하는 기법(Afan et al., 2021)으로써, 1개의 모델을 사용하는 것보다 복수의 모델의 결과에서 정보를 추출하는 것이 더욱 신뢰할 만한 결과를 도출한다(Yin and Tsai, 2018; Yin et al., 2021). 결과의 중요도에 따라 각각의 모델의 결과에 다른 가중치 계수를 부여하는 가중평균 앙상블은 각각의 모델의 결과에 동일한 가중치를 주는 단순평균(simple average) 앙상블보다 더 나은 예측결과를 도출한다(Georgakakos et al., 2004; Kim et al., 2006; Roy et al., 2021). 인공지능 모델의 가중평균 앙상블은 아래 식과 같이 나타낼 수 있다.
여기에서 는 앙상블 모델의 시계열 결과, 는 조정계수(intercept), 는 첫 번째 인공지능 모델의 가중치계수, 는 첫 번째 인공지능 모델의 시계열 결과, 는 두 번째 인공지능 모델의 가중치계수, 는 두 번째 인공지능 모델의 시계열 결과, 는 세 번째 인공지능 모델의 가중치계수, 는 세 번째 인공지능 모델의 시계열 결과를 나타낸다.
본 연구에서 사용되는 인공지능 모델은 3개(LSTM, GRU 및 ANN)로써 가중평균 할 모델의 개수가 적으므로, 가중평균 앙상블을 위해 널리 사용되는 다중 선형 회귀(multiple linear regression) 모델을 사용하였다. 다중 선형 회귀식의 계수들은 아래에서 나타낸 최소제곱법(ordinary least-squares)을 사용하여 추정하였다.
여기에서 는 관측지하수위 시계열자료이며, 관측지하수위와 앙상블 모델의 시계열 결과의 차이인 잔차의 제곱합을 최소로 하는 계수를 추정하였다. 가중평균 앙상블 모델은 R 패키지의 통계 모듈에 있는 다중 선형 회귀모델을 사용하였다.
2.3 연구 방법
지하수위 변동특성이 서로 다른 2개 지하수위 관측정에 대해 인공지능 모델들과 앙상블 모델을 사용하여 미래 1~3개월 후 지하수위를 예측하였다. 각 관측정에 대한 인공지능 모델의 미래 지하수위 예측을 위한 입력자료로 과거 강수량, 취수량, 그리고 예측 대상 관측정의 지하수위 자료를 사용하였다. 예를 들어 미래 1개월 지하수위 예측의 경우, 관측정1의 2022년 1월 지하수위를 예측하기 위해 입력자료로 2021년 12월까지의 월단위 강수량, 취수량, 그리고 관측정1의 지하수위 자료를 입력자료로 사용하였다. 참고 사항으로, 변수별로 이전의 정보를 사용하기 위한 1개월(t-1), 2개월(t-2) 등 지체된 시계열자료(lag time)를 입력자료로 테스트한 결과 예측성능 개선에 미치는 영향이 미미하여 본 연구에 사용하지 않았다. 특히 순전파 모델인 ANN 모델과 달리 LSTM 모델과 같은 순환신경망 모델은 구조적으로 시계열 데이터 내 이전의 정보를 기억하는 능력이 있으므로(Zhang et al., 2018) 지체된 시계열자료의 추가적인 사용은 필요하지 않다. 또한 기온 및 잠재증발산량을 입력자료로 사용하지 않았는데 그 이유는 이 기상자료들을 입력자료로 테스트한 결과 지하수위 예측성능 개선에 미치는 영향이 거의 없었기 때문이다. 앙상블 모델의 각 인공지능(LSTM, GRU, ANN) 모델 대비 미래 1~3개월 후 지하수위 예측 개선 효과를 분석하였으며, 각 인공지능 모델의 지하수위 예측성능을 지하수위 관측정별로 비교분석하였다. 장기간 예측인 미래 3개월 후 지하수위 예측은 미래 1개월 후 지하수위 예측보다 선제적인 취수량 관리를 위한 준비기간 마련을 위해 필요하다. 결과 분석 시, 지하수위 관측정별로 전체 데이터 기간과 일반적으로 낮은 지하수위 기간(11~5월)에 대한 지하수위 모의결과를 사용하여 예측 성능을 통계분석 하였다. 극한 가뭄 등에 선제적으로 대응하기 위해서는 최저 지하수위 예측 등 낮은 지하수위 기간의 지하수위 예측이 중요하므로 낮은 지하수위 기간에 대한 예측 성능을 추가적으로 평가하였다. 여기에서 낮은 지하수위 기간이란 일반적인 건기(비 강수기)를 의미하며 제주도의 태풍에 따른 강우 시기와 두꺼운 화산암의 비포화대 지질특성에 따른 강우-지하수위 반응 시간 등의 특성을 고려하여 설정하였다.
인공지능 모델의 지하수위 관측정별 월단위 학습, 검증 및 테스트 기간은 서로 독립된 기간을 사용하였다. 관측정1과 관측정2의 학습기간은 각각 2015년 7월 ~ 2021년 12월, 2012년 7월 ~ 2021년 12월로 설정하였다. 검증기간은 관측정1과 관측정2 모두 2022년 1월 ~ 2022년 12월이며, 테스트기간은 관측정1과 관측정2 모두 2023년 1월 ~ 2023년 12월로 설정하였다. 사용된 월단위 강수량, 취수량, 지하수위 데이터의 샘플수는 관측정1의 경우 510개(5개 관측소), 관측정2의 경우 690개(5개 관측소)로 총 1200개이다. 사용된 데이터의 총 기간은 관측정1은 8.5년, 관측정2는 11.5년으로 짧아 충분한 학습을 위해 대부분의 데이터를 인공지능 모델의 학습과 검증에 사용하였다. 테스트 기간이 상대적으로 짧아 인공지능 모의성능 통계분석을 위해 사용되는 데이터의 개수가 적어 테스트 기간 모의성능에 대한 정확한 판단이 어려울 수 있다. 또한 3개 인공지능 모델의 전체기간(학습, 검증, 테스트) 지하수위 예측결과를 사용하여 앙상블 모델의 계수를 추정 및 지하수위를 예측하며, 앙상블 모델에 의한 전체적인 지하수위 예측성능 개선효과 분석이 본 연구의 목적이므로, 인공지능 모델과 앙상블 모델의 전체기간 모의결과를 사용하여 모의성능 통계값을 도출하였다.
3개 인공지능 모델의 학습절차는 다음과 같다(Fig. 8). 각 인공지능 모델은 활성화함수와 가중치(매개변수)를 사용하여 입력 시계열 데이터를 모의 지하수위 시계열 데이터로 변환한다. 그 후, 모의 지하수위 시계열 데이터와 관측 지하수위 시계열 데이터의 비교 과정을 통해 목적함수(loss function)를 계산한다. 본 연구에서 사용한 목적함수는 평균절대오차(mean absolute error)이다. 만약 모의 지하수위와 관측 지하수위 간의 큰 차이로 인해 목적함수 값이 크게 되면 역전파 알고리즘 기반 최적화기(optimizer)를 사용하여 모의 지하수위가 관측 지하수위에 가장 근사하도록(목적함수 값이 최소가 되도록) 가중치를 업데이트(학습)한다. 학습기간에 대한 인공지능 모의결과의 과적합(overfitting)을 방지하기 위해 본 연구에서는 콜백(callback) 기능과 드롭아웃(dropout) 기능을 사용하였다. 콜백 기능은 학습기간의 매개변수 보정과정 중에 추정된 매개변수를 검증기간에 대해 검증하여 학습 및 검증 기간의 모의결과가 모두 적절히 도출되도록 하기 위한 기법으로, 임의로 설정한 반복횟수(patience)만큼 학습기간에 대해 매개변수를 업데이트하여도 검증기간의 모의결과가 더 이상 개선되지 않을 때 학습을 조기종료(early-stopping) (Prechelt, 2012) 한다. 드롭아웃 기능은 인공지능 모델의 학습 시 은닉뉴런을 임의로 설정한 비율만큼 무작위로 비활성화시킴으로써 과적합 문제를 해결한다.
인공지능 모델의 학습을 위해서는 매개변수(가중치)의 추정 이외에 모델 구축에 필요한 하이퍼매개변수(hyper-parameter) 값의 설정이 중요하다. 하이퍼매개변수 값의 설정에 대한 명확한 방법과 기준은 없으며(Chollet and Allaire, 2018), 본 연구에서는 시행착오 방법을 사용하여 설정하였다(Table 2). 인공지능 모델별로 2개의 은닉층을 사용하였으며, 충분한 학습을 위해 은닉층별 은닉뉴런의 개수(n_units)는 100개를 사용하였다. 은닉뉴런을 많이 사용할수록 데이터의 복잡한 특성을 충분히 학습할 수 있을 뿐만 아니라 목적함수 값의 수렴 속도가 빨라진다는 장점이 있다. 하지만 인공지능 모델의 연산시간이 증가하고 학습 중 과적합 문제가 발생할 수 있는 단점 또한 존재한다. 이러한 과적합 문제를 해결하기 위해 앞서 기술한 바와 같이 드롭아웃 및 콜백 기능을 사용하였다. 드롭아웃과 재귀적 드롭아웃(recurrent_dropout)의 비율은 각각 0.5로 설정하였으며 콜백 기능 사용을 위한 매개변수(가중치) 업데이트 반복횟수(patience)는 10으로 설정하였다. batch_size는 인공지능 모델이 효율적으로 학습하기 위해 한번에 처리할 수 있는 소규모 입력 시계열 데이터의 개수를 의미하며, 월단위 데이터의 길이를 고려하여 6개로 설정하였다. 인공지능 매개변수의 최적값을 추정하기 위해 딥러닝 분야에서 널리 사용되고 있는 최적화기인 Adam (Kingma and Ba, 2014)을 사용하였으며, 최적화기의 학습률(learning_rate)에는 0.001을 적용하였다. epoch는 전체 학습 데이터에 대해 매개변수를 1번 업데이트 하는 것을 의미하며, 효율적인 학습을 위해 최대 업데이트 횟수(n_epochs)에 50회를 적용하였다. 마지막 출력층에 대한 활성화 함수는 출력층으로 수신되는 입력신호를 그대로 출력신호로 전달하는 선형함수(Maier and Dandy, 2000)를 적용하였다.
Table 2.
Hyper-parameters of artificial intelligence models
인공지능 모델과 앙상블 모델의 예측성능 평가를 위해 수문학 분야에서 널리 사용되고 있는 평가지수인 Nash-Sutcliffe efficiency (NSE)(Nash and Sutcliffe, 1970)와 Root Mean Square Error (RMSE)를 사용하였다. NSE는 모의결과의 전반적인 적절성을 나타내며(Moriasi et al., 2007) RMSE는 모의 결과가 관측 데이터에 대해 근사한 정도를 나타낸다(Le et al., 2019). NSE와 RMSE는 아래의 식과 같이 나타낼 수 있다.
여기에서 은 시계열 데이터의 개수, 와 는 각각 시간대의 관측 및 모의 지하수위, 는 관측 지하수위의 평균값이다. NSE의 범위는 -∞에서 1이며, 모의 결과가 관측 데이터에 정확히 일치하는 경우 1의 값을 갖고, 모의 결과가 관측 데이터의 평균값과 동일한 경우 0의 값을 갖는다. RMSE는 모의 결과가 관측 데이터에 일치하는 경우 0의 값을 갖는다.
3. 결과 및 고찰
3.1 전체 데이터 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
인공지능 모델과 앙상블 모델의 2개 관측정 지하수위에 대한 1~3개월 예측 결과는 Table 3과 같다. 이 결과는 2.3절에서 기술한 바와 같이 학습, 검증 및 테스트 기간을 포함한 전체 모의 기간 데이터를 사용한 통계값이다. 지하수위 변동폭이 상대적으로 큰 관측정1(MW1)의 경우 1개월 예측은 NSE 값이 0.8961 이상을 보여 높은 모의 성능을 나타내었다(Figs. 9(a) ~9(d)). 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 특히 저수위와 중수위에 대한 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 9(d)). 2개월 및 3개월 예측의 NSE 값은 각각 0.7154 및 0.5086 이상을 보여 적절한 모의 성능을 나타내었으며(Moriasi et al., 2007) 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 1.9940 m, 3.2622 m, 4.2650 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 3.8176 m의 RMSE 값을 나타내었다. 이 지하수위 예측성능은 관측정1의 월단위 관측 지하수위 최대 변동폭(26.2 m)을 고려 시 수용 가능하다고 판단된다. 관련 선행 연구 사례로, ANN 모델을 사용하여 관측 지하수위 최대 변동폭이 14 m인 이란의 Shiraz 평원에 대해 월단위 지하수위를 예측한 결과 약 2 m의 RMSE를 도출하였다(Rakhshandehroo et al., 2012).
Table 3.
Statistics on the groundwater level prediction performance of artificial intelligence models for the entire data period of the observation wellsa
지하수위 변동폭이 상대적으로 작은 관측정2(MW2)의 경우 1개월 예측은 NSE 값이 0.9131 이상을 보여 높은 모의 성능을 나타내었다(Figs. 9(e)~9(h)). 관측정 1의 경우와 마찬가지로 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 9(h)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8061 및 0.6529 이상을 보여 적절한 모의 성능을 나타내었으며 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 0.8380 m, 1.2540 m, 1.6720 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 1.6075 m의 RMSE 값을 나타내었다. 이 RMSE 값은 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적절한 지하수위 예측능력을 도출하였다고 판단된다.
2개 관측정 모두 인공지능 모델 및 앙상블 모델의 지하수위 예측성능은 예측기간이 길어질수록 낮아졌다. 현재 데이터의 정보를 사용하여 미래의 지하수위를 예측하므로, 예측이 더욱 어려운 먼 미래의 지하수위를 예측할수록 예측성능이 낮아지는 현상은 예상된 결과라고 판단된다. 본 연구 대상 지역의 경우 Moriasi et al. (2007)의 적절성 평가 기준(NSE > 0.5)을 고려 시 최대 3개월까지 월단위 미래 지하수위의 예측이 가능하다고 판단된다. 그리고 Shin et al. (2024)의 연구에서 주장된 바와 같이 관측 지하수위의 변동폭이 상대적으로 크고 복잡한 관측정(MW1)의 지하수위 예측성능은 그 반대의 경우(MW2)보다 낮았다. 지하수위의 변동폭이 상대적으로 크고 복잡한 관측정에 대해 인공지능 모델의 지하수위 예측성능이 상대적으로 낮은 이유는, 제주도에서 발생한 수차례 화산활동에 의해 이 관측정 주변 지역에 복잡한 지하지질을 형성하여 이로 인한 복잡한 수리지질학적 특성이 상대적으로 크고 복잡한 지하수위를 형성함에 따라 인공지능 모델이 이러한 지하수위 변동 특성을 학습하기에 상대적으로 어렵기 때문인 것으로 판단된다.
주목할만한 점은 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 다르다는 점이다(Table 3). 관측정1(MW1)의 경우 1개월, 2개월, 3개월 예측에 대해 가장 낮은 예측성능을 보이는 인공지능 모델은 각각 GRU, GRU, LSTM이었으며, 관측정2(MW2)의 경우에는 각각 ANN, LSTM, GRU 모델이었다. 따라서 특정 인공지능 모델이 항상 가장 높은 지하수위 예측성능을 나타내는 것은 아니었으며, 모델의 구조가 상대적으로 단순한 ANN 모델이라도 항상 가장 낮은 예측성능을 도출하지는 않았다. 이것은 더욱 개선된 지하수위 예측을 위해서는 서로 다른 인공지능 모델의 결과를 활용하는 앙상블 모델이 필요하다는 것을 의미하며, 실제로 앙상블 모델은 3개 인공지능 모델보다 더욱 높은 예측결과를 도출하였다. 3개 인공지능 모델의 예측성능이 서로 다른 이유는 2.2절에서 기술한 바와 같이 인공지능 모델들 간의 구조적 차이점에 의한 것으로 판단된다. 특히 구조가 상대적으로 단순한 ANN 모델의 예측성능이 상대적으로 복잡한 LSTM 및 GRU 모델들의 예측성능과 대등한 점은 주목할 만한 사항이다. 앙상블 모델의 예측 성능이 3개 인공지능 모델보다 높은 이유는 상대적으로 낮은 예측성능을 보이는 결과들을 결합하는 앙상블 기법을 통해 더욱 강한 예측 알고리즘을 개발하기 때문인 것으로 판단된다(Afan et al., 2021; Yariyan et al., 2020).
3.2 낮은 지하수위 기간에 대한 인공지능 모델과 앙상블 모델의 지하수위 예측성능 분석
2개 관측정 지하수위에 대해 인공지능 모델과 앙상블 모델의 전체 모의 기간 데이터 중 낮은 지하수위 기간(11~5월)의 결과를 추출하여 사용한 1~3개월 예측성능 통계 결과는 Table 4와 같다. 지하수위 변동폭이 상대적으로 큰 관측정1(MW1)의 경우 1개월 예측은 NSE 값이 0.9411 이상을 보여 우수한 모의 성능을 나타내었다(Figs. 10(a)~10(d)). 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 10(d)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8126 및 0.5750 이상을 보여 적절한 모의 성능을 나타내었으며 앙상블 모델이 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 1.3298 m, 2.3709 m, 3.5709 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 2.9067 m의 RMSE 값을 나타내었다. 3.1절에서 기술한 바와 같이 이 지하수위 예측성능은 관측정1의 월단위 관측 지하수위 최대 변동폭(26.2 m)을 고려 시 수용 가능하다고 판단된다.
지하수위 변동폭이 상대적으로 작은 관측정2(MW2)의 경우 1개월 예측은 NSE 값이 0.9287 이상을 보여 우수한 모의 성능을 나타내었다(Figs. 10(e)~10(h)). 관측정 1의 경우처럼 앙상블 모델이 인공지능 모델보다 높은 NSE 값을 보였으며, 저수위부터 고수위까지 모의 데이터가 관측 데이터에 근사하게 분포하였다(Fig. 10(h)). 2개월 및 3개월 예측의 NSE 값은 각각 0.8997 및 0.7534 이상을 보여 적절한 모의 성능을 나타내었으며, 앙상블 모델은 가장 높은 NSE 값을 나타내었다. RMSE 값은 1개월, 2개월, 3개월 예측에 대해 각각 0.7856 m, 0.9320 m, 1.4612 m 이하를 보였으며, 특히 앙상블 모델의 3개월 예측의 경우 1.3898 m의 RMSE 값을 나타내었다. 이 RMSE 값은 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적절한 지하수위 예측성능으로 판단된다.
낮은 지하수위 기간(11~5월)의 결과(Table 4)는 전체 모의 기간 데이터를 사용한 결과(Table 3)의 결과보다 높은 지하수위 예측성능을 보였다. 이것은 인공지능 모델과 앙상블 모델이 낮은 지하수위 기간(11~5월)의 월단위 지하수위 예측에 대해 더욱 적합하다는 것을 의미한다. 제주도와 같이 지하수를 대부분의 용수로 사용하는 경우에는 지속가능한 지하수의 이용을 위한 관리를 위해 최저 지하수위 예측 등 미래 낮은 지하수위의 예측이 중요하며, 높은 지하수위 예측의 중요성은 상대적으로 낮을 수 있다. 특히 앙상블 모델은 관측정1(MW1)과 관측정2(MW2)의 3개월 예측에 대해 각각 0.7184와 0.7769의 적절한 NSE 값을 나타내어 지하수위 예측 및 관리를 위해 활용이 가능하다. 따라서 본 연구의 인공지능 모델 및 앙상블 모델을 사용한 낮은 지하수위 예측 및 평가 방법은 지하수 이용의 비중이 높은 지역에 유용하게 사용될 수 있다.
Table 4.
Statistics on the groundwater level prediction performance of artificial intelligence models for the low groundwater level period (November to May) of the observation wellsa
주목할만한 점은 낮은 지하수위 기간(11~5월)에 대한 모의결과의 분포(Fig. 10)가 전체 모의 기간에 대한 모의결과의 분포(Fig. 9)보다 1:1 선에 근사하다는 점이다. 낮은 지하수위 기간(11~5월)은 대부분 지하수위 감수곡선 기간에 해당한다. 이것은 인공지능 모델과 앙상블 모델은 지하수위 감수곡선 기간에 대해 더욱 높은 지하수위 예측성능을 나타낸다는 것을 의미한다. 역으로 본 연구에서 설정한 우기(6~10월)의 관측 지하수위 상승기간에 대해서는 인공지능 모델과 앙상블 모델의 지하수위 예측성능은 상대적으로 낮아지는 것으로 해석할 수 있다. 참고로 낮은 지하수위 기간(11~5월)이라도 상대적으로 높은 지하수위가 관측되는데(Fig. 10) 10월의 태풍에 의한 많은 강수량이 11월의 관측 지하수위에 영향을 미친 결과로 판단된다.
낮은 지하수위 기간에 대해 예측성능이 더 높은 이유는, 이 기간은 대부분 무강우에 따른 지하수위 감수곡선 기간에 해당하여 시간에 따른 변동성이 큰 강수라는 외부 인자가 영향을 미치지 않고 시간에 따라 변동성이 거의 없는 수 겹의 화산지층 등 지하지질 특성에 따른 중력 흐름이 지하수위의 점진적 감소 패턴에 지배적인 영향을 미치므로 인공지능 모델은 이러한 예측가능한 지하수위 하강 패턴을 상대적으로 쉽게 학습하여 미래 지하수위를 예측하기 때문인 것으로 판단된다. 반면, 본 연구에서 개발한 인공지능 모델은 현재까지의 강수량, 취수량, 지하수위 데이터를 학습하여 미래 지하수위를 예측하므로 제주도의 잦은 태풍 등 시간에 따른 변동성이 큰 미래 강수량에 대한 정보를 알 수 없어 미래 지하수위 상승 구간의 경우 지하수위 예측성능이 상대적으로 낮은 것으로 판단된다.
3.3 앙상블 모델의 지하수위 예측성능 개선효과 분석
앙상블 모델의 사용이 개별 인공지능 모델 대비 지하수위 예측성능 개선에 미치는 영향은 Tables 5 and 6과 같다. 3.1절에서 기술한 바와 같이 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 다르기 때문에 인공지능 모델 대비 앙상블 모델에 의한 예측성능 개선 효과도 관측정별 및 예측기간별로 서로 다르다. 전체 모의 기간 데이터를 사용한 결과의 경우(Table 5) 최대 지하수위 예측개선 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델 대비 앙상블 모델에서 나타났으며, NSE 값은 0.0977, RMSE 값은 0.4474 m만큼 개선되었다. 낮은 지하수위 기간(11~5월)의 결과의 경우(Table 6)에서도 최대 지하수위 예측개선 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델 대비 앙상블 모델에서 나타났으며, NSE 값은 0.1434, RMSE 값은 0.6642 m만큼 개선되었다. 특히 이 낮은 지하수위 기간(11~5월)의 경우에 대한 높은 NSE 개선효과(LSTM 모델 NSE 0.5750 대비 앙상블 모델 NSE 0.7184)는 먼 미래 낮은 지하수위의 정확한 예측을 위한 앙상블 모델 사용의 타당성을 뒷받침한다.
Table 5.
Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the entire data period of the observation wellsa
Table 6.
Impact of the ensemble of artificial intelligence models on improving groundwater level prediction performance for the low groundwater level period (November to May) of the observation wellsa
앙상블 모델에 의한 관측정별 및 미래 예측기간별 최대 예측개선의 경우에 대한 지하수위 비교 결과는 Figs. 11 and 12와 같다. 전체 모의 기간 데이터에 대한 결과(Fig. 11)에서 앙상블 모델의 모의 지하수위(빨간색 점)는 개별 인공지능 모델의 모의 지하수위(파란색 점) 보다 1:1선에 근사한 것을 확인할 수 있다. 이 개선효과는 낮은 지하수위 기간(11~5월)의 결과(Fig. 12)에서 더욱 뚜렷이 확인할 수 있는데, 앙상블 모델이 예측한 1~3개월 미래 지하수위는 저수위부터 고수위까지 1:1선에 더욱 근사한 것을 확인할 수 있다. 따라서 먼 미래의 지하수위 예측에 대해 더욱 정확한 결과를 도출하기 위해서는 다양한 인공지능 모델의 결과를 사용한 앙상블 모델의 사용이 필요하다.
4. 결 론
본 연구에서는 제주도의 남동쪽 표선유역 내 중산간 지역에 위치한 2개 관측정을 대상으로 앙상블 모델의 사용이 각 인공지능(LSTM, GRU, ANN) 모델 대비 미래 1~3개월 후 지하수위 예측 개선 효과를 전체 데이터 기간과 낮은 지하수위 기간(11~5월)에 대해 각각 분석하였다. 분석 결과, 전체 데이터 기간에 대해 인공지능 모델과 앙상블 모델은 1~3개월 미래 지하수위를 적절히 예측하였으며 앙상블 모델은 개별 인공지능 모델보다 높은 예측성능을 나타냈다. 지하수위 예측성능은 예측기간이 길어질수록 그리고 관측 지하수위의 변동폭이 상대적으로 큰 관측정일수록 낮았다. 지하수위의 변동폭이 상대적으로 큰 관측정에 대해 인공지능 모델의 지하수위 예측성능이 상대적으로 낮은 이유는, 제주도에서 발생한 수차례 화산활동에 의해 이 관측정 주변 지역에 복잡한 지하지질을 형성하여 이로 인한 복잡한 수리지질학적 특성이 상대적으로 크고 복잡한 지하수위를 형성함에 따라 인공지능 모델이 이러한 지하수위 변동 특성을 학습하기에 상대적으로 어렵기 때문인 것으로 판단된다. 3개 인공지능 모델의 지하수위 예측성능의 우열은 관측정별로 그리고 미래 예측기간별로 서로 달라 특정 인공지능 모델이 항상 가장 높은 지하수위 예측성능을 나타내지 않았으며, 따라서 더욱 개선된 지하수위 예측을 위해서는 서로 다른 인공지능 모델의 결과를 활용하는 앙상블 모델이 필요하다.
낮은 지하수위 기간(11~5월)에 대한 지하수위 예측성능은 전체 데이터 기간에 대한 결과보다 높았으며, 이것은 인공지능 모델과 앙상블 모델이 대부분 지하수위 감수곡선 기간에 해당하는 낮은 지하수위 기간(11~5월)의 지하수위 예측에 대해 더욱 적합하다는 것을 의미한다. 낮은 지하수위 기간에 대해 예측성능이 더 높은 이유는, 이 기간은 대부분 무강우에 따른 지하수위 감수곡선 기간에 해당하여 시간에 따른 변동성이 큰 강수라는 외부 인자가 영향을 미치지 않고 시간에 따라 변동성이 거의 없는 수 겹의 화산지층 등 지하지질 특성에 따른 중력 흐름이 지하수위의 점진적 감소 패턴에 지배적인 영향을 미치므로 인공지능 모델은 이러한 예측가능한 지하수위 하강 패턴을 상대적으로 쉽게 학습하여 미래 지하수위를 예측하기 때문인 것으로 판단된다. 반면, 본 연구에서 개발한 인공지능 모델은 현재 강수량, 취수량, 지하수위 데이터를 학습하여 미래 지하수위를 예측하므로 제주도의 잦은 태풍 등 시간에 따른 변동성이 큰 미래 강수량에 대한 정보를 알 수 없어 미래 지하수위 상승 구간의 경우 지하수위 예측성능이 상대적으로 낮은 것으로 판단된다. 특히 앙상블 모델은 관측정1(MW1)과 관측정2(MW2)의 3개월 예측에 대해 각각 0.7184와 0.7769의 적절한 NSE 값을 나타내어 본 연구대상 지역의 낮은 지하수위 기간(11~5월)에 대한 장기간 지하수위 예측 및 관리를 위해 활용이 가능하다. 앙상블 모델에 의한 예측성능 개선 최대 효과는 관측정1(MW1)에 대한 3개월 미래 지하수위 예측 시 LSTM 모델(NSE 0.5750) 대비 앙상블 모델(NSE 0.7184)에서 나타났으며 NSE 값이 0.1434만큼 개선되었다. 이 높은 NSE 개선효과는 먼 미래 낮은 지하수위의 보다 정확한 예측을 위한 앙상블 모델 사용의 필요성을 뒷받침한다. 본 연구에서 제시한 인공지능 모델 및 앙상블 모델을 사용한 낮은 지하수위 예측 및 평가 방법은 제주도와 같이 지하수 이용의 비중이 높은 지역의 지하수위 관리에 유용하게 사용될 수 있다.
본 연구는 제주도 중산간지역 내 지하수위 관측정 2개소에 대해 연구를 수행하여 복수의 다른 지역에 대해 테스트를 수행하지 않아 연구결과의 일반화에 대한 한계점이 있다. 그리고 사용한 데이터의 기간이 짧아 데이터 개수의 제약으로 인해 대부분 자료를 학습에 활용하였다는 점과 지하수위 예측결과의 불확실성 평가를 수행하지 않은 한계점이 있다. 향후 다른지역에 대한 본 연구방법의 적용성 평가와 학습, 검증, 테스트 자료 비중에 따른 예측성능 평가 및 예측결과의 불확실성 평가 연구를 수행할 예정이다.














