1. 서 론
2. 자료 및 방법
2.1 연구대상 지역 및 자료
2.2 인공지능 모델
2.3 연구방법
3. 결과 및 고찰
3.1 백록담 강수량 데이터 제외 시 인공지능 모델의 지하수위 예측성능 분석
3.2 백록담 강수량 데이터 포함 시 인공지능 모델의 지하수위 예측성능 분석
3.3 백록담 강수량 추가 사용 시 인공지능 모델의 지하수위 예측성능 개선효과 분석
4. 결 론
1. 서 론
지하수는 지표수와 더불어 내륙과 섬 지역에서 농업, 공업 및 생활 등에 필요한 다양한 용수로 사용할 수 있는 중요한 수자원이다. 지하수가 전체 수자원의 82%를 차지하는(JSSGP, 2022) 제주도의 경우 지속가능한 지하수의 이용을 위해 지하수량의 예측 및 관리는 매우 중요한 사항이다. 특히, 최근 기후변화 및 기상변화에 따른 강수량의 변화는 지하수량의 변화에 직접적인 영향을 미치기 때문에 가능한 다수의 그리고 유용한 기상관측소의 데이터를 사용하여 정확한 미래 지하수위 변동성을 예측할 수 있는 연구가 반드시 필요하다.
지하수위 변동성을 모의하기 위해 물리적 기반 개념모델 및 수치모델을 사용할 수 있다(Mohanty et al., 2013; Bizhanimanzar et al., 2019). MODFLOW (McDonald and Harbaugh, 1988) 등 지하수 수치모델은 연구 및 실무에 널리 사용되고 있다. 지하수 수치모델을 활용한 모의결과의 정밀도와 정확성은 대수층의 특성, 지하의 지질 및 지형 등과 관련된 수문지질학적 데이터의 품질과 시공간적 데이터의 양에 영향을 받으므로 데이터의 취득이 제한된 지역의 경우 모델링 및 결과의 신뢰성은 제한된다(Adamowski and Chan, 2011; Barthel and Banzhaf, 2016; Sun et al., 2016; Tao et al., 2022).
수문지질학에 대한 물리적 데이터가 제한되어 있고 수문 프로세스의 물리적 이해보다 정확한 지하수위 예측결과를 도출하는 것이 목적인 경우에는 블랙박스 모델인 인공지능 모델이 수치모델보다 적합하다(Adamowski and Chan, 2011). 인공지능 모델은 지난 20여년 동안 수문지질학적 데이터 취득 제한 등 기존 수치모델의 단점을 극복하고 지하수위 모의를 위해 널리 그리고 성공적으로 사용되었으며 그 유용성을 많은 연구에서 보고하였다(Rajaee et al., 2019; Tao et al., 2022). 인공신경망 모델(Artificial Neural Network, ANN)(Lallahem et al., 2005), 퍼지 기반 모델(Adaptive Neuro Fuzzy Inference System)(Jeihouni et al., 2019), 지원 벡터 머신(Support Vector Machine)(Gong et al., 2016), 트리 기반 모델(Random Forest) (Davoudi Moghaddam et al., 2020), 유전자 프로그래밍(Genetic Programming)(Fallah-Mehdipour et al., 2013), 극단 학습 머신(Extreme Learning Machine)(Alizamir et al., 2018) 등이 지하수위 모의를 위해 사용되었다. 최근에는 딥러닝 순환신경망 모델인 장단기기억 모델(Long Short-Term Memory, LSTM)(Kow et al., 2024)과 게이트 순환 유닛(Gated Recurrent Unit)(Gharehbaghi et al., 2022) 등의 인공지능 모델이 지하수위 모의를 위해 사용되었으며 그 사용 빈도가 크게 늘고 있다. 특히, ANN 모델과 LSTM 모델은 다양한 수문학 및 수자원분야 연구에 사용된 빈도가 높다(Sit et al., 2020).
제주도의 중산간 지역은 화산활동에 의해 형성된 복잡한 지하지질로 인해 인근 지역의 관측정이라 하더라도 지하수위 변동특성이 매우 다르고 복잡하다. 또한 지표면부터 대수층까지 화산지층의 두께는 매우 커 지하수 흐름특성을 파악하기 어려우며 한라산 국립공원 내 지하지질에 대한 데이터는 충분하지 않다. 섬 지역에 대해 인공지능 모델을 활용한 지하수위 모의 연구가 있었지만(Mohanty et al., 2010; Payne et al., 2022; Kim et al., 2023) 섬 지역의 정확한 지하수위 예측을 위해 추가적인 데이터 활용 등에 대한 연구는 충분하지 않다.
본 연구의 목적은 제주도 내 표선유역 중산간지역에 위치한 서로 다른 지하수위 변동특성을 보이는 2개 관측정의 정확한 월 단위 지하수위 예측을 위해 상류지역에 위치한 백록담 기후변화관측소의 강수량 데이터를 추가적으로 사용하여 인공지능 모델의 지하수위 예측성능 개선효과를 비교분석 하는 것에 있다. 지하수위 예측을 위해 수문학 및 수자원분야 연구에 사용빈도가 높은 인공신경망(ANN) 모델과 장단기기억(LSTM) 모델을 사용하였다. 기존 연구와의 차이점으로 본 연구에서는 연구용으로만 제공되고 있는 희귀자료인 백록담 강수량 데이터를 추가적으로 사용 시 인공지능 모델이 제주도의 화산활동에 따른 복잡한 지하지질 특성에 의해 예측이 상대적으로 어려운 관측 지하수위를 더욱 적절히 모사하는지 비교분석 한다는 점에 있다. 본 연구의 연구방법은 2절에서 확인할 수 있으며 연구결과와 결론은 각각 3절과 4절에 기술하였다.
2. 자료 및 방법
2.1 연구대상 지역 및 자료
연구대상지역은 한국의 제주도 남동쪽 표선유역의 중산간에 위치한 2개 지하수위 관측정 지점이다(Fig. 1). 본 연구에 사용된 데이터는 백록담 기후변화관측소 분단위 강수량 데이터, 연구대상지역 인근의 2개 강우관측소(성판악, 교래) 일단위 강수량 데이터, 2개 지하수위 관측정 일단위 지하수위 데이터와 2개 지하수 취수원 일단위 취수량 데이터이다(Table 1). 이 분단위 및 일단위 데이터는 인공지능 모델을 이용한 월단위 지하수위 모의를 위해 월단위 데이터로 변환하였다. 백록담 기후변화관측소는 제주지방기상청에서 운영하는 국내 최정상 자동기상관측소(Automatic Weather Station)이다. 이 관측소에서 수집되는 기상 데이터는 연구목적을 위한 사용에 한해 제공되며 공개적으로 제공되지 않는 자료이다. 본 연구에서는 제주지방기상청에서 백록담 기상 데이터를 연구목적으로 제공받아 사용하였다. 성판악 강우관측소는 기상청(http:// www.weather.go.kr/)에서 운영하는 자동기상관측소이며, 교래 강우관측소는 제주도 재난안전대책본부(http://bangjae.jeju119.go.kr/)에서 운영하고 있다. 이 두 강우관측소의 데이터는 웹사이트에서 다운받아 사용할 수 있다. 지하수위 및 취수량 데이터는 제주특별자치도개발공사에서 실시간으로 관측 및 관리하고 있으며 공개적으로 제공되지 않는 자료이다.
Table 1.
백록담, 성판악과 교래 강우관측소의 일단위 강수량은 전반적으로 백록담, 성판악, 교래 순으로 많은 것을 확인할 수 있다(Figs. 2 and 3). Fig. 1에서 도시한 바와 같이 각 관측소의 고도는 백록담 관측소(El. 1,909 m), 성판악 관측소(El. 763 m), 교래 관측소(El. 400 m) 순으로 높으며, 산지효과로 인해 고도가 높은 강우관측소일수록 더 많은 강수량을 나타내는 것으로 판단된다. 관측정1(MW1)의 일단위 지하수위 최대 변동폭(42.5 m)은 관측정2(MW2)의 일단위 지하수위 최대 변동폭(17.5 m)보다 25 m가 크다(Fig. 4). 관측정1과 관측정2는 직선거리로 약 1.2 km 이격되어 있다. 그리고 관측정1의 표고는 관측정2의 표고보다 낮으나(Fig. 1) 관측정1의 지하수위는 관측정2의 지하수위보다 높게 형성되어 있다(Fig. 4). 이러한 현상은 제주도의 수차례 화산활동으로 인해 형성된 복잡한 지하지질이 관정별 수리지질학적 특성에 영향을 미친 것으로 판단된다.
2.2 인공지능 모델
2.2.1 인공신경망 모델
인공신경망(ANN) 모델은 수많은 뉴런과 시냅스의 결합을 통해 반응을 전달하는 인간의 뇌 구조를 모방하여 복잡한 비선형적인 문제들을 병렬적 학습을 통해 효율적으로 자연현상을 모사하는 기계학습 방법 중 하나이다(Haykin, 2009). 순전파(feed-forward) 모델인 ANN 모델은 대표적인 기계학습법으로써 지하수 분야에 널리 사용되어 왔다(Mirarabi et al., 2019; Seifi et al., 2020; Yin et al., 2021; Kim and Lee, 2022; Seidu et al., 2023). 이 모델은 목표변수와 관련된 복수의 입력변수들을 수많은 뉴런(노드)로 연결된 네트워크를 사용하여 비선형적인 현상을 모사한다(Adamowski and Chan, 2011). ANN 모델은 연구 지역에 대해 물리적 모델에 필요한 물리적 특성자료가 모의에 필요없다는 장점이 있으며, 목표 관측 시계열 데이터의 모사를 위해 복수의 입력 관측 시계열 데이터와 목표 관측 시계열 데이터 간의 상관관계를 이용한다(Jha and Sahoo, 2014). 이 모델은 입력층(input layer), 단수 또는 복수의 은닉층(hidden layer), 마지막으로 출력층(output layer)으로 구성된다(Fig. 5). 각 층은 단수 또는 복수의 뉴런으로 구성되며, 입력층의 입력변수 값에 매개변수 값인 가중치를 곱하고 편이(bias)를 더한 값에 활성화함수를 곱한 값을 다음 층에 전달한다. 이 과정은 출력층까지 순차적으로 수행하며, 이러한 순전파(feed-forward) 계산 과정을 통해 목표 관측 시계열 데이터를 모사하는 최종 출력값을 계산한다. ANN 모델의 계산과정은 다음식으로 표현할 수 있다(Kim and Valdés, 2003).
여기에서 는 입력층의 번째 뉴런에서 은닉층의 번째 뉴런으로의 연결강도(가중치), 는 입력층의 번째 입력변수, 는 번째 은닉뉴런의 편이, 는 은닉뉴런의 활성화함수, 는 은닉층의 번째 뉴런에서 출력층의 번째 뉴런으로의 연결강도, 는 번째 출력뉴런의 편이, 는 출력뉴런의 활성화함수, 는 출력변수로써 모의결과를 나타낸다. 이 가중치들은 역전파(backpropagation) 알고리즘(Rumelhart et al., 1986)을 통해 ANN 모델의 모의 시계열 결과와 관측 시계열 데이터 간의 오차가 최소화(학습)되도록 최적의 값으로 업데이트된다(Haykin, 2009). 뉴런의 편이는 가중된 입력신호의 합을 증가 또는 감소시키는 역할을 하며, 회귀모델에서 절편의 역할을 한다(Haykin, 2009; Sahoo et al., 2017). 은닉뉴련의 활성화함수는 최근 인공지능 연구에 널리 사용되는 Rectified Linear Unit (ReLU)(Hahnloser et al., 2000)를 사용하였다.
2.2.2 장단기기억 모델
장단기기억(LSTM)(Hochreiter and Schmidhuber, 1997) 모델은 인공지능 모델의 학습 시 데이터 정보의 장기간 기억을 위한 능력(long-term dependencies)을 저해하는 경사소멸(vanishing gradients) 문제(Bengio et al., 1994)를 해결하기 위해 개발된 순환신경망 모델의 일종이다. LSTM 모델은 최근 지하수 및 지표수 예측 등 다양한 분야에 널리 적용되고 있는 딥러닝 인공지능 모델이다(Shin et al., 2020; Müller et al., 2021; Sun et al., 2022; Gholizadeh et al., 2023; Kow et al., 2024). LSTM 모델은 carry track이라는 일종의 컨베이어벨트를 사용하여 시계열 데이터 내 각 계산시간(time step, t)에서 추출한 정보를 장기간 기억한다(Fig. 6). 시계열 데이터의 시간대별 처리 과정과 평행하게 배치한 carry track을 통해 데이터에서 추출한 정보를 이동시키고 각 계산 시간대에서 추출한 정보를 필요할 때마다 재사용한다. 따라서 LSTM 모델은 carry track의 사용을 통해 시계열 데이터의 계산 시 오래된 정보가 사라지는 문제를 해결한다(Chollet and Allaire, 2018). 이 모델은 아래의 네 가지 변환을 사용하여 데이터 내 장기간의 정보를 학습한다. 각 뉴런에서 t 시간대의 결과()는 아래와 같이 계산된다.
여기에서 는 t 시간대의 입력 데이터, 는 t 시간대의 상태로써 t-1 시간대의 결과의 상태, 는 t 시간대의 carry 값이다. , 그리고 는 결과계산을 위한 , , 각각의 가중치 행렬이며 •은 내적(dot product)을 의미한다. 가중치는 LSTM의 매개변수이고 는 뉴런의 편이이며 은 sigmoid 함수와 tanh 함수를 사용하는 활성화함수이다.
carry 값은 아래의 세 가지 개별적인 변환을 통해 업데이트된다.
여기에서 는 sigmoid 함수([0, 1]의 범위)를 통해 새롭게 추가된 정보, 는 sigmoid 함수를 통해 삭제된 정보, 는 함수([-1, 1]의 범위)를 통한 정보의 중요도를 의미한다. 즉, 와 의 곱셈 과정을 통해 새로운 정보를 얻고, 와 의 곱셈 과정을 통해 관련성 없는 carry 내 정보를 제거하며, 와 의 덧셈 과정을 통해 새로운 carry 값을 얻는다. 따라서 LSTM 모델은 carry track 기능을 사용하여 다음 번 출력과 다음 번 상태를 변조하는 특징이 있다(Chollet and Allaire, 2018). 본 연구에서는 R 언어 기반 딥러닝 프레임워크인 Keras 패키지(Falbel et al., 2019)에서 제공하는 ANN 및 LSTM 모델을 사용하였다.
2.3 연구방법
ANN 모델과 LSTM 모델에 백록담 강수량 데이터의 사용 여부가 지하수위 변동특성이 서로 다른 2개 지하수위 관측정의 1개월 후 지하수위 예측개선에 미치는 영향을 분석하였다. 또한 ANN 모델과 LSTM 모델 간의 지하수위 예측성능을 지하수위 관측정별로 비교 및 분석하였다. 1개월 후 지하수위를 예측한 이유는 월단위 지하수위 예측의 경우 ANN 모델 및 LSTM 모델의 1개 스텝(time step)에 대한 미래 예측성능이 가장 좋음에 따라 각 인공지능 모델의 지하수위 예측 특성을 적절히 반영할 수 있기 때문이다.
인공지능 모델의 학습, 검증 및 테스트 기간은 다음과 같이 서로 독립된 기간을 사용하였다. 백록담 강수량 데이터의 기간이 나머지 데이터의 기간보다 짧으나 인공지능 모델에 사용되는 데이터의 기간은 모든 입력자료가 동일해야 하므로 학습기간은 2016년 1월부터 2020년 12월까지, 검증기간은 2021년 1월부터 2022년 6월까지, 테스트기간은 2022년 7월부터 2022년 12월까지로 설정하였다. 사용된 월단위 강수량, 취수량, 지하수위 데이터의 샘플수는 학습기간의 경우 420개(60개월×7개 관측소), 검증기간의 경우 126개(18개월×7개 관측소), 테스트기간의 경우 42개(6개월×7개 관측소)로 총 588개이다. 사용된 데이터의 총 기간이 7년으로 짧아 충분한 학습을 위해 대부분의 데이터를 학습 및 검증에 사용하였다. 이에 따라 테스트 기간은 상대적으로 짧아 분석에 사용되는 데이터의 개수가 적어 테스트 기간의 모의성능 통계값을 분석 시 정확한 인공지능 모의성능에 대한 판단이 어려울 수 있다. 또한 전체적인 지하수위 모의성능 개선효과를 분석하는 것이 목적이므로 본 연구에서는 7년간의 전체 모의결과를 사용하여 모의성능 통계값을 도출하였다.
두 인공지능 모델의 학습절차는 다음과 같다(Fig. 7). 인공지능 모델은 매개변수값인 가중치와 활성화함수를 사용하여 입력 시계열 데이터를 모의지하수위 시계열 데이터로 변환한다. 그리고 계산된 모의지하수위 시계열 데이터와 관측지하수위 시계열 데이터를 비교하여 목적함수(loss function)를 계산한다. 본 연구에서는 목적함수로 평균절대오차(mean absolute error)를 적용하였다. 만약 모의지하수위와 관측지하수위 간의 차이가 커 목적함수의 값이 크게 되면 역전파 알고리즘을 이용하는 최적화기(optimizer)를 통해 두 시계열 데이터가 서로 가장 근사하여 목적함수의 값이 최소가 될 때까지 가중치를 업데이트한다. 인공지능 모델의 학습(매개변수 보정) 시 학습기간에 대한 모의결과의 과적합(overfitting)을 방지하기 위해 콜백(callback) 기능을 사용하여 매개변수 보정과정 중에 추정된 매개변수를 검증기간에 대해 검증하였다. 또한 드롭아웃(dropout) 기능을 사용하여 인공지능 모델의 과적합을 방지하였다. 콜백 기능이란 학습 및 검증 기간의 모의결과가 모두 적절히 도출되도록 하기 위해 임의로 설정한 반복횟수(patience)만큼 학습기간에 대해 매개변수를 업데이트 하여도 검증기간의 모의결과가 더 이상 개선되지 않을 때 학습을 조기종료(early-stopping)(Prechelt, 2012) 함으로써 인공지능 모델의 과적합을 방지하는 기능이다. 드롭아웃 기능이란 학습 시 은닉뉴런을 임의로 설정한 비율로 무작위로 비활성화시켜 과적합 문제를 해결하는 기능이다.
인공지능 모델의 적절한 학습을 위해서는 하이퍼매개변수(hyper-parameter)라는 가중치 이외의 매개변수 값의 설정이 중요하다. Chollet and Allaire (2018)에 의하면 하이퍼매개변수 값에 대한 명확한 설정방법과 기준은 없다. 본 연구에서는 시행착오 방법을 사용하여 하이퍼매개변수 값을 설정하였다(Table 2). 각 인공지능 모델은 2개의 은닉층을 사용하였으며, 각 은닉층의 은닉뉴런의 개수(n_units)는 충분한 학습을 위해 100개로 설정하였다. 은닉뉴런이 많을수록 복잡한 데이터의 특성을 더욱 충분히 학습할 수 있고 목적함수 값에 수렴하는 속도가 더욱 빨라진다는 장점이 있다. 하지만 계산시간이 길어지고 학습기간에 대한 과적합 문제가 발생할 수 있는 단점이 있다. 이러한 과적합 문제를 해결하기 위해 드롭아웃 기능과 콜백 기능을 사용하였다. 드롭아웃과 재귀적 드롭아웃(recurrent_dropout)은 각각 0.5로 설정하였으며 콜백 기능의 반복횟수(patience)는 10으로 설정하였다. 인공지능 모델의 효율적인 학습을 위해 한번에 처리할 수 있는 소규모 자료의 개수(batch_size)는 월단위 데이터의 길이를 고려하여 6개로 설정하였다. 인공지능의 최적 가중치를 도출하기 위한 최적화기는 딥러닝 분야에서 널리 사용되고 있는 Adam (Kingma and Ba, 2014)을 적용하였으며 학습률(learning_rate)은 0.001로 설정하였다. 학습 과정 중 데이터 전체에 대해 매개변수를 1번 업데이트 하는 것을 epoch라고 한다. 효율적인 학습을 위해 업데이트 최대 반복 횟수(n_epochs)의 설정이 필요하며 n_epochs 는 50번으로 설정하였다. 각 인공지능 모델의 출력층에 대한 활성화 함수는 Maier and Dandy (2000)의 연구를 참고하여 출력층의 뉴런에 수신되는 입력신호를 그대로 출력신호로 넘기는 선형함수를 사용하였다.
Table 2.
인공지능 모델의 모의성능을 분석하기 위해 수문학 분야에서 널리 사용되고 있는 평가지수인 Nash-Sutcliffe efficiency (NSE)(Nash and Sutcliffe, 1970), Root Mean Square Error (RMSE)를 사용하였다. NSE는 모의결과의 적절성에 대한 전반적인 정보를 제공하며(Moriasi et al., 2007) RMSE는 모의값과 관측값의 근사 정도를 측정한다(Le et al., 2019). NSE와 RMSE의 식은 아래와 같다.
여기에서 은 시계열자료의 개수, 와 는 각각 시간대의 관측 및 모의 지하수위, 는 관측 지하수위의 평균값이다. NSE는 -∞에서 1의 범위를 가지며 모의값과 관측값이 정확히 일치할 경우 1의 값을 갖고, 모의값이 관측값의 평균값과 동일한 경우 0의 값을 갖는다. RMSE는 관측값과 모의값이 일치할 경우 0의 값을 가진다.
3. 결과 및 고찰
3.1 백록담 강수량 데이터 제외 시 인공지능 모델의 지하수위 예측성능 분석
백록담 강수량 데이터를 인공지능 모델의 학습에 사용하지 않은 경우에 대해 2개 관측정 지하수위 1개월 예측결과는 Table 3과 같다. 이 통계값들은 2.3절에서 기술한 바와 같이 학습, 검증 및 테스트 기간을 포함한 전체 모의기간에 대한 결과이다. 지하수위 변동폭이 상대적으로 큰 관측정1(MW1)의 경우 ANN 모델과 LSTM 모델은 NSE 값이 각각 0.871과 0.897로 우수한 모의 성능을 나타내었다(Moriasi et al., 2007). RMSE 값은 ANN 모델의 경우 2.199 m, LSTM 모델의 경우 1.966 m를 나타내어 2 m 내외의 오차를 보이며 관측정1의 큰 월단위 관측지하수위 최대 변동폭(25.2 m)을 고려할 경우 적절한 지하수위 예측능력을 도출하였다고 판단된다. 관련 사례로 Rakhshandehroo et al. (2012)은 이란의 Shiraz 평원을 대상으로 ANN 모델을 사용하여 월단위 지하수위를 예측하였으며, 관측지하수위 최대 변동폭은 14 m이었으며 RMSE는 약 2 m인 결과를 도출하였다. LSTM 모델은 ANN 모델보다 고수위 및 저수위에서 상대적으로 관측값에 근사한 모의결과를 도출하여(Figs. 8(a) and 8(b)) 상대적으로 높은 NSE 값과 상대적으로 낮은 RMSE 값을 나타내었다. 이것은 LSTM 모델이 풍수기와 갈수기의 계절적인 영향을 지하수위 모의에 적절히 반영한다는 것을 의미한다. 정확한 저수위의 모의는 기후변화 등 강수량 변화에 따른 지하수위 하강 예측 및 대응에 있어서 중요한 사항이므로 LSTM 모델의 사용은 제주도 중산간지역 지하수위 예측에 적합하며 비교 기준이 되는 참고 모델로 사용될 수 있다고 판단된다.
Table 3.
Monitoring Well | Performance statistics | ANN | LSTM |
MW1 | NSE | 0.871 | 0.897 |
RMSE | 2.199 | 1.966 | |
MW2 | NSE | 0.936 | 0.952 |
RMSE | 0.761 | 0.658 |
지하수위 변동폭이 상대적으로 작은 관측정2(MW2)의 경우 ANN 모델과 LSTM 모델은 NSE 값이 각각 0.936과 0.952로 매우 높은 모의 성능을 나타내었다. RMSE 값은 ANN 모델의 경우 0.761 m, LSTM 모델의 경우 0.658 m를 나타내어 1 m 내의 오차를 보이며 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적합한 지하수위 예측능력을 도출하였다고 판단된다. 관측정1의 경우와 마찬가지로 LSTM 모델은 ANN 모델보다 고수위 및 저수위에서 상대적으로 관측값에 근사한 모의결과를 도출하여(Figs. 8(c) and 8(d)) 상대적으로 높은 NSE 값과 상대적으로 낮은 RMSE 값을 나타내었다. 순전파(feed-forward) 연산방법을 사용하는 ANN 모델은 순환신경망을 사용하는 LSTM 모델보다 구조적으로 단순한 모델의 특성으로 인해 전반적으로 저수위에서 과대추정, 고수위에서 과소추정을 하였으나 중간수위에서 적절한 모의결과를 도출하였다(Fig. 8).
주목할만한 점은 관측지하수위 변동폭이 상대적으로 큰 관측정1에 대한 RMSE 값은 관측지하수위 변동폭이 상대적으로 작은 관측정2에 대한 RMSE 값보다 크다는 점이다. ANN 모델의 경우 관측정1의 RMSE 값인 2.199 m는 관측정2의 RMSE 값인 0.761 m 보다 약 2.9배 컸으며 LSTM 모뎔의 경우는 약 3배(1.966 m/0.658 m)가 컸다. 관측정1의 월단위 관측지하수위 최대 변동폭은 관측정2의 월단위 관측지하수위 최대 변동폭보다 약 1.6배(25.2 m/15.6 m) 컸다. 이것은 비록 관측정 간의 RMSE 값의 차이와 관측지하수위 변동폭의 차이는 동일한 비율로 나타나지 않았지만, 관측지하수위의 변동폭이 크고 지하수위의 변동특성이 복잡할수록 인공지능 모델의 지하수위 예측은 어려워진다는 것을 의미한다. 이러한 현상은 관측정1의 모의결과가 관측정2의 모의결과보다 1:1선(빨간색 대각선)으로부터 더 멀리 분포하는 것을 통해 확인할 수 있다(Figs. 8(a) and 8(c) 및 Figs. 8(b) and 8(d) 비교).
관측정별 LSTM 모델과 ANN 모델의 NSE 값의 차이는 관측정1의 경우 0.026(0.897-0.871)이었고 관측정2의 경우 0.016(0.952-0.936)을 보여 작은 차이를 나타내었다. 관측정2에 대한 NSE 값의 차이가 관측정1의 경우보다 작은 이유는 관측정2의 지하수위 변동폭이 관측정1의 경우보다 상대적으로 작아 위에서 기술한 바와 같이 관측정2의 지하수위 예측결과가 상대적으로 좋으며 또한 관측정2에 대한 두 인공지능 모델 모두 NSE 값이 0.936 이상의 충분히 높은 지하수위 예측성능을 도출함으로 인해 인공지능 모델 특성의 차이에 의한 예측성능의 차이가 상대적으로 작아진 것이 원인으로 판단된다.
3.2 백록담 강수량 데이터 포함 시 인공지능 모델의 지하수위 예측성능 분석
인공지능 모델의 학습에 백록담 강수량 데이터를 추가적으로 사용한 경우에 대해 2개 관측정 지하수위의 1개월 예측결과는 Table 4와 같다. 관측정1의 경우 ANN 모델과 LSTM 모델의 NSE 값은 각각 0.907과 0.908로 도출되어 매우 높은 모의 예측성능을 나타내었으며, 두 모델의 NSE 값의 차이는 단지 0.001를 보여 두 모델의 예측성능은 대등하였다. RMSE 값은 ANN 모델의 경우 1.868 m, LSTM 모델의 경우 1.855 m를 나타내어 2 m 내의 오차를 보여 관측정1의 월단위 관측지하수위 최대 변동폭(25.2 m)을 고려할 경우 적절한 지하수위 예측능력을 도출하였다고 판단된다. LSTM 모델과 ANN 모델은 고수위 및 저수위에서 유사한 모의결과를 도출하였으며 LSTM 모델이 ANN 모델보다 저수위에서 관측지하수위에 약간 더 근사한 모의결과를 보여 저수위 모의에 더욱 적합하였다(Figs. 9(a) and 9(b)).
Table 4.
Monitoring Well |
Performance statistics | ANN_pBRD | LSTM_pBRD |
MW1 | NSE | 0.907 | 0.908 |
RMSE | 1.868 | 1.855 | |
MW2 | NSE | 0.948 | 0.956 |
RMSE | 0.688 | 0.633 |
지하수위 변동폭이 상대적으로 작은 관측정2의 경우 ANN 모델과 LSTM 모델은 NSE 값이 각각 0.948과 0.956를 보여 매우 높은 모의 예측성능을 도출하였으며, 두 모델의 NSE 값의 차이는 0.008를 보여 매우 작은 차이를 나타내었다. RMSE 값은 ANN 모델의 경우 0.688 m, LSTM 모델의 경우 0.633 m를 나타내어 1 m 내의 오차를 보이며, 관측정2의 월단위 관측지하수위 최대 변동폭(15.6 m)을 고려할 경우 적절한 지하수위 예측능력을 도출하였다고 판단된다. LSTM 모델은 ANN 모델보다 고수위에서 관측값에 근사한 모의결과를 도출하여(Figs. 9(c) and 9(d)) 상대적으로 높은 NSE 값과 상대적으로 낮은 RMSE 값을 나타내었다. ANN 모델은 고수위에서 과소추정을 하였으나 중간수위와 저수위에서 적절한 모의결과를 도출하였다(Fig. 9(c)).
3.3 백록담 강수량 추가 사용 시 인공지능 모델의 지하수위 예측성능 개선효과 분석
백록담 강수량이 인공지능 모델의 지하수위 예측성능 개선에 미치는 영향은 Table 5와 같다. 관측정1의 경우 백록담 강수량 데이터를 추가적으로 사용 시 ANN 모델과 LSTM 모델은 NSE 값이 각각 0.036와 0.011 만큼 높아졌으며 RMSE 값의 경우 각각 0.331m, 0.111m 만큼 감소하였다. 그리고 관측정2의 경우 백록담 강수량 데이터를 추가적으로 사용 시 ANN 모델과 LSTM 모델은 NSE 값이 각각 0.012와 0.004 만큼 높아졌으며 RMSE 값의 경우 각각 0.073m, 0.025m 만큼 감소하였다. 즉, 본 연구 대상지역의 경우 백록담 강수량 데이터를 추가적으로 사용 시 인공지능 모델의 NSE 값은 최대 0.036만큼 개선되었다. 이 지하수위 예측 개선효과는 Fig. 10에서 직관적으로 확인할 수 있다. 따라서 관측정 상류지역에 위치한 백록담 강수량 데이터를 추가적으로 사용 시 인공지능 모델의 지하수위 예측성능은 개선되었으며 이것은 관측정 상류지역에서 침투한 강수가 하류지역에 위치한 관측정 지하수위에 영향을 미친다는 것을 의미한다. 또한 인공지능 모델은 관측정 상류지역의 강수량을 추가적으로 사용 시 지하수위의 변동특성을 더욱 적절히 해석할 수 있다는 것을 의미한다.
Table 5.
Monitoring Well | Performance statistics | ANN_pBRD - ANN | LSTM_pBRD - LSTM |
MW1 | ∆NSE | 0.036 | 0.011 |
∆RMSE | -0.331 | -0.111 | |
MW2 | ∆NSE | 0.012 | 0.004 |
∆RMSE | -0.073 | -0.025 |
주목할만한 점은 백록담 강수량 데이터를 추가적으로 사용 시 인공지능 모델의 지하수위 예측성능 개선효과가 지하수위 변동폭이 상대적으로 큰 관측정1에서 더 크게 나타난다는 점이다. Table 5에서 ANN 모델의 경우 백록담 강수량 데이터의 추가사용에 따른 NSE 값의 증가량은 관측정1에서 0.036을 보인 반면 관측정2에서 0.012를 보여 관측정1에 대한 지하수위 예측 개선효과는 관측정2의 경우 보다 3배를 나타내었다. LSTM 모델의 경우 NSE 값의 증가량은 관측정1에서 0.011을 보인 반면 관측정2에서 0.004를 보여 관측정1에 대한 지하수위 예측 개선효과는 관측정2의 경우 보다 약 2.8배를 나타내었다. RMSE 값의 경우에도 NSE 값의 경우와 비슷한 경향을 나타내었다. 이것은 지하수위 변동폭이 더 커 인공지능 모델의 지하수위 예측이 상대적으로 어려운 관측정의 경우 관측정 상류지역에 위치한 강우관측소 데이터의 추가사용 시 지하수위 예측 개선에 더욱 도움이 된다는 것을 의미한다.
또한 백록담 강수량 데이터를 추가적으로 사용 시 인공지능 모델의 지하수위 예측성능 개선효과는 지하수위 예측성능이 상대적으로 낮은 ANN 모델에서 더 크게 나타났다. Table 5에서 관측정1의 경우 백록담 강수량 데이터의 추가사용에 따른 NSE 값의 증가량은 ANN 모델이 0.036을 보인 반면 LSTM 모델이 0.011를 보여 ANN 모델의 지하수위 예측 개선효과는 LSTM 모델의 경우 보다 약 3.3배를 나타내었다. 관측정2의 경우 NSE 값의 증가량은 ANN 모델이 0.012을 보인 반면 LSTM 모델이 0.004를 보여 ANN 모델의 지하수위 예측 개선효과는 LSTM 모델의 경우 보다 3배를 나타내었다. RMSE 값의 경우에도 NSE 값의 경우와 비슷한 경향을 나타내었다. 이것은 지하수위 예측이 상대적으로 낮은 인공지능 모델일수록 관측정 상류지역에 위치한 강우관측소 데이터의 추가사용 시 지하수위 예측 개선에 더욱 도움이 된다는 것을 의미한다.
특히 백록담 강수량 데이터를 추가적으로 사용 시 ANN 모델의 지하수위 예측성능은 LSTM 모델과 대등한 수준으로 개선되었다. 관측정1에 대해 3.1절에서 기술하였듯이 백록담 강수량 데이터를 사용하지 않은 경우 LSTM 모델과 ANN 모델의 NSE 값의 차이는 0.026(0.897-0.871)을 보였으나 3.2절에서 기술하였듯이 백록담 강수량 데이터를 추가적으로 사용한 경우 LSTM 모델과 ANN 모델의 NSE 값의 차이는 0.001(0.908-0.907)로 크게 감소하였다. 이것은 특정 연구대상 지역의 경우 관측정 상류지역에 위치한 강우관측소 데이터를 추가적으로 사용 시 ANN 모델은 LSTM 모델의 예측 정확도 수준으로 지하수위를 예측할 수 있다는 것을 의미한다.
4. 결 론
본 연구에서는 제주도 남동쪽 표선유역 내 중산간 지역에 위치한 지하수위 변동폭이 상대적으로 크고 작은 2개 관측정을 대상으로 정확한 1개월 후 지하수위 예측을 위해 한라산 정상 부근에 위치한 백록담 기후변화관측소의 강수량 데이터를 추가적으로 사용하여 2개 인공지능 모델의 지하수위 예측성능 개선효과를 비교분석하였다. 분석 결과, 백록담 강수량 데이터를 추가적으로 사용하지 않은 경우 ANN 모델과 LSTM 모델은 2개 관측정 지하수위 예측성능이 NSE 값을 기준으로 0.871 이상을 보여 높은 예측성능을 나타내었다. LSTM 모델은 ANN 모델보다 고수위 및 저수위에서 상대적으로 높은 지하수위 예측성능을 보였으며, LSTM 모델은 제주도 중산간지역 지하수위 예측에 적합한 인공지능 모델로 판단된다. 또한, 관측지하수위의 변동폭이 크고 지하수위의 변동특성이 복잡할수록 인공지능 모델의 지하수위 예측은 어려워진다는 점을 확인하였다.
인공지능 모델에 백록담 강수량 데이터를 추가적으로 사용한 경우, ANN 모델과 LSTM 모델은 2개 관측정 지하수위 예측성능이 NSE 값을 기준으로 0.907 이상을 보여 더욱 개선된 매우 높은 예측성능을 나타내었다. 백록담 강수량 데이터를 추가적으로 사용한 경우 인공지능 모델의 NSE 값은 사용하지 않은 경우보다 최대 0.036만큼 개선되었다. 이것은 관측정 상류지역에서 침투한 강수가 하류지역에 위치한 관측정 지하수위에 영향을 미친다는 것을 의미하며, 인공지능 모델은 관측정 상류지역의 강수량 데이터를 추가적으로 사용 시 지하수위의 변동특성을 더욱 적절히 해석할 수 있다는 것을 의미한다. 또한 관측지하수위 변동폭이 더 커 인공지능 모델의 지하수위 예측이 상대적으로 어려운 관측정(관측정1)일수록 그리고 지하수위 예측성능이 상대적으로 낮은 인공지능 모델(ANN 모델)일수록 관측정 상류지역에 위치한 백록담 강수량 데이터의 추가사용 시 지하수위 예측 개선에 더욱 도움이 된다는 것을 확인하였다. 특히, 특정 관측정(관측정1)에 대해 백록담 강수량 데이터를 추가적으로 사용 시 ANN 모델의 지하수위 예측성능은 LSTM 모델과 대등한 수준으로 개선된다는 것을 확인하였다. 본 연구의 방법 및 결과는 향후 인공지능 모델을 활용한 연구에서 유용하게 사용될 수 있다.