1. 서 론
2. 데이터 확보 및 전처리
2.1 데이터 확보
2.2 데이터 전처리
3. 이상패턴 기준 수립
3.1 일반적 이상패턴의 정의
3.2 기초 분석
3.3 이상패턴 감지 기준 제시
4. 적 용
5. 결 론
1. 서 론
우리나라 대부분 기반시설은 노후로 인해 체계적이고 지속 가능한 유지관리가 필요한 상황에 놓여 있다. 이를 해결하기 위해 정부는 2018년 시설물안전법 개정과 2020년 기반시설관리법 시행을 통해 노후 시설물의 유지관리 기능을 강화하고, 선제적 투자를 통해 관리 방식을 전환하는 등 정책적 변화를 추진하고 있다. 특히, 댐은 농업, 산업, 생활용수 공급과 홍수 조절 등 다양한 목적을 가진 중요한 기반시설로, 약 18,000여 개의 댐과 저수지가 국내에 설치되어 운영되고 있다. 이러한 댐들은 국가 전체 수자원의 약 70%를 관리하고 있어 그 안정성은 국가 물 공급 안전과도 직결된다. 최근 기후변화로 인한 이상 기후 현상과 더불어 댐의 약 30%가 수명 30년을 초과하여 노후화가 심화되고 있어, 댐의 구조적 안정성을 유지하는 것이 점점 어려워지고 있다.
이러한 상황에서, 댐의 안전성을 보장하기 위해 다양한 계측기가 매설 및 설치되고 있으며, 해당 계측기를 통해 실시간 감시와 수동 감시를 병행하여 댐의 안정성을 분석하고 있다(Wei et al., 2019). 국내 댐에는 침투수량계, 간극수압계, 지진계, 토압계, 경사계, 침하계 등 여러 계측기가 설치되어 있으며, 이들 계측기에서 얻어지는 데이터는 댐의 유지관리와 연구를 위한 중요한 자료로 활용된다(Kwater, 2019, 2021; KGS, 2010). 특히, 변위계와 누수량계, 침투수탁도계 등은 댐의 이상 거동을 간접적으로 반영할 수 있는 중요한 계측기로 알려져 있다(Kwater, 2020; 2021).
댐 이상 거동 예측 연구는 침투수량과 변위 분석을 기반으로 한 전통적 모델에서부터 머신러닝과 딥러닝 기법을 활용한 데이터 기반 접근법까지 다양하게 발전해왔다. 예를 들어, Wei et al. (2019)은 잔차 보정을 고려한 콘크리트 댐 변위 예측 모델을 제안하였으며, Shu et al. (2021)은 Sequential Variational Autoencoder 모델을 통해 이상 신호를 감지하는 방법론을 제시하였다. 또한, Ergen and Kozat (2019)은 Long Short-Term Memory 신경망을 활용한 이상 감지 알고리즘을, Boquet et al. (2020)은 Variational Autoencoder를 활용한 이상 감지 모델을 제안하였다. Amarbayasgalan et al. (2020)은 실시간 이상 감지를 위한 딥러닝 기반의 접근법을 개발하였으며, Li et al. (2020)은 시계열 데이터를 대상으로 한 smoothness-inducing sequential variational autoencoder model을 통해 이상 감지를 시도하였다. 이러한 연구들은 비지도 학습과 데이터 기반 모델의 유연성을 강조하며 실제 댐 운영 데이터에 적용 가능성을 제시하였다. Salazar et al. (2021)은 머신러닝 기반 분류 모델로 댐 거동의 이상을 감지하는 연구를 수행하였으며, Fisher et al. (2017)와 Hellgren et al. (2021)은 유한요소 시뮬레이션을 활용하여 댐의 크레스트 변위 데이터를 생성하고 손상 여부를 평가하는 방법을 제안하였다.
그러나 댐 계측기 관리의 핵심 요소 중 하나는 계측기의 신뢰성을 지속적으로 평가하고 유지하는 것이다. 기존 연구들은 계측기가 정상적으로 작동한다는 가정 하에 이루어진 경우가 많으나, 계측기 고장이나 이상 발생 시 거짓 알람(false alarm)이 발생할 수 있어 계측기 자체 이상을 판단할 수 있는 관리기준의 필요성이 강조된다. 예를 들어, Park et al. (2012)은 계측기에 직접 접근하지 않고도 데이터를 통해 신뢰성을 평가하는 방법을 제안하였고, Lee (2014)와 Park et al. (2016)는 각각 침투수량과 변위에 대한 관리기준 설정을 통한 댐 안전성 평가의 중요성을 언급하였다. Lee et al. (2020)과 Kang et al. (2020)은 필댐에서 계측 데이터를 분석하여 관리기준을 제시한 바 있다.
다만, 기존 연구들은 특정 댐의 데이터나 시간 단위에서의 관리기준 설정에 초점을 두었으며 계측기 데이터 패턴에 대한 이상 탐지 연구는 여전히 미흡한 실정이다. 특히 국내 다양한 댐의 계측기 이상 여부를 특정하기 위한 기준이 없는 상황으로, 일반적으로 관리자의 주관에 의해 판단되는 경우가 대부분이다. 즉 객관적인 이상여부 판단이 어렵기에, 이상패턴을 정의하는 기준이 필요하다. 이에 본 연구는 국내 댐의 계측 데이터를 수집하고, 데이터 분석 결과를 토대로 변위계와 탁도계, 누수량계에 대한 관리기준을 제시한다. 또한, 이를 토대로 이상 패턴 분석 알고리즘을 개발하여 향후 자동화된 이상 패턴 감지 시스템 구축을 위한 기초 자료를 제공하고자 한다.
2. 데이터 확보 및 전처리
2.1 데이터 확보
Kwater에서 관리하고 있는 수자원 시설물(댐, 보)의 경우, 2009년 이후 현장 계측 데이터를 실시간으로 모니터링하고 데이터베이스(DB)를 구축하여 관리하고 있다. 2019년 기준으로 보고된 설치된 계측기는 총 3,982개에 달한다. 본 연구에서 확보한 데이터는 총 38개 댐의 변위계 데이터, 28개 댐의 누수량계 데이터, 그리고 19개 댐의 침투수탁도계 데이터로 구성된다. 변위계의 경우 GPS가 매설된 이후인 2022년 12월부터 2023년 6월까지의 시(hour) 단위 데이터를 확보하였으며, 누수량계와 침투수탁도계는 2015년 1월부터 2021년 12월까지의 시(hour) 단위 데이터를 수집하였다. 댐별로 수집된 기간은 대체로 유사하지만, 결측 데이터를 고려할 때 실제 가용한 데이터 개수는 댐마다 상이하다. 본 연구는 모든 댐의 데이터를 분석하기에는 현실적 제약이 있어, 각 댐의 용도, 댐 형식, 계측 항목별 데이터 확보 여부를 기준으로 대표성을 갖춘 5개 댐을 선정하였다. 선정된 5개 댐의 구체적인 제원은 보안상의 이유로 공개하지 않는다.
2.2 데이터 전처리
데이터 분석의 정확도를 높이기 위해, 각 댐에서 수집된 계측 데이터의 측정 시점을 통일하고 이상치 및 장·단기 결측 데이터에 대해 보정하는 작업이 선행되어야 한다. Kwater (2020)에서는 통계적 정규분포의 99%를 벗어나는 값을 이상치로 정의하고 있으며, 이에 따라 본 연구에서도 GPS 변위 데이터를 대상으로 보정이 필요한 이상치 탐지를 수행하였다. 예시로 제시된 Fig. 1은 좌측에는 실제 데이터의 히스트그램을 나타내며, 우측에는 QQ 플롯(Quantile-Quantile Plot)이 그려져 있다. 우측 QQ플롯에서는 붉은 선에 가까울수록 정규분포에 가깝다고 볼 수 있다. 즉, Fig. 1의 붉은색 원 안에 표시된 데이터는 정상 범위를 벗어난 값으로 간주되며, 해당 데이터를 제거하여 단순 오측 보정을 수행하였다.
일반적으로 단기 결측이라함은 한 시점에서의 데이터가 결측된 것으로 간주할 수 있다. 이러한 단기 결측이 연속적으로 발생하는 경우 장기 결측이라 정의할 수 있다. 단기 결측을 보정하는 방법은 대표적으로 전후 시간의 데이터를 보간(내삽)하여 사용하거나, 이전 데이터의 경향(외삽)을 토대로 결정할 수 있다. 다만, 이러한 단기 결측이 연속적으로 발생하는 장기 결측의 경우 그 보정이 이뤄진다하여도 보정된 데이터의 신뢰도가 불확실하게 된다. 이에 따라, 결측 데이터를 장기 결측과 단기 결측으로 구분해야 하며, 이를 구분할 수 있는 기준이 필요하다.
이를 위해 각 계측기의 장기 결측 기준을 정의하고자, 온전한 데이터를 임의로 최소 1시간부터 최대 72시간까지의 연속 결측을 생성하고 선형 보간을 통해 데이터를 보정하여 그 신뢰도를 평가하였다. 보정된 데이터의 신뢰도 평가는 무작위 기간에 대해 결측 구간을 20회 반복 발생시켜 보정 데이터와 정상 데이터의 오차(RMSE, MAPE, MAE) 평균을 분석하였다. 본 연구에서는 80% 신뢰도를 한계값으로 정의하였다. 연속 결측 시간이 1~72시간으로 증가할수록 보정 오차가 커지는 경향을 보였으며, 특히 12~14시간의 연속 결측보다 길어질 경우 보정 신뢰도가 80%보다 커지는 것으로 평가되었다. 이를 통해 12시간을 초과하는 연속 결측 데이터는 장기 결측으로 판단하고, 이러한 장기 결측에 대해서는 선형 보간을 수행하지 않는 것으로 결정하였다.
3. 이상패턴 기준 수립
본 장에서는 이상패턴에 대한 정의와 계측기 데이터의 기초 분석 및 이상패턴 기준을 정리한다. 이상패턴은 단일 데이터에서 관측되는 비정상적인 수치인 이상치와는 다른 개념으로, 일반적으로 비교적 장기간 시계열 데이터에서 확인되는 비정상적인 경향성으로 정의할 수 있다. 따라서, 이상패턴 분석에서는 연속적인 시계열 데이터가 중요하다.
3.1 일반적 이상패턴의 정의
이상패턴 분석은 이상치 유무에 따라 결과가 상이하게 나타날 수 있기 때문에, 이상치 판단과 독립적으로 진행하기 어렵다. 일반적으로 이상치 판단은 데이터의 품질과 종류에 따라 다르게 적용된다. 데이터 품질관리 측면에서 이상치는 총 5단계로 판단할 수 있다. 첫째, 계측기 통신 오류로 인해 결측이 발생하는 경우이며, 이때 데이터는 일반적으로 공백으로 유지된다. 둘째, 물리적 허용 한계로, 계측 물리량을 고려하여 계측기별로 측정 가능한 범위 내에서 설정된다. 셋째, 추세변동 허용 한계로, 과거 데이터를 바탕으로 이상치(outlier) 판정 기준에 적합한 시간당 변화량 한계값을 결정한다. 넷째, 동일값 지속시간 한계로, 추세변동 허용 한계와 유사하지만, 변화량보다 일정 값이 유지되는 시간에 대한 한계값을 검토한다. 마지막으로, 내적 일치성 검사는 계측값 간 상호 모순 여부를 검증한다. Kwater (2020)에서는 각 계측항목에 대한 이상치 판단 절차(안)을 Table 1에 제안했으나, 일반적인 내용만 제시되어 있고 이상패턴보다는 이상치에 대한 내용으로 이상패턴 관리기준 수립에는 추가 기준 수립이 필요하다.
Table 1.
Outlier detection procedure for each type of sensor (Kwater, 2020)
이상치 판단 절차와 함께, 각 계측기의 계측 데이터 유형에 따른 조기 경보 기준(안)도 제시되었다. 예를 들어 외부 변위의 경우 조기 경보 기준은 최근 10회 계측 변화량의 합인 누적변위와 최근 5회 계측 데이터에 대한 변위 속도로 제시되며, 누적변위가 30 mm/5day 또는 변위 속도가 3~5 mm/day일 때 이를 관심 단계로 정의하고 있다. 누수량계는 강우 유무에 따라 과거 최대 값을 기준으로 사용할 것을 권장만 하고 있으며, 침투수 탁도계의 경우 별도 조기 경보 기준을 제시하지 않고 있다. 조기 경보 기준 또한 앞서 이상치 판단 절차와 동일하게 특정 시간의 데이터(이상치)에만 초점을 두고 있어, 본 연구에서는 시계열 데이터의 실질적 이상패턴 분석을 위해 직접 활용하기에는 한계가 있다.
Kwater (2020)과 Kwater (2021)에서는 이상패턴에 대한 분석을 위해 이상패턴으로 간주할 수 있는 경시도 유형을 제시한 바 있다. 해당 연구에서는 이상패턴을 일반적인 계측 경시도를 벗어나는 형태로 정의하였으며, 일단변이, 다단변이, 단기간 결측, 단기간 급변, 장기 결측, 상시격동 등으로 이상패턴을 구분하고 각 이상패턴에 대한 정의를 Table 2와 같이 제시한 바 있다(Table 2).
Table 2.
Type of abnormal patterns and description
패턴분석의 경우 일반적인 이상 탐지에 비해 장기적인 변화를 고려해야 하므로 모든 경시 변화를 고려하지 않아도 된다. 예를 들어 단기 결측이나 단기간 급변동의 경우 이상패턴보다는 단일 데이터에 대한 이상치로 간주할 수 있다. 이에 이상패턴 항목 중 일단변이, 다단변이, 상시격동, 무변동 등 비교적 장기적인 시계열 패턴들을 이상패턴 유형으로 선정하였다.
3.2 기초 분석
이상패턴을 정의하기에 앞서, 실제 수집된 데이터에서 발견되는 이상패턴 의심 정황과 그 정도(크기와 시간)에 대한 분석을 기초 통계 분석 기반으로 수행하였다. 수집된 데이터의 기초 통계 분석 결과, 동일 댐의 동일 계측 항목에 대해서도 계측기 간 통계치의 차이가 나타났다.
우선 변위계 데이터의 경우 평균값에서 계측기 간 차이가 있었으나, 표준편차는 대부분 10 mm 이하로 확인되었다. 단, 일부 계측기에서 30 mm 이상의 표준편차가 나타났는데, 이는 극단적인 이상치를 포함한 경우로 확인되었다. 변위계는 댐의 움직임을 직접적으로 계측하는 것으로, 댐이 이상 거동을 하지 않는 경우 그 변화량이 매우 적어야 한다. 즉, 변위계가 정상적으로 운영되는 경우 작은 범위 내에서 변동해야 함을 뜻한다. 통계 분석 결과 이러한 변동 폭은 10 mm가 적절할 것으로 판단되며, 그 이상의 이동은 계측기 고장 의심 상황인 것으로 구분하였다.
누수량계와 침투수 탁도계의 경우 변위계와는 다른 경향이 관찰되었다. 댐별로 상이하지만, 일반적으로 30 단위(L/min 또는 NTU) 이상의 표준편차를 나타내며, 변위계와는 달리 외부 변인(예: 강우량, 댐 수위 등)의 영향이 큰 것으로 추정되었다. 예를 들어, 강우가 많이 온 이후에는 누수량계와 침투수 탁도계가 일반적으로 증가하는 경향을 나타내었다. 이에 따라 두 계측기의 경우 강우 시기와 비강우 시기를 구분하여 분석할 필요가 있음을 시사한다.
수집된 데이터를 시계열로 도식화하여, Table 2에 제시된 일반적인 이상패턴 중 육안으로 확인 가능한 이상패턴 의심 정황을 판단하였다. 이는 이후 이상패턴 정의를 위해 필요한 과정으로, 특정 계측 항목에 따라 상이한 통계적 특성이 나타나는 점을 반영하여 이상패턴 분류 기준을 설정하는 기초 자료로 활용하였다.
3.2.1 변위계 계측 데이터 특징 분석
변위계는 A와 B댐에 각 12개씩 설치되어 있으며, C댐에 44개, D댐에 26개, E댐에 6개 설치되어 있다. 변위계는 모두 GPS 변위계로 2022년에 모두 신규 교체되었다. 이에 따라 실제 계측 기간은 상대적으로 짧지만, 변위계 데이터가 x, y, z 방향과 합 벡터인 v 값으로 개별적으로 수집되고 있어 댐별 계측기 총 개수의 4배의 데이터가 확보되었다고 볼 수 있다. 예를 들어 A댐의 경우 12개 계측기에서 총 48개의 데이터가 동시에 수집되고 있어 분석에 필요한 적절한 수준의 데이터가 확보된 것으로 판단된다.
변위계의 경우 크게 일단변이, 다단변이, 장기 결측과 무변동, 상시미동과 상시격동 등의 이상패턴 의심 정황이 확인되었다. 우선 일단변이 및 다단변이에 대한 의심 사례는 B댐에서 확인할 수 있었으며, Fig. 2와 같은 형태가 대표적인 예시이다. 유사한 변동을 나타내는 경우가 타 계측기에서도 있었으며, 본 연구에서 중점적으로 살펴본 5개 댐 외의 다른 댐에서도 유사한 경향은 확인할 수 있었다. 다만, 육안으로는 일단변이와 다단변이에 대한 구분이 모호하여 명확한 기준이 수립되지 못한다면 단변이와 같이 통합해서 정의하는 것이 효율적일 것으로 판단된다. 종합적으로 단변이의 경우 그 변화량이 어느 시간 동안에 걸쳐 발생하는지가 중요한 고려사항인 것으로 파악되었다.
다음으로 무변동 패턴과 장기결측에 대해서는 Fig. 3에 C댐에 대한 예시로 제시되고 있다. 우선 무변동패턴은 동일한 크기의 계측값이 일정 시간동안 반복적으로 관측되는 경우를 의미한다. 변위계의 경우 계측기 특성 상 무변동으로 나타나는 구간은 없는 것으로 파악되었다. 이는 연구에서 중점적으로 살펴본 5개 댐 외에도 모두 동일하게 나타났으며, 변위계의 경우 모든 경우에서 미세하게라도 변동이 발생하고 있음을 확인하였다. 다만, 이는 변위계에서 무변동이 발생할 경우 비정상적인 계측기의 운영임이 확실한 것으로도 판단되어, 실제 이상패턴을 정의할 때에는 고려하는 것으로 결정하였다.
장기 결측의 경우 대부분의 계측기에서 1회 이상 확인되었다. 이러한 장기 결측이 동일 댐의 모든 계측기에서 동시에 발생한 점을 고려할 때, 이 시기에 전반적인 계측기 점검이 있었을 가능성이 있다. 특히 국내 댐의 경우 2022년부터 GPS 변위계로 모두 교체를 하였는데, 교체 직후 계측기의 점검을 위해 동시에 변위계를 모두 끈 이력이 확인되었으며, 이 경우 모든 변위계에서 동시에 장기 결측이 발생한 것 또한 확인하였다. 이로 인해 일부 계측기에서 최소 1회 이상의 장기 결측이 발생한 것으로 보인다. 장기 결측은 단순히 계측기의 결여 여부뿐만 아니라, 다른 계측기와의 동시 발생 여부를 함께 분석하여 모든 계측기가 아닌 일부 계측기에서만 발생할 경우 점검에 대한 의심 정황으로 판단할 수 있다.
다음으로 상시미동과 상시격동 패턴도 단변이와 유사하게 명확한 구분이 어려운 경우에 속했다. 특히 상시미동의 경우 변위계 데이터 특성상 지속적인 미동이 발생하는데, 이를 명확히 정의하지 않으면 변위계 특성상 상시미동으로 인한 이상패턴 경고가 빈번하게 발생할 수 있다. 따라서 상시미동은 가능한 한 이상패턴 분석에서 제외하는 것이 바람직하다고 판단되었다. 상시격동의 경우 상시미동보다 큰 폭에서 변동하며, 특정 범위를 초과하는 진동이 발생할 때 이를 상시격동으로 정의할 수 있을 것이다. 상시격동의 경우 변화폭과 발생 주기를 고려하여 이상패턴으로 정의할 수 있다.
3.2.2 탁도계 계측 데이터 특징 분석
탁도계는 변위계에 비해 계측 기간은 길지만, 설치된 계측기의 수가 적어 확보된 데이터가 현저히 적었다. 구체적으로 분석 대상 5개 댐 중 총 3개 댐에서만 설치되었으며, 각 댐의 탁도계 설치 개수 A댐과 D댐 각 1개와 E댐 2개로 적었다. Fig. 4는 탁도계에 대한 육안 분석을 위한 데이터 예시이다.
탁도계 분석 결과, 일단변이, 다단변이, 장기 결측, 무변동 등의 패턴이 관측되었다. 탁도계는 변위계와 달리 불규칙적 변동이 자주 발생하는데, 이는 계측기 자체의 문제일 수도 있으나 외부 요인에 의해 반복적으로 영향을 받을 가능성이 있다. 변위계와 달리 탁도계는 누수량에 영향을 줄 수 있는 강우량, 댐의 수위, 누수량 등 외부 변인이 탁도에 더 큰 영향을 줄 수 있다. 따라서 강우 기간과 비강우 기간을 구분하여 무강우 기간에 대한 기준을 수립하는 것이 필요하다. 변위계와 달리 탁도계에서는 무변동 구간이 나타나며, 이러한 경우 무변동이 현실적으로 가능한지를 상관성 분석을 통해 검토한 후, 이상패턴 또는 정상패턴으로 분류할 수 있다.
3.2.3 누수량계 계측 데이터 특징 분석
누수량계 또한 탁도계와 유사한 경향을 보였다. 분석 대상 5개 댐 중 3개 댐(A, C, E)에서만 설치되었으며, 전체 설치 계측기 수는 6개(A 1개, C 2개, E 3개)로 매우 적었다. 누수량계 육안 분석을 위한 데이터는 Fig. 5에 제시되어 있다.
누수량계 분석 결과 장기 결측과 무변동 패턴이 관찰되었으며, 변위계와 달리 외부 요인에 의한 불규칙적 변동이 자주 발생했다. 이는 외부 요인, 예를 들어 강우량이나 댐 수위 등이 누수량에 더 큰 영향을 미치기 때문으로 추정된다. 따라서 탁도계와 동일하게 강우 기간과 비강우 기간을 구분하여 무강우 기간에 대한 기준을 수립하는 것이 필요하다. 변위계와 달리 누수량계의 경우 일부 구간에서 무변동이 나타나므로, 무변동이 현실적으로 가능한지에 대한 상관성 분석을 통해 이상패턴으로 분류할지 여부를 결정하는 과정이 필요하다.
3.3 이상패턴 감지 기준 제시
최종적으로 본 연구에서는 아래 Table 3과 같이 총 5개의 이상패턴 관리기준을 제시하였다. Table 2에서 제시된 일단변이와 다단변이의 경우 그 패턴의 구분이 단변이가 연속적으로 발생하는 여부에 있는데, 그 시간 간격을 정의하는 것에 한계가 있는 것으로 판단되었다. 또한, 실무진 인터뷰 결과 일단변이와 다단변이는 발생여부가 중요하고, 단변이가 연속적으로 발생하는 것은 큰 의미가 없는 것으로 조사되었다. 이에따라, 일단변이와 다단변이를 구분하는 것보다 단변이라고 하는 하나의 이상패턴으로 묶어 판단하는 것이 효율적이라고 판단하였다.
Table 3.
Criteria for abnormal pattern classification
모든 항목을 정의하기 위해 가장 먼저 결정해야 할 것은, 정상패턴에 대한 정의이다. 원데이터에 대한 통계분석 결과를 보면, 일반적으로 계측기 종류에 따라, 그리고 댐에 따라서 모두 상이한 값을 나타냄을 확인할 수 있다. 이에 따라, 개략적인 정상패턴이라고 하는 것을 정의해야 하며, 본 연구에서는 모든 “계측기에서 변동이 허용 범위 내 발생하는 경우”로 정의하였다. 단, 침투수탁도계 및 누수량계의 경우 외부변인(예. 강우)에 의한 허용 범위 외 변동도 허용하는 것으로 예외 조건을 추가하였다.
각 이상패턴에서 변화량 기준과 시간 기준, 입력 데이터 기준은 기존 데이터에 대한 정량적 통계 분석 결과를 토대로 결정하였다. 우선 변위계의 경우 일반적으로 변동이 매우 적어야 하며, 비교적 외부 요인에 의해 영향이 거의 없는 경우로, 변화량 기준의 경우 누적변위/변위속도 기준(안)를 참고하였다. 시간 기준의 경우 패턴이 시각적으로 나타나기 위한 최소 시간으로 선정하였다. 단변이의 경우 특정 시간 전후 7일 시계열 데이터의 이동평균이 30 mm이상 차이 날 경우로 정의하였으며, 상시격동의 경우 일반적으로 단변이의 60% 정도 수준으로 정의되어 있어 20 mm 이상의 폭으로 진동하는 수치를 나타낼 때로 정의하였다. 상시격동을 구분하기 위한 방법론으로는 Savitzky-Golay smoothing 방법이 적절한 것으로 결정하였다.
앞서 언급한 것과 같이 탁도 및 누수량의 경우 변위계와는 달리 외부 요인에 의해서 영향을 받는다. 영향을 받는 요소는 다양하게 있을 수 있지만, 가장 영향이 큰 것은 강우일 것으로 판단된다. 이에 따라, 탁도 및 누수량계의 경우 대상 댐의 데이터 전처리 전/후의 무강우 시 최대값을 기준으로 선정하였다. 여기서 데이터 전처리는 2.2절에서 소개한 극단적인 오결측에 대한 보정 작업이 된 형태의 데이터를 의미한다. 또한, 무강우라고 한 것은 다양한 기준으로 정의가 가능하지만, 이상패턴 분류에 있어서는 단순히 강우가 오지 않은 시간을 기준으로 하였다. 아래 Table 4는 데이터 전처리 전후의 탁도와 누수량계 데이터 중 최대값 분석 결과를 나타낸다.
Table 4.
Maximum values for turbidity and leakage data during non-rainfall periods
Table 4에서 확인할 수 있듯이, 계측기 간에 최대값의 편차가 존재한다. 전처리 전 원데이터에 대해서는 일부 구간에서 비정상적인 수치를 나타내는 경우가 다수 있었다. 이에 따라 데이터 전처리 전후에 대한 비교 검토를 통해 가장 적합한 수치를 선정하였다. 최종적으로, 단변이의 경우 탁도계에서 50 NTU, 누수량계에서 250 L/min으로 정의하였으며, 변위계와 유사하게 상시격동은 이의 60% 수준으로 정의하였다. 단전이와 상시격동을 구분하는 알고리즘은 변위계와 동일하게 설정하였다.
기타변동은 실제 데이터에서 관측이 되지는 않았지만, 문헌조사 결과 일부 댐에서 감지가 되었던 패턴을 위주로 임의 분류하였다. 해당 패턴은 경향성 변동(기울기의 변동폭이 일정 수준 이상이 경우)과 연주기 패턴으로, 경향성 분석의 경우 알고리즘 구현 시 분석 시점 전후 7일 시계열 데이터의 기울기 값으로 분석할 수 있도록 하였으며, 연주기 패턴의 경우 문헌에서 가장 많이 사용한 ARIMA model (Autoregressive Integrated Moving average Model)로 선정하였다. 다만, 현재 확보한 데이터에서는 두 패턴이 확인되지 않아, 구체적인 기준을 제시하지는 않았다. 또한 장기 결측이 동시에 모든 계측기에서 발생할 경우 이를 점검 의심으로 따로 분류하여 제시하였다.
4. 적 용
5개 대상 댐에 대하여 제시한 이상패턴 관리기준을 적용하여 이상패턴 감지 여부를 확인하였으며, 그 결과를 Table 5에 정리하였다. Table 5를 보면 모든 계측기에서 장기 결측은 감지되고 있다. 탁도계와 누수량계에서는 무변동도 감지되고 있다. 단변이의 경우 모든 계측기에 걸쳐 8회 정도 감지되고 있다.
Table 5.
Summary of abnormal pattern analysis results
세부적으로 결과보면, 장기 결측의 경우 상당 수 감지되었는데, 이는 현재 데이터 전처리 알고리즘의 한계와도 연관이 있는 것으로 판단된다. 현재 데이터 전처리 알고리즘의 경우 단기간 급변동 발생 시 이에 대한 보정을 결측으로 처리를 하게 되고, 이러한 단기간 급변동이 연속적으로 발생 시, 결국 패턴분석 시 장기 결측으로 나타나게 된다. 예로 Fig. 6 위쪽에는 원데이터에 대한 시계열 데이터이며, 아래쪽은 패턴 분석 결과이다. 원데이터를 보면 붉은색 박스 영역에서 단기간 급변동이 발생함을 알 수 있다. 정확하게는 전처리 과정에서 해당 급변동 구간이 모두 동일 값으로 보정되어, 패턴 분석 후 실제 장기 결측은 아니지만 장기 결측으로 간주되는 이상패턴을 생성하게 된다. 이러한 경향은 향후 실시간으로 분석을 수행하며 현장 점검을 병행해 개선해야 할 것으로 판단된다.
이외에도 실제 장기 결측과 점검의심 정황에 해당하는 구간이 있는데, Fig. 7에서와 같이동일 계측 항목에 대해 전체 계측기에서 동시에 장기 결측이 발생한 경우 점검 의심 구간으로 판단할 수 있다. 이러한 패턴은 타 이상패턴 검증 알고리즘과는 별개로 동일 댐에서 동일 계측항목에 대해 중복성에 대한 평가를 추가로 시행해서 확인할 수 있다.
다음으로 무변동 타입은 변위계에서는 감지되지 않았으며, 탁도계와 누수량계에서는 일부 감지되었다(Fig. 8). 이는 앞서와 마찬가지로, 데이터 전처리와 연관이 있는 것으로 확인되었다. 특히, 누수량계와 탁도계의 경우 음수값이 물리적으로 발생할 수 없는데, 이러한 음수값을 '0'으로 처리하도록 하는 과정이 데이터 전처리 동안에 고려되고 있다. 이에따라, 음수 값이 연속적으로 발생한 경우, 이들 구간에서 모두 '0'으로 처리되어, 변동이 없는 것으로 감지되었다. 누수량계의 경우 이후 타계측 항목(예. 강우, 댐 수위 등) 상관성 분석을 통한 정확한 전처리를 통해 해결할 수 있을 것으로 판단된다. 이는 탁도계에서도 마찬가지이나, 탁도계의 경우 기저값을 설정할 수 없기에, 이후 지속적인 현장 점검을 통해 보정 방법론을 개선해 나가는 과정이 필요할 것으로 판단된다.
단변이의 경우 변위계에서만 감지되고 있다. 원데이터를 보면, 누수량계와 탁도계도 급격한 변동을 나타내는 구간이 보이고 있지만, 변위계에 비해 변화 속도로 보았을 때는 그 크기가 설정한 단변이 기준보다는 낮은 것으로 판단된다. Fig. 9는 단변이로 나온 여러 결과들을 보여준다. 우선 Fig. 9(a)의 경우 명확한 단변이 패턴을 나타내고 있으며, 이와 유사한 시간에 타 계측기(Fig. 9(b))에서도 단변이가 발생하거나 혹은 그 정도가 적어 단변이로 감지되지 않는 경우도 있는 것으로 나타났다. 예를 들어 Fig. 9(a)에서는 두 번의 단전이가 발생한 것으로 보이나, 동일 댐의 Fig. 9(b)에서는 한 번만 발생하였으며, 또한 그 경향이 반대인 것으로 확인되었다. 이후 지속적인 현장 점검을 통해 구체적인 공간 상관성 분석을 수행해야겠지만, 전반적으로 동일 댐에서는 계측기들이 유사하게 거동하고 있음을 간접적으로 확인할 수 있다.
다만, 일부 계측기에서는 장기 결측 전후로 단변이가 나타나는 경우(Fig. 9(c))가 있는데, 이러한 경우 장기 결측이 점검인 경우, 점검 과정에서 계측기에 대한 교정 과정에서 좌표가 변경되었을 가능성이 있다. 즉, 이런 경우 계측기 자체의 이상이거나, 실제 댐의 거동에 문제가 있는 것은 아니니, 해당 패턴에 대해서는 기록(현장 점검 여부)을 남겨두고 특정 이벤트 이후에 변위계의 위치가 변동되었음을 명확히 기록해두는 것이 필요하다고 할 수 있다.
5. 결 론
본 연구에서는 댐의 안전 관리를 위한 계측기 데이터에서 이상 패턴을 감지하는 기준을 제시하고, 이를 국내 주요 5개 댐의 데이터에 적용하여 분석하였다. 연구 대상 계측기는 변위계, 침투수 탁도계, 누수량계로 선정하였으며, 각 계측 항목별로 데이터의 정상 및 이상 패턴을 구분하여 분석하였다. 그 결과, 변위계에서는 단전이 패턴이 가장 빈번하게 나타났으며, 침투수 탁도계와 누수량계에서는 특정 기간 동안 값이 일정하게 유지되거나 지속적인 결측이 발생하는 패턴이 주요 이상 패턴으로 확인되었다. 이와 같은 연구 결과는 계측기 유형별 특성을 반영한 데이터 분석의 중요성을 강조하며, 특히 결측 데이터 관리 및 이상 패턴 판별에 대한 명확한 기준을 제시함으로써 향후 신뢰성 있는 댐 관리 방안을 마련하는 데 기여할 수 있다.
더불어, 본 연구는 계측기 고장과 실제 구조적 이상을 구분하기 위한 체계적 관리기준의 필요성을 강조하였다. 기존 댐 관리 체계에서는 구조물의 거동에만 주목하였으나, 본 연구에서 제시한 기준을 참고하여 현장 점검을 병행한 계측기 자체의 신뢰도를 확인하는 과정이 지속해서 진행된다면 댐의 안전성 평가에 더욱 객관성을 부여할 수 있을 것으로 기대된다. 다만, 본 연구는 실제 계측기 고장을 포함하는 데이터가 제한적이라는 점에서 연구의 한계를 갖는다. 계측기의 성능과 고장 여부에 대한 지속적인 모니터링과 피드백이 이루어져야 하며, 이러한 데이터가 축적될 경우 본 연구의 감지 기준은 더욱 정교해질 수 있을 것으로 기대된다. 또한, 계측기와 댐 거동 간의 상관관계 분석을 통해 이상 패턴 발생 시점과 외부 요인 간의 관계를 명확히 하여, 실제 댐 안전성 평가와 유지관리 방안 수립에 기여할 수 있는 구체적인 자료로 활용될 수 있을 것이다.











