1. 서 론
2. 개선 Western Electric Company 방법을 이용한 상수도관 파열 탐지
2.1 개선 Western Electric Company 방법
2.2 상수도관 파열 탐지 성능 지수
2.3 정상 및 비정상 데이터 발생 방법
3. 연구 대상 네트워크
4. 적용 결과
4.1 WECO 방법 비교
4.2 계측 빈도에 따른 영향
5. 결 론
1. 서 론
물공급시스템은 수질적으로 안전한 물을 압력적으로 안정하게 공급하는데 목적을 둔 사회기반시설이다(Ministry of Environment, 2010). 물공급시스템은 관, 펌프, 탱크, 밸브 등 다양한 요소로 구성되어 있다. 물공급시스템 내 관은 상수도관이라 불리며, 지점 간 물을 이동시키는 역할을 한다. 광역상수도 중 몇몇 특별한 경우를 제외하면, 상수도관은 지하에 매설되어 있어 유지관리가 어렵다.
상수도관의 파열(Burst)은 과도한 압력, 노후화, 온도변화 나 지진 등에 의한 지반이동에 의해 발생하며 관 벽의 표면을 파열시켜 누수현상을 야기한다. 물공급시스템 외부로의 누수는 (1) 소중한 자원인 물의 낭비와 (2) 누수 지점까지 물을 이동하기 위해 투입된 에너지 및 정수비용의 낭비를 초래한다. 또한, 주변 토양의 액상화시켜 싱크홀을 유발하여 막대한 경제적 손실을 야기하기도 한다. 경우에 따라, 파열에 의해 관이 용수 전달 능력을 완전히 잃게 되어 하류부에 단수를 유발한다. 파괴된 관의 공급라인에서의 위치와 직경에 따라 적게는 수천가구, 많게는 수십만 가구의 수요량 공급이 중단되므로 상수관 파열은 인적/사회재난으로 분류할 수 있다(National Disaster Management Research Institute, 2017). 따라서 상수도관 파열이 보다 더 심각한 피해를 유발하는 상황으로 전개되지 않도록 신속하게 탐지 및 대응하는 것이 중요하다.
본 논문에 걸쳐 사용되는 ‘파열’이라는 현상은 영어로 Pipe Breakage 또는 Pipe Burst로 표현되는 상수도관 균열, 파열 그 자체를 지칭하며 ‘누수’는 ‘파열’의 결과로 발생하는 시스템 외부로 물의 유출을 말한다.
상수도관에 누수가 발생하면 어떠한 수리학적 변화가 발생할까? 수용가들은 특별히 수도공급자가 공지하지 않는 이상 누수 및 관 파열의 발생을 알지 못하기 때문에 평소의 수요량(Q)을 사용한다. 하지만, Q에 더해 누수량 dQ가 추가되므로 수원에서 총 Q + dQ의 유량이 시스템 내에 유입되고 관에 흐르는 유량은 전반적으로 증가한다. 증가한 유량에 의해 수두손실이 증가하며, 결국 수용가 절점에서는 평소보다 낮은 압력이 발생한다. 누수량에 따라 용수의 사용성 저하를 유발한다. 상수도관 파열은 발생 관의 직경이나 상하류의 위치가 동일하더라도 파열의 규모 및 형태, 압력에 따라 누수량이 달라진다.
앞서 설명한 바와 같이, 상수도관 파열은 인접한 지점의 수리학적 변화를 야기하기 때문에 주로 데이터 기반 탐지 방법이 개발, 적용되고 있다. 실무에서는 상수도관 파열을 탐지하기 위해 주로 전 시스템 또는 구역별 야간최소유량의 물수지분석을 수행하여 범위를 좁힌 후, 국지적 청음식 탐사법을 통해 파열 관을 발견한다(Kim et al., 2009). 전자, 기계분야에서는 주로 관 파열이 관 내의 유체에 발생시키는 파동분석을 통해 탐지하였다(Yoon et al., 2003; Oh et al., 2003; Kang and Hong, 2004). 하지만 상기 방법들은 상수도관 파열에 의한 상수도관망 전체 시스템의 수리학적 변화를 종합적으로 고려하지 못한다는 한계점이 있다.
한편, 산업공학분야에서 공정시스템의 이상탐지(Event Detection)를 위해 적용된 통계적공정관리(Statistical Process Control, SPC) 기법이 상수도관 파열 탐지를 위해 적용되었다. 이 방법은 주로 공간적으로 분포된 계측기에서 실시간으로 수집된 관 유량, 압력 데이터를 이상탐지에 활용하였다. Jung et al. (2015)은 동일한 상수도관 파열 데이터를 이용하여 단변수 및 다변수방법을 포함한 6가지 통계적공정관리기법의 탐지확률(Detection probability, DP), 오경보확률(Rate of False Alarm, RF), 평균탐지시간(Average Detection Time, ADT)을 비교하였다. Kim et al. (2013)은 적응 칼만필터를 이용한 누수 탐지 방법을 제안하였다. Jung and Lansey (2016)은 비선형 칼만필터와 통계적공정관리 기법을 결합하여 펌프, 밸브 등 운영조건이 변화는 상황에서도 상수도관 파열 탐지가 가능한 방법을 제안하였다.
Hagos et al. (2016)는 상수도관 파열 탐지를 위한 계측기 위치 최적화 모형을 개발하였는데, 실무적용의 용이한 Western Electric Company (WECO) 방법을 사용하였다. 기존 WECO 방법은 4가지의 이상탐지 결정 룰로 구성된다(예, 룰 2는 연속 측정된 3개의 측정치 중 2개가 평균에서 3x표준편차(3σ 룰)를 더한 값보다 크면 이상탐지). Jung et al. (2015)은 기존 WECO 방법의 탐지확률이, 데이터 종류(관 유량, 압력)에 상관없이 4가지 다변수 통계적공정관리 기법보다 높은 것을 확인했다. 다만, 기존 WECO 방법은 복수의 계측기 데이터를 이용할 때 최대 일당 오경보 횟수가 0.15회로 증가하여 실제 적용에 한계가 있음을 확인하였다. 이는 이상탐지 결정의 기준이 되는 임계치(Threshold)를 문제에 따라 자동 조정할 수 없기 때문이다. 예를 들어, WECO 방법의 첫 번째 룰은 어떤 시간의 측정치가 평균에서 4x표준편차(4σ 룰)를 더한 값을 초과하면 이상탐지 알람을 울리는데, 대상 네트워크에 따라 이러한 임계치가 적절하지 않을 수 있다(예, 4.1σ가 보다 더 맞음).
본 연구에서는 상수도관 파열 탐지를 위한 개선 WECO 방법을 개발한다. 개선 WECO 방법은 기존 WECO 방법에 임계치 조정자(w)를 추가하여 이상탐지 결정을 대상 네트워크에 적합하게 조정할 수 있도록 하였다. 개발된 개선 WECO 방법을 미국 텍사스 오스틴 관망에 적용 및 검증하였다. 상수도관 파열 발생 시 측정한 비정상데이터와 수요량 변동만 고려한 정상데이터를 분석에 활용하였다. 최적 임계치 조정자 w값을 결정하기 위해 민감도 분석을 수행하였으며, 다양한 계측시간 간격 데이터(dt = 5, 10, 15분 등)의 영향도 분석하였다. 각 경우별 탐지 성능은 탐지확률, 오경보확률, 평균탐지시간을 계산하여 비교하였다. 본 연구에서는 도출된 결과를 바탕으로 WECO 방법을 실제 상수도관 파열 탐지에 적용하기 위한 가이드라인을 제공한다.
2. 개선 Western Electric Company 방법을 이용한 상수도관 파열 탐지
본 연구의 목적은 기존 WECO 방법을 개선하여 상수도관 파열 탐지 성능을 높이는 것이다. 본 절에서는 먼저 통계적공정관리기법, 기존 WECO 방법과 개선된 버전에 대해 설명한 후, 탐지 성능 지수를 정의한다. 본 연구는 수요량의 불확실성과 상수도관 파열 모의를 통해 대상 상수도관망에서 관 유량 및 압력데이터를 생성, 각기 다른 버전의 WECO방법에 제공하여 성능 지수를 계산, 비교하였다. 따라서 본 절에서는 이러한 정상 및 비정상데이터 생성 방법에 대해서도 설명한다.
2.1 개선 Western Electric Company 방법
통계적공정관리기법은 시스템 출력변수(관유량, 압력 등)의 통계특성을 활용하여 시스템 이상을 탐지해내는 기법이다. 세계 제2차대전 중 미육군은 군수품 품질향상을 위해 이를 적용하였고, 이후 여러 공정시스템의 품질관리에 널리 활용되었다. 통계적공정관리기법은 한 변수의 데이터를 개별적으로 처리하는 단변수방법(Univariate Method)과 여러 변수 사이의 상관성을 이상탐지에 활용하는 다변수방법(Multivariate Method)으로 구분된다. 단변수방법은 각각의 계측기 데이터에 이상탐지 결정 방법을 독립적으로 적용한다. 어느 한 계측기 데이터에서 임계치를 초과하는 값이 발견되면 시스템 내에 이상(상수도관 파열)이 존재한다고 가정한다.
상수도관 파열 탐지는 일반적으로 (1) 상수도관망 내 파열된 관이 존재하는지, (2) 존재한다면 위치는 어디인지를 단계적으로 결정한다. 본 연구에서 대상으로 하는 문제는 (1)번 관망 내 파열관 존재 여부 결정이며, (2)는 이상위치결정문제(영어로 “Pinpointing” 또는 “Location/Diagnosis”)는 본 연구의 고려사항이 아니다.
WECO 방법은 Shewart 관리도를 기반으로 하며 구축 방법은 다음과 같다. 정상상태(상수도관 파열이 존재하지 않는 상황)에서 측정된 관유량/압력 데이터를 수집하여 시간별 평균과 표준편차 σ를 계산한다. 시간별 평균과 평균에 표준편차의 일정 배수를 더한 값을 연결하여 도시한 차트를 Shewart 관리도(Shewart Control Chart)라고 하며, Fig. 1은 평균 + 4*표준편차를 도시한 관리도를 보여주고 있다. 상수도관망의 수요량은 주로 아침, 저녁시간에 증가하고 오후, 밤에 감소하는 패턴(Diurnal pattern)이 있기 때문에 관유량 및 압력의 평균값도 이러한 주기성을 가진다.
기존 WECO 방법의 4가지 이상탐지 결정 룰은 아래와 같다.
룰 1: 어떠한 시간에 측정된 값이 그 시간의 평균 ± 4*표준편차 초과/미만이면 이상탐지
룰 2: 연속 측정된 3개의 측정치 중 2개가 평균 ± 3*표준편차에 초과/미만이면 이상탐지
룰 3: 연속 측정된 5개의 측정치 중 4개가 평균 ± 2*표준편차에 초과/미만이면 이상탐지
룰 4: 연속 측정된 8개의 데이터 값이 모두 평균 ± 표준편차에 초과/미만이면 이상탐지
WECO 방법의 룰들은 평균값을 기준으로 관리도 위쪽과 아래쪽에 별도로 적용한다. 예를 들어, 7번의 연속 측정된 관유량 데이터가 평균-표준편차를 넘어서고 8번째 측정 데이터가 평균 + 표준편차를 초과하는 경우는 룰 4는 적용되지 않는다. 일반적인 경우, 계측기는 일정시간 간격으로 시스템 변수 값을 측정한다(예를 들어, 5, 10분 등).
본 연구에서 개발된 개선 WECO 방법은 앞서 언급된 4가지 이상탐지 결정 룰에서, 표준편차에 곱해지는 배수 값을 미세하게 조정할 수 있도록 임계치 조정자(w)를 아래와 같이 추가하였다.
룰 1: 어떠한 시간에 측정된 값이 그 시간의 평균 ± 4w*표준편차 초과/미만이면 이상탐지
룰 2: 연속 측정된 3개의 측정치 중 2개가 평균 ± 3w*표준편차 초과/미만이면 이상탐지
룰 3: 연속 측정된 5개의 측정치 중 4개가 평균 ± 2w*표준편차 초과/미만이면 이상탐지
룰 4: 연속 측정된 8개의 데이터 값이 모두 평균 ± w*표준편차 초과/미만이면 이상탐지
Jung et al. (2015)은 상수도관 파열 탐지를 위해 적용된 3가지 단변수방법 중 누적합(Cumulative Sum, CUSUM) 방법과 지수가중이동평균(Exponentially Weighted Moving Average) 방법이 WECO방법 보다 탐지 성능이 뛰어난 것을 확인하였다. 이러한 결과의 주요 원인은, 누적합과 지수가중이동평균 방법은 대상 상수도관망에 따라 임계치 등을 조정할 수 있는 매개변수가 존재한다는 점이다. 따라서 WECO 방법도 매개변수 조정을 통해 상수도관 파열탐지 성능을 최대화 할 수 있도록 개선하였다.
2.2 상수도관 파열 탐지 성능 지수
이상탐지 방법들의 성능은 탐지 효과성(Effectiveness)와 효율성(Efficiency)으로 비교한다. 탐지 효과성은 탐지의 정확성(Accuracy)을 의미하며, 시스템 내에 이상이 존재하는 경우, 이를 탐지해야하고 반대로 이상이 존재하지 않는 정상상황이면 잘못 탐지(오경보)하지 않아야 한다. 후자의 경우는 제1종 오류(Type I error) 또는 긍정오류(False Positive)라고 부른다. 관 유량, 압력 데이터를 이용한 상수도관 파열 탐지의 경우, 갑작스러운 수요량 증가, 계측오차 등 데이터 자체가 가지는 불확실성 때문에 임계치(이상탐지 결정 기준)를 초과하여 이상탐지를 하기도 한다. 상수도관 파열이 존재하는데 이를 탐지하지 않는 경우는 제2종 오류(Type II error) 또는 부정오류(False Negative)라고 한다. 따라서 효과성이 우수한 탐지 방법은 긍정오류와 부정오류가 적은 방법을 말한다.
본 연구에서는 상수도관 파열 탐지 방법의 효과성 지수로 탐지확률(Detection Probability, DP)와 오경보확률(Rate of False alarm, RF)을 이용하며, 다음과 같이 계산된다.
(1)
여기서, Ntot는 탐지 대상이 된 비정상 이벤트(상수도관 파열이 존재하는 상황)의 개수, Ndet는 그 중 이상탐지를 한 횟수이다.
(2)
여기서, Nntot는 정상 이벤트(상수도관 파열이 없는 상황)의 개수, Nfal은 그 중 오경보를 내린 횟수이다.
이상 탐지 효율성은 존재하는 이상상황을 탐지 방법을 이용하여 얼마나 빨리 탐지하는가와 관련된 신속성에 대한 성능이다. 상수도관 파열이 발생한 후, 짧은 시간 내에 이를 탐지하는 것이 이후 파열 관 복구, 토양 액상화에 의한 싱크홀 등 더 심각한 피해를 예방하는데 도움이 된다. 본 연구에서는 다양한 상수도관 파열 이벤트 상황에서 측정된 데이터를 탐지방법을 통해 분석하여, 해당 방법이 이상탐지까지 걸린 시간을 평균한 평균탐지시간(Average Detection Time, ADT)를 탐지 효율성 지표로 이용한다.
(3)
여기서, tb,i와 td,i는 각각 i번째 상수도관 파열 이벤트의 발생시간과 탐지된 시간이다. 실제, 상수도관 파열의 정확한 발생시간은 미지의 값이나, 본 연구에서는 대상 상수도관망의 수리모형을 이용하여 상수도관 파열을 모의하였기 때문에 기지 값이다. 따라서 평균탐지시간이 짧으며 탐지확률이 높고 오경보확률이 낮은 탐지방법이 성능이 우수한 방법이다.
2.3 정상 및 비정상 데이터 발생 방법
실제 상수도관망에서 관 파열이 발생했을 때 측정한 데이터나 운영정보는 그 자료의 민감성 때문에 획득하기가 매우 어렵다. 따라서 본 연구에서는 개발된 개선 WECO 방법의 탐지성능을 확인하기 위해 상수도관망 수리모형을 이용하여 관유량 및 압력 시계열 데이터를 발생하였다(Fig. 2). 실제의 데이터와 유사한 추계학적 특성을 확보할 수 있도록, 상수도관망 수리모형의 입력변수인 수요량 패턴과 불확실성을 고려하였다. 계산과정은 다음과 같다.
(1) 대상 상수도관망의 각 절점의 기저 수요량 값에 시간별 수요량 계수를 곱한다. 기저 수요량 x 수요량 계수 값은 각 시간별 평균값이다.
(2) 변동계수(Coefficient of Variation) 0.1로 가정하여 평균의 10%를 시간별 표준편차 값으로 정한다.
(3) (1)과 (2)에서 계산한 평균과 표준편차를 이용하여 시간별 절점별 독립인 가우스 난수(Gaussian Random Value)를 발생한다.
(4) (3)번에서 발생한 추계학적 절점별 수요량 시계열을 수리모형에 입력하고, 시간변화모의(Extended Period Simulation)을 수행한다.
(5) 해석 결과로 추계학적 관유량 및 압력 시계열데이터를 획득한다.
위의 과정을 수행하면, 상수도관 파열이 존재하지 않는 상황에서 계측된 관유량 및 압력데이터(정상데이터)를 획득하게 된다. 하나의 정상상황 이벤트에서 오경보 여부를 확인하기 위해 48시간의 정상데이터가 활용되며, 다수의 정상 이벤트로부터 오경보확률(RF)를 계산한다.
반면, (3)번 단계에서 추계학적 절점별 수요량 시계열을 입력하는 것 이외에, 상수도관 파열을 모의하면 비정상 관유량 및 압력데이터를 획득할 수 있으며, 탐지확률(DP)과 평균탐지시간(ADT)을 계산하기 위해 이용된다. 이 경우도 하나의 비정상 이벤트의 탐지여부를 결정하기 위해 48시간의 비정상 데이터가 주어진다.
상수도관망 수리모형, 즉 EPANET (Rossman, 2000)은 질량보존의 법칙과 에너지보존의 법칙을 기반으로 해석을 수행하는데, 상수도관 파열의 모의는 절점에 위치한 에미터(Emitter)를 이용하여 모의할 수 있다. 에미터는 스프링클러와 유사한 수리거동을 하며 수요량으로 정의되지 않는 시스템 외부로의 유량 유출(누수)을 모의하기 적합하다. 에미터의 누수량(eflow)은 압력의 멱승에 비례하며 다음 식으로 계산된다.
(4)
여기서, C는 에미터 계수로 전체 누수량의 크기를 결정하며, q는 지수 값으로 압력 증가에 따른 누수량 변화를 제어한다. q값은 주로 0.5를 사용하며 이 경우 에미터로부터 누수량은 오리피스(Orifice) 흐름이다(Yoo et al., 2005). 본 연구에서는 상수도관 파열을 모의할 때, 보다 현실적인 상황을 반영하기 위해 각 이벤트별 상수도관 파열의 발생시간, 규모, 발생위치를 일정 범위 내에서 균등임의추출(Uniform random sampling)하였다.
3. 연구 대상 네트워크
본 연구에서는 개발된 WECO 방법을 미국 텍사스 오스틴 관망에 적용하였다(Jung et al., 2015; Hagos et al., 2016). 오스틴 관망은 1개의 저수지로부터 물을 공급받으며, 126개의 절점과 90개의 관으로 구성되어 있다(Fig. 3). 북동과 남서에 망(Loop) 형태의 주거지 구역이 존재하며, 저수지 직하류와 북쪽에 가지(Branch) 형태의 공업/상업 구역이 존재한다. 오스틴 네트워크의 총 평균수요량은 726 l/s이다. 1829 mm의 관이 수원으로부터 총 수요량을 네트워크 내로 운반하며, 남동에서 북서로 가로지르는 762~1524 mm의 간선이 각 구역의 수요량을 전달한다.
본 연구에서는 상수도관 파열 탐지를 위해 관 유량을 이용하였고, 관 유량 계측기의 개수에 따른 탐지 성능 변화를 분석하기 위해 총 5개의 유량계가 네트워크 각 구역에 설치되어 있다고 가정하였다(Fig. 3). 1번 유량계는 네트워크 중앙에 위치한 1219 mm 관에 설치되었고, 2번과 3번관은 각각 북동, 남서 주거지역 중앙에, 4번과 5번은 각각 저수지 직하류, 북쪽 공업/상업지역에 설치되었다(Fig. 3). 단일 유량계 데이터에서라도 WECO 방법에 의한 룰을 만족하는 경우, 대상 네트워크에 이상이 존재한다고 판단한다.
개선된 WECO 방법을 검증하기 위해 유량계 지점에서 장기 관 유량 시계열을 발생하였다. 데이터 발생 방법은 Fig. 2와 방법론에 설명된 것과 같다. 정상데이터는 앞서 설명한 바와 같이 수요량의 불확실성만을 고려하여 발생하였으며, 비정상데이터는 수요량의 불확실성에 상수도관 파열을 모의하여 획득하였다. 두 데이터는 모두 수요량 패턴을 기반하였기 때문에 실제 데이터와 유사하게 강한 시간적 상관성(Temporal correlation)을 보유하고 있다. 정상데이터의 경우, Shewart 관리도 구축을 위한 세트와 WECO 검증을 위한 세트를 독립적으로 발생하였다. 발생된 데이터는 측정시간 간격 5분 데이터로, 시간간격의 탐지 성능에의 영향을 비교하기 위해 데이터가 5, 10, 15, 30, 60분마타 측정된다고 가정하였다.
탐지성능 산정에 다양한 크기의 상수도관 파열 이벤트를 고려하기 위해 Eq. (4)의 에미터 계수 C를 자연수 1과 50 사이에서 임의 선택하였다. 그 결과, 본 연구에서는 총 수요량 726 l/s의 0.1~3.3%에 준하는 누수량을 유발하는 상수도관 파열을 모의하였다. 또한, 상수도관 파열 발생 위치는 90개의 절점 중 임의로 선택하였으며, 발생시간도 총 288개의 시간간격 중(= 24*60/5) 하나를 임의로 선택하여 그 시각부터 에미터 모의를 수행하였다. 발생시간이 새벽과 같이 수요량이 낮고 압력이 높은 시각에서는, Eq. (4)에 의해 누수량이 높게 계산되어 탐지에 유리할 수 있다. 정상 및 비정상 모두 100개의 이벤트를 발생시켰다. 각 이벤트마다 48시간 동안 측정된 유량계 데이터를 WECO 방법에 제공하였다.
4. 적용 결과
본 절에서는 먼저 기존 WECO 방법과 개선 WECO 방법의 탐지확률, 오경보확률, 평균탐지시간을 비교하였다. 개선 WECO 방법은 기존 방법과 달리, 임계치 조정자 w라는 매개변수가 존재하기 때문에 이에 대한 민감도분석을 통해 최적 값을 선정하였다. 또한, 계측빈도에 따른 WECO 방법의 탐지성능을 비교하였다. 앞서 언급된 각 경우 계측기 개수(가용 데이터 양) 증가에 따른 탐지성능 변화도 비교하였다.
4.1 WECO 방법 비교
개선 WECO 방법을 기존 WECO 방법에 비교하기 앞서, 최적 임계치 조정자 w를 선정하기 위해 민감도 분석을 수행하였다. 임계치 조정자는 WECO 룰 간의 간격을 조정하는 역할을 한다. 예를 들어, w = 1.2라면 룰 1에 의해 관 유량 값이 정상상태의 평균 + 4.8*표준편차를 초과할 경우 이상탐지를 결정한다(기존 WECO 방법에서는 기준이 평균 + 4*표준편차). 본 연구에서는 계측시간 간격이 5분이고 w = 0.8, 1.0, 1.2, 1.4, 1.6일 때 탐지확률(DP, %), 오경보확률(RF, %), 평균탐지시간(ADT, hr)를 다음 Tables 1~3과 같이 구하였다.
Table 1. Detection probability (%) of the improved WECO methods with different w values
| Number of meters | w | ||||
| 0.8 | 1 | 1.2 | 1.4 | 1.6 | |
| 1 | 90 | 58 | 41 | 37 | 33 |
| 2 | 98 | 64 | 48 | 43 | 39 |
| 3 | 99 | 71 | 57 | 51 | 45 |
| 4 | 99 | 77 | 65 | 59 | 52 |
| 5 | 100 | 81 | 67 | 62 | 55 |
Table 2. False alarm rate (%) of the improved WECO methods with different w values
| Number of meters | w | ||||
| 0.8 | 1 | 1.2 | 1.4 | 1.6 | |
| 1 | 72 | 9 | 0 | 0 | 0 |
| 2 | 93 | 11 | 0 | 0 | 0 |
| 3 | 98 | 18 | 0 | 0 | 0 |
| 4 | 99 | 23 | 0 | 0 | 0 |
| 5 | 100 | 27 | 0 | 0 | 0 |
Table 3. Averaged detection time (hr) of the improved WECO methods with different w values
| Number of meters | w | ||||
| 0.8 | 1 | 1.2 | 1.4 | 1.6 | |
| 1 | 9.0 | 11.0 | 5.8 | 7.0 | 6.2 |
| 2 | 7.3 | 9.3 | 5.7 | 5.6 | 5.2 |
| 3 | 5.2 | 9.0 | 6.1 | 6.1 | 5.8 |
| 4 | 3.6 | 7.6 | 5.9 | 6.0 | 6.3 |
| 5 | 2.9 | 8.2 | 5.6 | 5.8 | 6.1 |
Table 1에서와 같이, 임계치 조정자 값이 클수록 이상탐지 허용기준이 높아지기 때문에 탐지확률이 감소한다. 1개의 관 유량 계측기를 이용하며 w = 0.8일 때는 100개의 비정상이벤트 중 90개를 탐지하였지만, w = 1.6일 때는 탐지확률이 33%에 그쳤다. 한편, 계측기 개수가 증가할수록 탐지확률도 증가하였다. 그렇다면 w = 0.8로 지정하는 것이 가장 최적일까? Table 2의 오경보확률을 보면, 반대로 임계치 조정자의 값이 작을수록 오경보확률이 증가하는 것을 확인할 수 있다. 계측기 1개를 이용하는 경우에도 정상 이벤트 100개 중 72개에서 오경보가 발생 되었다. 즉, 탐지기준이 너무 낮아 자연적인 관 유량의 변동에서 오경보를 울리는 것이다. 오경보확률은 데이터 양이 많아질수록, 즉 계측기 개수가 증가할수록 증가한다(Table 2). 따라서 적정 수준의 임계지 조정자를 설정할 필요가 있다. 오경보확률이 0%가 될 때 탐지방법의 신뢰성이 가장 높다고 할 수 있기 때문에 오경보확률이 0%가 되는 w = 1.2 값을 최적 매개변수 값으로 선정하였다.
선정된 w = 1.2 경우에 평균탐지 시간은 약 6시간으로 상수도관 파열이 발생하고 6시간이 경과한 후 탐지된다(Table 3). 보통, 계측기 개수가 증가할수록 평균탐지시간이 감소하는 경향이나, 계측기 개수가 4대이며, w = 1.6의 경우와 같이 증가하기도 한다. 이는 기존대비 추가된 계측기가 장시간을 소비하고 탐지를 하는 경우로 탐지확률은 향상시키는 반면, 평균탐지시간을 증가시킨다.
개선 WECO 방법에 w = 1.2를 적용하면 탐지확률은 41~67% (계측기 1~5개 이용)이며, 오경보확률은 0%이다. Tables 1~3에서 w = 1일 때 기존 WECO 방법과 같으며, 이때 오경보확률은 9~27%, 탐지확률은 58~81%이다. 기존 WECO 방법은 높은 오경보확률 때문에 이상탐지 신뢰성에 문제가 있었으나, 이를 개선하여 WECO 방법을 활용할 수 있게 되었다. Jung et al. (2015)은 동일한 오스틴 관망에서 관 유량을 이용하여 1~5개 계측기(본 연구와 다른 위치) 데이터에 기존 WECO 방법을 적용한 결과, 44~63%의 탐지확률과 하루 당 오경보빈도 0.03~0.15개의 결과를 획득하였다. 따라서 본 연구에서 개발한 개선 WECO 방법은 Jung et al. (2015) 연구에 대비하여서도 뛰어난 탐지성능을 보였다.
4.2 계측 빈도에 따른 영향
본 절에서는 계측 빈도에 따른 탐지확률과 오경보확률을 비교하였다. w = 1.0과 w = 1.2의 경우, 즉 기존 WECO 방법과 최적 임계치 조정자 매개변수를 적용한 개선 WECO 방법의 두 탐지성능(DP와 RF)을 계측시간 간격 5, 10, 15, 30, 60 분의 데이터를 이용하여 비교하였다. 그 결과, Table 4와 같이 방법에 상관없이 계측시간 간격이 길어질수록 탐지확률이 감소하였다. 기존방법(w = 1.0)의 경우, 계측기 2개의 5분 데이터를 이용할 때는 탐지확률이 64%였으나 간격을 1시간(60분)으로 할 때 41%로 감소하였다. 데이터의 이상치를 발견하기 위해서는 계측 횟수 즉, 데이터 샘플링 횟수가 높아야함을 확인하였다. 앞서 확인한 바와 같이 동일한 계측빈도의 경우 계측기의 개수가 많을수록 탐지확률이 증가하였다(Table 4 and 5).
Table 4. Detection probability (%) of the cases of w = 1.0 and 1.2 with different measurement intervals
| Number of meters | w = 1.0 | w = 1.2 | ||||||||
| 5 min | 10 min | 15 min | 30 min | 60 min | 5 min | 10 min | 15 min | 30 min | 60 min | |
| 1 | 58 | 49 | 47 | 41 | 35 | 41 | 36 | 38 | 33 | 28 |
| 2 | 64 | 55 | 51 | 48 | 41 | 48 | 40 | 43 | 36 | 34 |
| 3 | 71 | 62 | 58 | 55 | 47 | 57 | 48 | 49 | 41 | 38 |
| 4 | 77 | 70 | 65 | 63 | 55 | 65 | 56 | 57 | 48 | 45 |
| 5 | 81 | 73 | 70 | 66 | 58 | 67 | 59 | 60 | 51 | 48 |
Table 5. False alarm rate (%) of the cases of w = 1.0 and 1.2 with different measurement intervals
| Number of meters | w = 1.0 | w = 1.2 | ||||||||
| 5 min | 10 min | 15 min | 30 min | 60 min | 5 min | 10 min | 15 min | 30 min | 60 min | |
| 1 | 9 | 5 | 4 | 2 | 0 | 0 | 0 | 0 | 0 | 0 |
| 2 | 11 | 5 | 4 | 3 | 0 | 0 | 0 | 0 | 0 | 0 |
| 3 | 18 | 8 | 5 | 3 | 0 | 0 | 0 | 0 | 0 | 0 |
| 4 | 23 | 10 | 7 | 4 | 0 | 0 | 0 | 0 | 0 | 0 |
| 5 | 27 | 10 | 9 | 4 | 0 | 0 | 0 | 0 | 0 | 0 |
반면, 오경보확률은 샘플링의 횟수가 줄어들수록(계측빈도가 낮아질수록, 계측시간 간격이 증가할수록) 낮아졌다. 기존 WECO 방법의 경우, 계측시간 간격을 5분에서 60분으로 늘일수록 오경보확률은 0으로 수렴하였다. 개선 WECO 방법은 최적 매개변수 값을 선택하였기 때문에 빈도에 상관없이 모두 오경보확률이 0이다.
Fig. 4는 개선 WECO 방법(w = 1.2) 사용 시 계측기 1개가 증가할 때마다 탐지확률의 증가량(△DP)을 계측 빈도와 구간(1개에서 2개로 증가, 2개에서 3개로 증가 등)에 따라 나타낸 것이다. 바차트의 오른쪽으로 갈수록 증분 △DP이 감소한다는 것은, 기존에 설치된 계측기의 개수가 많아질수록 추가 계측기에 의한 탐지확률의 증가는 적다는 것을 의미한다. 이러한 패턴을 계측 빈도와 상관없이 확인되었다. 다만, 계측빈도가 낮은 경우, 그 빈도가 높은 경우보다 대부분의 구간에서 탐지확률의 증분이 작은 것을 확인하였다. 예를 들어, 계측 시간간격이 60분일 때 계측기 2대에서 3대로 증가할 때 탐지확률 증가분이 4%이지만, 5분일 때는 9%이다(Fig. 4).
5. 결 론
본 연구에서는 상수도관 파열 탐지성능을 향상하기 위해, 통계학적공정관리기법 중 하나인 WECO 방법에 임계치 조정자를 추가하여 개선 WECO 방법을 개발하였다. 개선 WECO 방법의 성능을 검증하고, 기존 방법과 비교하기 위해 오스틴 관망에서 관 유량 정상 및 비정상 데이터를 발생하였다. 오스틴 관망은 구역별로 가지형과 망형이 혼재된 실제 관망이다. 정상데이터는 수요량의 불확실성을, 비정상데이터는 에미터 모의를 통한 상수도관 파열 상황까지 고려하였다. 탐지효과성과 효율성을 정량적으로 산정하기 위해, 각 방법별 정상 및 비정상 상황 시 탐지확률, 오경보확률, 평균탐지시간 지수를 계산하였다. 먼저, 개선 WECO 방법의 최적매개변수를 민감도분석을 통해 결정하였다. 두 방법은, 데이터 양(계측기 개수)에 따른 탐지성능 변화를 확인하기 위해 관 유량계가 1~5개일 때 탐지성능지수를 산정하여 비교하였다. 마지막으로 계측 빈도에 따른 민감도분석도 수행하였다. 다음은 본 연구의 결론이다.
1) 개선 WECO 방법의 성능을 최대화하는 임계치 조정자 w의 값은 1.2이다. 따라서 관 유량을 이용하여 상수도관 파열을 탐지하고자 할 때, WECO방법 각 룰별 이상탐지기준을 완화해야 한다. w = 1.2일 때 개선 WECO 방법은 기존 WECO 방법에 비해 전반적인 탐지성능이 우수하다.
2) 임계치 조정자 w 값이 작을수록 탐지확률은 증가하지만, 역으로 오경보확률은 증가한다. 오경보가 종종 발생한다면 탐지확률과 평균탐지시간에 상관없이, 신뢰성 있는 이상탐지를 수행할 수 없기 때문에 적절한 w값의 설정이 필요하다.
3) 데이터의 계측 빈도가 높을수록, 즉 계측시간 간격이 짧을수록 탐지확률과 오경보확률이 높아진다. 따라서 WECO 방법을 실제 적용하기에 앞서, 임계치 조정자 값과 계측빈도에 대한 민감도 분석을 반드시 수행해야 한다. 본 연구에서 고려한 계측시간 간격 5, 10, 15, 30, 60분의 경우에, 개선 WECO 방법(w = 1.2)은 오경보확률이 모두 0%이다. 따라서 5분 계측시간 간격을 적용한 경우 탐지확률이 가장 높았다.
4) 계측기를 추가로 설치할 때, 1개 당 탐지확률 증가량(△DP)은 이미 설치된 계측기 수가 많을수록 작다. 계측기 개수는 계측기 종류가 동일할 때 비용과 같으므로, 한계비용(Marginal Cost)의 원리가 적용되는 것이라 말할 수 있다.
본 연구에서는 실무에 적용이 용의한 WECO방법에 매개변수를 추가하여 탐지성능을 향상시켰다. 다음과 같은 후속 연구가 가능하다. 본 연구에서는 WECO방법의 4가지 룰에 동일한 임계치 조정자 값을 적용하였다. 하지만, 관망의 특성에 따라, 각 룰별로 최적 임계치 조정자 값을 다를 수 있다. 따라서 4개의 다른 임계치 조정자를 설정하고, 최적 매개변수 조합을 결정할 수 있다. 또한, 임계치 조정자를 요일별, 특별한 날(운동경기가 있는 날)에 다르게 적용해야하는 경우가 있을 수 있는데, 이러한 동적 이상탐지 룰에 대한 연구가 필요하다. 마지막으로, WECO방법 룰에서 이상탐지를 위해 만족해야하는 제약조건들을 조정하여, 보다 장기의 연속데이터를 고려한 의사결정이 가능하도록 변경할 수 있다. 예를 들어, 현재 WECO방법은 최대 8번의 과거 측정된 데이터를 고려하여 이상탐지를 하는데(룰 4), 이를 과거 9, 10, ... 개의 데이터로 변경한 후 탐지성능을 비교하여 최적 데이터 개수를 결정할 필요가 있다. 마지막으로, 압력기반해석(Pressure Driven Analysis)을 통해 본 연구를 수행하여 결과를 비교할 수 있다.






