1. 서 론
2. 다항식의 회귀분석
2.1 회귀분석
2.2 통계적 가설 검정
2.3 분산 분석
3. 설계강우량의 시간분포 회귀식
3.1 설계강우량의 시간분포
3.2 설계강우량 시간분포 회귀식의 계수 산정
4. 설계강우량 시간분포 회귀식의 유의성 검정
4.1 유의성 검정 과정
4.2 구미지점 설계강우량 시간분포 회귀식의 유의성 검정
4.3 전국 강우관측소 시간분포 회귀식의 유의성 검정
5. 결 론
1. 서 론
설계강우량은 수공구조물을 설계하기 위한 기초자료로서 확률강우량의 산정 및 시간분포가 중요한 요인으로 작용한다. 국내에서는 설계강우량 시간분포를 위한 방법으로 Huff의 4분위 방법을 사용하는 것이 일반적으로 실무에서는 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 관측소별 Huff의 무차원 누가우량의 백분율을 이용하여 설계홍수량 산정요령(Ministry of Land, Transport and Maritime Affairs, 2012)에서 제안한 바와 같이 Huff의 4분위 방법 중 3분위의 자료를 이용하여 6차 회귀식을 산정하여 시간분포를 위한 방법으로 사용하고 있다. Huff의 분위별 곡선에 대한 회귀식은 독립변수의 수가 많아질수록 특히 다항회귀분석시에는 고차식으로 차수가 올라갈수록 결정계수가 높아지므로 적합도가 높아진다. 그러나 4차 이상의 회귀식의 경우 결정계수의 차이가 거의 없으며, 고차식으로 갈수록 적합도의 차이가 미미하게 증가하므로 최대 차수를 정함에 있어서 객관적 기준이 부재한 상황에서 6차식을 획일적으로 사용하는 것이 무조건 합리적이라고 할 수 없다. 또한 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있어 통계적 유의수준에 기초하여 회귀식을 산정할 필요가 있다.
설계 강우의 시간적 분포를 적용하여 사용가능하게 만드는 방법은 매우 어렵기 때문에 많은 학자들의 연구로 여러 가지 방법이 개발되어 사용되고 있다. 우선 강우의 시간분포를 임의로 배열하는 방법으로 Mononobe 식과 같은 형태는 초기에 많이 연구되었다. Honer and Jens (1942)는 미 농무성의 연구계획의 일환으로 St. Louis에서 수행한 유출 해석에서 설계우량을 이용하여 강우를 임의로 배열하였을 때의 유출량을 비교검토하였다. 그 후 Schiff (1943), Ogrosky (1964), Pilgrim and Cordery (1975)에 의해서 같은 연구가 수행되었으며, Hansen et al. (1982)은 가능최대홍수량을 추정하기 위하여 미 서부지역의 가능최대강수량을 중방위 호우형태로 사용하고 분석 방법을 제시하였다. 둘째는, 강우의 시간분포에 대해 강우강도-지속기간-빈도(Rainfall Intensity Duration Frequency, I.D.F)관계를 이용하여 수학적으로 모형화한 형태로 가장 간단한 형태로는 완전한 전방위 호우형태로 가정할 수 있으며, 수학적 방법을 통해 중방위 호우형태로 재배열한 것으로 교호블럭방법(Alternating Block Method)이 대표적이다. 이론상 Mononobe 방법과도 상당히 유사한 방법이다.
세 번째는 가장 많은 학자들이 연구한 방법으로써 강우계측기로 관측한 실제 데이터를 이용하여 누가곡선을 이용하는 형태로 대표적인 방법으로는 실무에서 주로 사용되고 있는 Huff (1967)의 4분위 방법이다. Huff의 4분위 방법은 실제 강우사상을 근거로 유도되어, 강우의 첨두 발생 위치를 고려하여 강우의 시간분포를 할 수 있는 장점이 있다. 그러나 확률강우량도 개선 및 보완 연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 선택적 평균이 아닌 포괄적 평균의 문제점으로 인해 홍수량 산정 시 첨두유량이 과소 산정될 수 있는 문제점을 가지고 있으며, 이에 대해 향후 폭 넒은 검토가 필요하다고 밝힌바 있다.
넷째로, 이상의 세 가지 형태와는 다른 형태인 시간분포를 평균이동법을 이용 ․ 분석한 것이다. Pilgrim et al. (1969)은 호주의 시드니 지역에 대한 시간분포를 평균이동법을 이용 ․ 분석하였으며, 이와 다른 형태의 연구로써 Yen and Chow (1977)는 무차원 1, 2차 모멘트를 이용하여 시간분포를 삼각형과 사다리꼴 우량주상도의 형태로 단순화하여 제시하였다.
한편, 국내에서는 Seo (1965)에 의해서 최초로 강우의 시간분포 개념이 고찰되었다. Park (1980)은 서울지점에 대하여 Huff의 4분위 방법에 의한 시간분포를 분석하였으며, Seo et al. (1989)은 Yen and chow방법, Huff의 4분위 방법, Pilgrim- Cordery 방법을 이용하여 우리나라 전국 지점별로 강우의 시간분포를 분석하였다. Lee and Kim (2005)는 강우의 수문학적 특성을 고려하여 도시지역에서의 시간분포를 분석하여 Huff와 Yen and Chow 방법의 무차원 특성변수를 제시하고 강우의 수문학적 특성을 분류하였다. Jang et al. (2006a, 2006b)은 기존에 제시된 방법들의 문제점을 보완하고 유역 내 특성이 반영될 수 있도록 강우시간 분포를 개발하여 제시하였으며, Lee and Chu (2006)는 Huff 4분위법과 서울지점의 연최대치 강우자료의 시간분포 특성을 비교분석하였다.
기존 설계강우량 시간분포에 대한 연구는 주로 Mononobe, Yen and Chow, Pilgrim-Cordery, Huff의 4분위 방법 등 시간분포 방법에 대한 연구들이 주로 진행되었으며, 시간분포 회귀식의 회귀계수에 대한 연구는 이루어지지 않고 있는 실정이다. 현재 수공구조물 설계를 위한 강우의 시간분포 적용시 Ministry of Land, Transport and Maritime Affairs (2012)에서 제시한 Huff의 4분위 방법의 6차 다항식을 획일적으로 사용하고 있으나 시간분포 회귀식의 적정 차수 결정에 대한 객관적 기준이 부재한 상황이다.
따라서 본 연구에서는 시간분포 회귀식으로 실무에서 획일적으로 사용되고 있는 6차 다항식의 적정 차수를 결정하기 위해 기상청 관할 69개 강우관측지점을 대상으로 Huff의 4분위 방법의 시간분포 회귀식을 산정하고 각 회귀계수에 대한 유의성 검정을 실시하여 회귀식의 적정 차수 결정을 위한 객관적 기준을 제시하고자 한다.
2. 다항식의 회귀분석
2.1 회귀분석
회귀분석(Regression Analysis)이라는 용어는 하나나 그 이상의 독립변수의 종속변수에 대한 영향을 추정 할 수 있는 통계기법으로 하나의 독립변수를 가진 회귀분석에서, 하나의 방정식은 독립변수와 종속변수의 결합분포를 보여주는 지점들의 분포구성을 통해 지나가는 하나의 선을 설명하고 있다. 독립변수(Independent variable)는 회귀분석에서 다른 변수에 영향을 주는 원인에 해당하는 변수로 설명변수(Explanatory variable)라고도 하며, 종속변수(Dependent variable)는 영향을 받는 결과에 해당하는 변수로 반응변수(Response variable)이라고도 한다.
회귀분석은 독립변수와 종속변수 사이의 구체적인 함수식을 찾아내고, 독립변수로부터 종속변수를 예측하는데 목적이 있다. 이 때 함수식은 제일 단순한 1차 직선식부터 n차식, 지수식, 로그식 등 다양한 형태로 나타낼 수 있다.
다항식의 회귀분석(Polynomial regression)은 기본적인 개념은 선형 회귀분석 (Linear regression)과 같다. 만약 n개의 데이터가 주어졌다고 가정하였을 때 
이 주어진 n 개의 데이터를 가장 잘 표현하는 다항식을 구하는 것이 목적이라고 할 수 있다.
에 대한 m차 다항식은 Eq. (1)과 같이 표현 할 수 있다.
(1)
번째 데이터와 다항식의 사이에는 오차가 발생하며, 데이터의 개수(n)가 다항식의 차수(m)보다 항상 커야한다는 기본사항이 존재한다.
2.2 통계적 가설 검정
통계적 가설 검정(Statistical hypothesis test)은 모집단의 분포의 모양이나 모수 등에 대한 가설을 세우고, 모집단에서 추출한 표본에 기초하여 가설의 채택이나 기각을 결정하는 통계적 기법이다. 가설 검정은 모집단의 특성치인 각종 모수에 대하여 가정되었거나 예상되는 값의 진위를 표본정보를 이용하여 판정하는 통계적 추론방법으로 모수가 취하리라고 가정한 값이 무리 없이 받아들여질 수 있는가를 판정하는 방법으로서, 사실이라고 가정한 모수의 값을 중심으로 일종의 신뢰구간을 설정한 후 표본조사를 통해 얻어진 모수의 추정치가 이 구간 내에 속하면 가정된 값을 수락하고, 아니면 기각하는 방법으로 서로 상반되는 두 가설을 귀무가설(Null hypothesis)과 대립가설(Alternative hypothesis)이라 부른다.
가설 검정에서 알파오류를 범할 확률을 유의수준(signifi-cant level)이라고 하며, 유의수준은 귀무가설이 옳은 것인데도 기각되는 확률로 일반적으로 통계학에서 유의수준의 값으로 5%를 택한다.
귀무가설이 수락되면 귀무가설이 옳다라는 것이 아니라 대립가설이 옳다라고 할 수 없다는 것을 의미한다. 귀무가설이 옳다는 것을 주장하기 위해 가설 검정을 사용해서는 안되며, 유의수준은 대립가설이 옳다는 주장이 틀릴 확률을 말한다. 일반적으로 어떤 결과를 낼 확률이 유의수준 5% 안에 들어갈 때 이 결과를 ‘통계적으로 의미 있다.’고 규정할 수 있다.
2.3 분산 분석
분산 분석(Analysis of variance, ANOVA)은 두 개 이상 집단들의 평균 간 차이에 대한 통계적 유의성을 검증하는 방법으로 t 검정을 일반화한 분석 방법이다. 분산 분석은 각각의 모집단이 정규분포이며 분산은 모두 동일한 값을 가진다고 가정할 때 귀무가설과 대립가설을 비교 ․ 검증하는 방법이다. 두 집단을 비교할 경우에는 t 검정을 사용하고 세 집단 이상일 경우에는 t 검정을 사용할 수 없으므로 F 검정을 사용한다. 분산 분석은 Eq. (2)와 같이 설명된 변산(SSR)과 잔차(SSE)의 합으로 전체 변산(SST)을 산정하며, Table 1과 같은 분산분석표를 이용하여 각 회귀계수에 대한 F-통계량을 산정한다.
Table 1. ANOVA(Analysis of variance) table ![]() | |
SST: Sum of Square of Total SSR: Sum of Square of Regression SSE: Sum of Square of Error / Sum of Square of Residuals | |
(2)
여기서,
는
집단의
번째 관측치,
: 표본 자료 전체 평균,
: 요인 수준
표본 자료의 평균을 의미한다.
Table 1에 의해 산정된 F-통계량을 기초로 유의확률(signi-ficance probability)을 계산하여 연구자가 선택한 유의수준을 통해 가설검정을 실시하게 된다. 유의확률은 p-value로도 불리며, 검정통계량의 결과 값에 대해 귀무가설을 기각할 수 있는 최소한의 유의수준으로 귀무가설을 기각할 수 있으면 검정통계량의 결과 값은 귀무가설에서 발생가능성이 보다 희박한 값이 되므로 p-value의 값이 작을수록 대립가설을 반대하는 보다 강력한 증거가 된다고 할 수 있다.
3. 설계강우량의 시간분포 회귀식
3.1 설계강우량의 시간분포
설계강우량은 수공구조물을 설계할 때 계획기준이 되는 강우량으로 국내에서는 실측 유량자료의 부족으로 홍수량의 빈도해석을 실시하기가 어려우므로 일반적으로 강우자료를 수집하여 산정된 설계강우량을 이용하여 강우-유출 관계에 따라 산정된 설계홍수량을 사용하고 있다. 강우의 시간적 분포에 따라 첨두유출량 및 유출수문곡선의 형태가 변화하여 유출특성이 크게 달라지므로 안전한 수공구조물의 설계를 위해서는 설계강우량의 시간분포가 매우 중요하다.
국내에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위 방법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해있는 구간을 선택하여 1~4분위를 정하는 방법이다. 설계홍수량 산정요령(Ministry of Land, Transport and Maritime Affairs, 2012)에서 강우의 시간분포를 위한 방법으로 Huf의f 4분위 방법 중 3분위를 사용하도록 제안하고 있으며, 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서는 전국 69개 강우관측소를 대상으로 관측소별 Huff 방법 각 분위의 무차원 누가우량의 백분율을 제시하고 있다. Huff의 4분위 방법 각 분위의 무차원 누가우량 백분율에서 Table 2 and Fig. 1과 같은 초과확률 50%에 해당하는 누가우량 곡선이 통계해석상 중앙값을 나타내고 있기 때문에 현재 실무에서는 Huff 3분위 50% 확률의 누가우량곡선을 강우의 시간분포를 위한 값으로 사용하고 있다. 본 연구에서는 기상청 관할 69개 강우관측지점을 대상으로 Huff의 4분위 방법의 시간분포 회귀식을 추정하고 추정된 회귀계수를 이용하여 시간분포 회귀식의 유의성 검정을 실시하였다.
3.2 설계강우량 시간분포 회귀식의 계수 산정
설계우량주상도의 지속기간의 수를 11개로 나누지 않고 임의의 수로 나눌 경우에는 각 지점별로 주어진 초과확률 50%의 무차원 누가우량곡선을 도시하여 곡선으로부터 원하는 수만큼 읽어서 사용하거나 다음과 같이 곡선의 회귀방정식을 이용하여 지속기간 X(%)에 따른 누가우량 Y(%)를 산정할 수 있다. 본 연구에서는 실무에서 사용되고 있는 Huff 3분위의 초과확률 50%의 누가우량곡선을 이용하여 연구를 진행하였다.
(3)
현재 실무에서 사용되고 있는 Huff 3분위의 초과확률 50%의 누가우량곡선을 이용하여 Eq. (3)과 같은 형태의 회귀식의 회귀계수를 산정하였다. 구미지점 Huff 분포 3분위의 초과확률 50%의 누가우량곡선을 이용하여 3차부터 7차까지 누가우량곡선의 회귀식의 회귀계수와 결정계수를 산정하였다(Table 3).
Table 3. Estimation of regression coefficients of polynomial regression equation for temporal distribution (Gumi) ![]() |
구미지점 시간분포 회귀식의 회귀계수를 산정한 결과 일반적인 회귀분석의 결과와 동일하게 독립변수의 수가 많아질수록 결정계수가 높아지는 것을 알 수 있다. 그러나 4차 이상의 다항 회귀식의 경우 결정계수가 모두 99.9%를 상회하여 그 차이가 크지 않으며 고차식으로 갈수록 적합도가 미미하게 상승하는 것을 알 수 있으며, 이러한 경향은 차수가 증가할 때마다 강하게 나타남을 알 수 있다.
또한 산정된 회귀식을 이용한 누가우량 백분율의 비교를 위해 3차부터 7차까지 산정된 회귀식의 회귀계수를 이용하여 강우지속기간의 비(%)에 따른 구미지점의 누가우량 백분율(%)을 산정하였다(Table 4).
Table 4에서 보는 바와 같이 회귀식을 이용하여 구미지점의 누가우량 백분율을 산정한 결과 강우지속기간 백분율이 0% 및 100%인 경우 누가우량 백분율의 그래프가 0과 100인 지점을 통과해야 하나 산정된 다항식을 이용하여 계산한 결과 0과 100의 값을 나타내지 못하는 것을 알 수 있다. 0과 100을 둘 다 만족하는 회귀식의 회귀계수를 산정할 수 없으므로 그래프가 절점이 (0,0)인 지점을 통과하도록 Eq. (4)와 같이 절편이 0인(상수항을 갖지 않는) 회귀식의 회귀계수(Table 5)와 누가우량 백분율을 재 산정하였다(Table 6).
Table 5. Re-estimation of regression coefficients of polynomial regression equation for temporal distribution (Gumi) ![]() |
(4)
4. 설계강우량 시간분포 회귀식의 유의성 검정
4.1 유의성 검정 과정
실무에서 사용되고 있는 Huff 방법의 시간분포 회귀식의 유의성 검정을 위하여 앞 절에서 재 산정한 시간분포 회귀식의 회귀계수를 이용하여 3차부터 7차식까지 분산분석(Analysis of variance, ANOVA)을 실시하였다.
회귀식의 변수선정은 예측변수가 없는 상황에서 하나씩 변수를 추가하는 방법인 전방향 선택(Forward selection) 방법을 사용하여 3차식부터 7차식까지 순차적으로 증가하면서 분석하였으며, 또한 검정을 위한 p-값의 판단을 위하여 통계학에서 일반적으로 사용하는 유의수준 5% (
= 0.05)를 적용하여 계수의 가설검정을 실시하였다.
이 때, 귀무가설
, 대립가설
을 설정하여 가설검정을 실시하기로 한다(Table 7).
4.2 구미지점 설계강우량 시간분포 회귀식의 유의성 검정
Huff 분포 3분위의 초과확률 50%의 누가우량백분율을 이용하여 3차부터 7차까지 재산정된 구미지점의 누가우량곡선의 다항식 계수를 이용하여 분산분석을 실시하였다(Tables 8~12). 3차부터 7차까지 분산분석 결과 3차와 4차 회귀식의 경우 모든 회귀계수의 F-통계량에 대한 p-값이 유의수준 5% 이내에 포함되므로 회귀계수들은 귀무가설이 기각되어 유의한 계수로 분석되었다. 5차와 6차 회귀식의 경우 회귀계수
의 p-값이 유의수준 5%에 포함되지 않아 귀무가설이 승인되었으므로 유의하지 않은 계수로 분석되었으며, 7차 회귀식은 회귀계수
와
의 p-값이 유의수준 5%에 포함되지 않아 귀무가설이 승인되었으므로 유의하지 않은 계수로 분석되어 통계학적으로 구미지역의 Huff 방법 시간분포 회귀식은 4차까지 모든 회귀계수가 유의한 것으로 나타났다.
4.3 전국 강우관측소 시간분포 회귀식의 유의성 검정
구미지점 시간분포 회귀식의 유의성 검정과정과 동일하게 기상청 관할 69개 강우관측소 지점의 시간분포 회귀식의 유의성 검정을 실시하였다. 3차식에서 7차식으로 차수를 늘려가면서 구미지점과 동일하게 분산분석을 수행하였으며, 각 차수에 대한 모든 회귀계수의 F-통계량에 대한 p-값을 산정하여 유의수준 5% (
=0.05)에 대한 가설검정을 실시하였다(Table 13). 전국 69개 강우관측소 지점의 시간분포 회귀식의 분산분석 결과 대부분의 지점에서 시간분포 회귀식이 4차식까지 회귀계수의 F-통계량에 대한 p-값이 유의수준 5%를 만족하는 것으로 나타났으며, 5차식 이상의 경우 회귀계수의 F-통계량에 대한 p-값이 유의수준 5%를 만족하지 못하는 경우가 발생하는 것으로 분석되었다. 일부지점에서는 6차 회귀식까지 유의수준 5%를 만족하였으며, 제천지점의 경우 7차 회귀식까지 모든 회귀계수가 유의수준 5%를 만족하는 것으로 분석되었다.
기상청 관할 69개 강우관측지점의 시간분포 회귀식의 유의성 검정 결과 제천을 제외한 전 지점에서 5차 회귀식에서 유의하지 않은 계수가 포함되는 것으로 분석되었다. 이는 통계학적으로는 4차 회귀식까지만 고려하여도 무방하다는 것을 의미한다고 할 수 있으나 시간분포 회귀식의 회귀계수에 대한 유의수준은 전문가의 판단에 의해 결정하여 사용하는 것이 필요하다고 사료된다.
5. 결 론
본 연구에서는 현재 실무에서 설계강우량의 시간분포 방법으로 사용하고 있는 Huff의 4분위 방법의 누가우량백분율을 이용하여 시간분포 회귀식을 산정하고 회귀계수에 대한 유의성 검정을 실시하였다. 연구의 결과는 다음과 같다.
1) Huff의 4분위 방법의 시간분포 회귀식의 경우 강우지속기간 백분율이 0% 및 100%일 때 누가우량 백분율의 그래프가 0과 100인 지점을 통과해야 하나 기왕의 보고서들에서 산정한 회귀식의 경우 0과 100의 값을 나타내지 못하는 것을 알 수 있다. 0과 100을 둘 다 만족하는 회귀식의 계수를 산정할 수 없으므로 그래프가 절점이 (0.0)인 지점을 통과하도록 식 절편이 0인 회귀식의 계수를 재 산정하였다.
2)기상청 관할 69개 강우관측소의 Huff의 4분위 방법의 시간분포 회귀식의 유의성 검정결과 대부분의 지점에서 4차식까지의 회귀계수가 유의한 것으로 분석되어 통계학적으로 Huff 방법의 시간분포 회귀식은 4차까지만 고려하여도 무방한 것으로 분석되었다.
3)다만, 실적강우에 대한 무차원 강우 지속기간 백분율-무차원 누가우량 백분율의 비에서 무차원 강우 지속기간이 90%일 때 무차원 누가우량 백분율이 100%를 초과하는 지점이 존재하는 경우에는 최근 강우자료까지 포함된 자료를 이용하여 강우분석을 실시하여야 하며, 그렇지 않을 경우에는 5차 이상의 적정회귀식을 사용하는 것도 무방한 것으로 사료된다.
4)본 연구에서는 절점이 0인 지점만 통과할 수 있는 회귀식을 산정하였으나 추후 연구에서는 신뢰할 수 있는 강우자료를 수집하여 0과 100을 포함할 수 있는 회귀식을 산정하여 시간분포 회귀식의 유의성에 대한 재검정이 필요하다고 사료된다.
















