1. 서 론
2. 회귀분석
2.1 다항 회귀분석
2.2 단조 다항 회귀분석
2.3 성장형 로지스틱 회귀분석
2.4 3차 스플라인 회귀분석
3. 설계강우량 시간분포를 위한 최적 회귀식 산정
3.1 최적 회귀식 산정 방법
3.2 회귀식 검토 결과
4. 결 론
1. 서 론
수공구조물 설계의 핵심 요소 중 하나는 설계강우량의 시간적 분포를 정확히 산정하는 것이다. 이를 위해 먼저 설계빈도와 지속기간에 따른 확률강우량을 산정하고, 지속기간 내 강우량의 시간적 분포를 나타내는 설계우량주상도(design rainfall hyetograph)를 작성해야 한다. 설계우량주상도는 설계 지역의 강우 자료를 바탕으로 강우의 시간분포를 통계적으로 분석하여 지역에 적합한 시간분포 모형을 구축함으로써 수공구조물 설계 조건을 효과적으로 반영할 수 있다(MCT, 2000).
강우의 시간분포를 산정하는 방법으로는 다양한 연구와 기법이 제안되었다. 해외에서는 Keifer and Chu (1957)의 Chicago 방법, 미국토양보존국(SCS, 1972)의 SCS Type 분류 방법, 그리고 Yen and Chow (1977)가 제시한 무차원 1차 및 2차 모멘트를 활용한 삼각형 우량주상도법 등이 있다. 국내에서는 Seo (1965)가 최초로 강우 시간분포 연구를 수행하였고, Park et al. (1981)은 서울 지역을 대상으로 Huff (1967)의 4분위 방법을 이용해 강우의 시간적 분포와 우량주상도를 제시했다. 이후 Yoon et al. (2004)은 유역 특성을 반영한 설계강우량의 시간적 분포 방법을 제안했고, Lee and Chu (2006)가 지속기간별 연 최대 강우를 이용한 연구를 수행했다. Yoon et al. (2012)은 핵밀도함수를 이용한 강우의 시간분포 방안을 제시했으며, 최근 Park and Lee (2022)는 무차원 강우량 시간분포곡선에 대한 회귀식을 제시하며 회귀계수의 유의성 검정의 중요성을 강조했다.
국내 수공구조물 설계시, 홍수량 산정은 과거의 설계홍수량 산정요령(MLTMA, 2012)과 최신 홍수량 산정 표준지침(ME, 2019)에 따라 Huff의 3분위 분포를 채택하고, 일반적으로 6차 다항 회귀식을 적용하여 강우 시간분포를 산정하고 있다. 그러나 설계홍수량 산정요령(MLTMA, 2012)에서는 회귀분석의 차수를 일률적으로 6차식으로 고정하는 방식의 한계를 지적하며, 실제 데이터에 적합한 5~7차식 중 최적의 차수를 선택해야 한다고 언급했다. 특히, 다항 회귀식에서 발생할 수 있는 지속기간의 꼬리 부분 역전현상은 홍수량 산정의 정확성을 저하시킬 수 있으며, 시간 100%에서의 무차원 강우량이 100%를 만족하지 못하는 문제를 해결하기 위한 보정이 필요함을 강조했다. 이는 설계강우량의 시간분포가 설계홍수수문곡선의 형상뿐만 아니라 첨두홍수량의 크기 및 최대저류량을 임계지속기간으로 설정하는 저수지홍수추적시 직접적인 영향을 미치는 중요한 요인이기 때문이다.
따라서 본 연구에서는 기존 다항 회귀식이 가지는 문제점을 개선하고자 단조 다항 회귀분석(monotone polynomial regression), 수정 성장형 로지스틱 회귀분석(modified growing logistic regression) 및 3차 스플라인(cubic spline) 기법을 이용하여 최적의 Huff 시간분포 회귀식을 제시함으로써 수공구조물 설계의 신뢰성을 높이는데 기여할 것으로 기대된다.
2. 회귀분석
2.1 다항 회귀분석
2.1.1 기본 이론
다항 회귀분석은 독립변수와 종속변수 간의 비선형 관계를 설명하는 데 효과적인 기법으로, 단순 선형 회귀로는 적합도가 낮은 복잡한 관계를 모형화할 수 있다. 이를 위해 독립변수의 차수를 늘려 곡선 형태로 데이터를 보다 정확히 설명하며, 적합도를 높이는 데 활용된다. 그러나 차수가 증가함에 따라 모형이 데이터에 과도하게 맞춰지는 과적합(overfitting) 문제가 발생할 수 있으므로, 적절한 차수 선택이 중요하다. 차 다항 회귀식(Eq. (1))은 일반적으로 다음과 같이 정의된다.
2.1.2 회귀식 산정 방법
실무에서 일반적으로 사용되는 6차 다항 회귀식을 채택했으며, 우량주상도를 작성하는 과정에서 강우량 값이 음수가 발생하는 구간은 0으로 처리하여 현실성을 보장했다.
2.2 단조 다항 회귀분석
2.2.1 기본 이론
단조 다항 회귀분석은 독립변수와 종속변수 간의 단조 증가 또는 단조 감소 관계를 모형화는 특화된 회귀 기법으로, Huff 누가강우백분율 곡선과 같은 단조적인 패턴을 가진 데이터에 특히 적합하다. Hawkins (1994)는 단조성 제약이 있는 다항 회귀를 최적화하기 위한 이론적 접근법을 제시했으며, Joshua et al. (2017)은 단조 다항식을 보다 효율적으로 추정할 수 있는 새로운 매개변수화 방법을 개발했다. 데이터를 단조 증가 또는 단조 감소하는 곡선으로 설명하기 위한 단조 다항 회귀분석의 수학적 기법(Eq. (2))은 다음과 같다.
여기서, 는 미분을 통해 계산된 모형의 기울기, 단조 증가의 경우 ≥0 , 단조 감소의 경우 ≤0를 의미한다.
이 방법은 단조성을 유지하면서 최소제곱오차(Residual Sum of Squares, RSS)를 최소화(Eq. (3))하는 최적화 문제로 정의된다. 독립변수 와 종속변수 가 단조적인 관계를 갖는 데이터를 모형화할 때, 단조 다항 회귀는 이러한 특성을 보장하면서도 높은 수준의 적합도를 제공한다.
여기서, 는 실제 관측값, 는 모형이 예측값을 의미한다.
2.2.2 회귀식 산정 방법
Park et al. (2018)은 강우 지속기간이 0%일 때 강우량이 0mm가 되도록 설정하기 위해 절편이 0인 다항 회귀식을 제안했다. 본 연구에서도 이러한 방법을 적용하여 그래프가 (0,0)을 정확히 통과하도록 설정했다.
그리고 지속기간이 100%일 때 누가강우백분율이 100%가 되도록 하기 위해, 지속기간 100% 이후에 강우량이 0 mm인 임의의 지속기간(100.0% 초과)을 추가하는 새로운 방법을 도입했다. 이 과정은 시행착오법(trial and error)을 통해 임의 지속기간 값을 조정하며, 최종적으로 지속기간 100%에서 누가강우백분율이 정확히 100%가 되는 지점을 도출할 수 있도록 했다.
Table 1과 Fig. 1은 상기 방법을 국내 지역빈도 13군집에 적용한 결과를 제시하고 있다. 추가된 임의 지속기간이 커질수록 무차원 누가지속기간 90% 이상 구간에서 회귀곡선의 기울기가 완만해지며, 누가강우백분율 100%에 점차 수렴하는 경향이 나타났다. 그러나 임의 지속기간이 일정 값 이상으로 증가할 경우, 회귀곡선의 기울기 변화가 90% 이상 구간에서 발생하지 않는 대신 0~90% 구간에 기울기 변곡점이 집중되어 일부구간에서 13군집의 누가백분위 값들과의 차이가 커지는 현상이 확인됐다.
Table 1.
Example of cumulative rainfall ratio with added time exceeding 100%(13 cluster Huff 3rd)
2.3 성장형 로지스틱 회귀분석
2.3.1 기본 이론
성장형 로지스틱 회귀는 전형적인 Sigmoid 함수(S-곡선)를 기반으로 하며, 초기에는 느린 성장률을 보이다가 중간 단계에서 급격히 증가하고, 마지막에는 성장이 둔화되는 패턴을 나타낸다. 이러한 특성으로 인해 시간에 따른 변화나 성장 과정을 모형화에 널리 사용된다.
특히, 성장형 로지스틱 회귀는 초기 강우가 천천히 증가하다가 약 50~70%에서 최고점을 지나 감소하는 Huff 3분위 누가강우백분율 곡선과 유사한 형태를 나타낸다. 따라서 Huff 곡선의 회귀식을 추정하는 데 적합한 모형으로 판단된다. 성장형 로지스틱 회귀의 기본식(Eq. (4))은 다음과 같다.
여기서, 는 시간 에서의 예측값(mm), 는 곡선의 최대값, 은 성장률, 는 변곡점(성장률이 최대가 되는 시점)을 의미한다.
2.3.2 회귀식 산정 방법
기본 성장형 로지스틱 회귀분석을 적용한 결과, 모든 군집에서 =0일 때 >0이 되는 문제가 확인됐다. 이를 해결하기 위해 본 연구에서는 =0일 때 =0을 만족하도록 기본식에 상수항을 추가하여 “수정 성장형 로지스틱 회귀식(Eq. (5))”을 제시했다.
또한, 단조 다항 회귀분석에서 사용한 방법과 동일하게 강우량이 0mm인 임의의 지속기간을 지속기간 100% 이후에 추가함으로써 누가강우백분율이 100%를 정확히 만족하도록 회귀계수를 산정했다. 이러한 접근은 성장형 로지스틱 회귀의 경계 조건을 보완하는데 크게 기여했다.
여기서, 는 시간 에서의 누가강우량(mm), 는 최대 성장 한계치, 은 성장률, 는 변곡점, 는 상수항을 의미한다.
2.4 3차 스플라인 회귀분석
2.4.1 기본 이론
3차 스플라인 회귀는 복잡한 비선형적 관계를 근사하기 위해 각 구간에서 3차 다항식을 사용하여 전체적으로 부드럽고 연속적인 곡선을 생성하는 회귀 기법이다. 이 방법은 각 구간에서의 변화를 세밀하게 반영할 수 있어 데이터의 복잡한 패턴 모형화에 효과적이다.
Jeong and Yoon (2023)은 Huff 방법 회귀에서 발생하는 문제, 특히 꼬리 부분의 역전 현상 및 적합도의 제한점을 해결하기 위해 구간별 3차 스플라인 회귀를 적용하는 것이 효과적이라고 주장했다. 이러한 접근은 기존 회귀 방법의 문제점을 근본적으로 해결할 가능성을 제시하지만, 실무 적용성에 있어 누가강우곡선을 단일 회귀식으로 표현하지 못하고 0~10%, 10~20%와 같이 각 구간별로 3차 다항식을 산정후 적용해야 하는 단점이 있다. 3차 스플라인 회귀의 기본식(Eq. (6))과 제약조건은 다음과 같다
여기서, 는 번째 구간의 3차 다항식이며, 스플라인 함수는 구간의 경계에서 연속성과 미분 가능성을 보장하기 위해 다음 조건을 만족해야 한다.
① 함수 값의 연속성 :
② 1차 미분의 연속성 :
③ 2차 미분의 연속성 :
2.4.2 회귀식 산정 방법
3차 스플라인을 이용한 Huff 회귀분석은 10개의 세부 구간(0~10%, 10~20%, 20~30%, 30~40%, 40~50%, 50~60%, 60~70%, 70~80%, 80~90%, 90~100%)에서 독립적으로 3차 다항식을 적용하여 지점 간 연결하고 누가강우백분율을 오차 없이 만족시킬 수 있다.
따라서 단조 다항 회귀분석이나 수정 성장형 로지스틱 회귀분석과 달리 추가적인 보정 과정이 필요없이, 기본식만으로 회귀식을 산정했다.
3. 설계강우량 시간분포를 위한 최적 회귀식 산정
본 연구에서는 ME (2019)에서 제시된 26개 군집별 Huff 3분위의 50% 확률 무차원 누가강우량 백분율을 대상으로 회귀식을 산정하고, 이를 기반으로 설계우량주상도를 도출했다. 그리고 각 회귀분석 방법에 따른 총강우량과 결정계수() 및 평균 절대 비율 오차(Mean Absolute Percentage Error, MAPE)를 비교·검토하여 설계강우량 시간분포를 위한 최적 회귀식을 제시하고자 했다.
3.1 최적 회귀식 산정 방법
회귀식의 최적 회귀계수를 산정하기 위해 초기조건을 설정한 후, 회귀분석 방법별로 최소제곱오차(RSS)를 최소화하는 방식으로 회귀계수를 구했으며, 회귀계수의 유효숫자는 단조 다항식의 경우 소수점 이하 10자리, 성장형 로지스틱 회귀의 경우 소수점 이하 5자리까지 산정했다.
회귀식의 적용성을 평가하기 위해 초기 조건 중 ①번 조건을 강우 지속기간 60~1,440 min, 설계강우량 100~500 mm 등으로 변경하고, 산정한 회귀식으로 강우분포시 기 설정한 ②번과 ③번 조건이 만족하는지 확인 후 최종적으로 회귀계수를 결정했다.
다음은 본 연구에서 설정한 초기조건이며, 회귀식 산정절차는 Fig. 2에 도식화했다.
[기본조건]
① 강우 지속기간 및 설계강우량
- 강우 지속기간 1,000 min, 설계강우량 1,000 mm, 시간간격() 10 min
② 누가강우량 조건
- =0min 일 때, 누가강우량 P(0)=0 mm
- =1,000min 일 때, 누가강우량 P(1,000)=1,000 mm
③ 강우분포 안정 조건
- 총강우량 1,000 mm 만족, 누가강우곡선의 역전현상 미발생
3.2 회귀식 검토 결과
본 연구에서 산정된 회귀 방법별 회귀계수는 Table 2와 Table 3에 제시goT으며, 각 회귀 방법으로 도출된 우량 주상도의 결과는 Figs. 3, 4, 5에 나타냈다. 특히, 3차 스플라인 회귀분석의 경우 단일 회귀식으로 표현이 불가능하므로 회귀계수 대신 우량 주상도만을 제시했다.
Table 2.
Results of regression coefficients for monotone polynomial regression
Table 3.
Results of regression coefficients for modified growing logistic regression
Figs. 3, 4, 5를 보면 6차 다항식은 강우 초기 구간에서 음수가 발생하고 강우 말기에는 역전현상이 관찰되는 문제가 관찰됐으나, Huff 3분위 구간별 백분율 첨두치와의 차이는 3차 스플라인을 제외하고 가장 작은 것으로 검토됐다. 단조 6차 다항식은 회귀식 산정시 설정한 기본조건 3가지를 모두 만족하지만, 백분율 첨두치 차이는 상대적으로 크게 나타났다. 수정 성장형 로지스틱 회귀식은 가장 이상적인 우량주상도 형상을 보여주며 기본조건 3가지를 모두 만족했지만, 일부 군집에서 첨두 발생 구간이 앞당겨지는 현상이 관찰됐다.
마지막으로 3차 스플라인은 역시 기본조건 3가지를 모두 충족하고 구간별 강우백분율 값을 완벽하게 재현했지만, 강우 종료 지점인 누가강우백분율 90%~100% 구간에서 강우량이 0 mm로 수렴하지 않고 강우가 종료되는 것으로 나타났다.
총강우량 산정 결과는 Table 4에 제시되어 있으며, 6차 다항식을 제외한 모든 회귀 방법이 총강우량 1,000mm로 설정한 기본조건을 만족하는 것으로 나타났다. 회귀분석의 정확도 평가는 결정계수()와 평균 절대 비율 오차(MAPE)를 기준으로 이루어졌다(Tables 5 and 6). MAPE는 평균 절대 오차를 백분율로 변환하여 스케일 의존적 에러 문제를 보완한 지표로, 값이 낮을수록 우수한 회귀 성능을 의미한다.
Table 4.
Total rainfall result by regressions
Table 5.
Evaluation of regression model accuracy ()
Table 6.
Evaluation of Regression Model Accuracy (MAPE)
모든 회귀 방법에서 결정계수는 99.0% 이상의 높은 수준을 기록했으며, 이는 본 연구에서 이용한 회귀 모형이 Huff 누가강우백분율을 잘 반영하고 있음을 보여준다. MAPE는 군집 및 회귀 방법에 따라 차이를 보였으며, 6차 다항식은 3차 스플라인을 제외하고 가장 낮은 MAPE를 기록하며 높은 예측 정확도를 보였다. 3차 스플라인의 경우 모든 군집에서 결정계수가 100%, MAPE가 0.00%로 평가되어 통계적으로 완벽한 결과를 나타냈다.
4. 결 론
본 연구에서는 기존 다항 회귀식을 이용하여 설계강우량 시간분포를 하게 되면 강우 역전현상이 발생하고, 지속기간 100% 시점에서 무차원 누가강우량이 100%를 만족하지 못하는 문제점이 존재함을 확인했다. 이를 해결하기 위해 단조 다항 회귀분석, 수정 성장형 로지스틱 회귀분석 및 3차 스플라인 회귀분석을 이용했으며, 단조 다항 회귀분석과 수정 성장형 로지스틱 회귀분석의 경우 추가적으로 지속기간 100% 이후 강우량이 0 mm인 구간(>100%)을 추가하는 새로운 접근법을 도입했다.
각 방법별로 Huff 누가강우백분율의 회귀식을 산정하고 우량주상도로 도시화했으며, 이후 지속기간 100%에서 주어진 설계강우량을 만족하는지 검토한 결과는 다음과 같다.
(1) 다항 회귀분석의 우량주상도는 강우 초기에 음수가 발생하고 말기에는 역전현상이 발생하는 문제를 보였다. 또한, 설계강우량을 시간분포한 결과 총 강우량이 100%를 만족하지 못하고 초과하거나 미달하는 것으로 나타났다. 이는 모형의 신뢰성과 적용성에 문제가 있음을 시사하기 때문에 실무에서 다항 회귀식을 사용하는 것은 부적합하다고 판단된다.
(2) 단조 다항 회귀분석은 설계강우량을 시간분포한 결과 총 강우량이 100%를 만족했으며, 결정계수는 평균 99.87 %, MAPE는 평균 9.69%로 우수한 통계적 성능을 나타냈다. 그리고 실무 측면에서 볼 때 기존 다항식의 계수를 본 연구에서 제시한 계수로 대체하기만 하면 되므로, 실무 적용성이 가장 좋은 방법으로 판단된다.
(3) 수정 성장형 로지스틱 회귀분석의 우량주상도는 최대 강우량 발생지점을 기준으로 강우 상승부와 감수부가 뚜렷하고 역전현상이 없는 가장 이상적인 형태를 나타냈다. 통계량 측면에서 MAPE는 평균 13.93%로 상대적으로 낮지만 결정계수는 평균 99.72%로 우수한 결과를 보여주었으며, 필요한 계수의 수가 적어 Park and Lee (2022)가 제시한 “통계 모델링 간결성 원리(Principle of Modeling Parsimony)”에 가장 잘 부합하는 방법으로 평가됐다.
(4) 3차 스플라인은 기존 다항식의 문제점 없이 통계적으로 완벽한 결과(=100.0%, MAPE=0.00%)를 도출했지만, 각 구간별로 개별 회귀식이 필요하기 때문에 실무 적용시 복잡성이 증가할 것으로 예상된다.
상기 결과를 종합하면 단조 다항 회귀분석은 우수한 통계적 평가 결과와 함께 높은 실무 적합성을 보였다. 이는 특히 강우 시간분포의 형태가 자연스러운 형태로 나타나며, 실무에서 요구하는 정확한 예측을 가능하게 했다. 수정 성장형 로지스틱 회귀분석은 모형의 간결성을 유지하면서도 이상적인 우량주상도를 제공했다. 이 방법은 설계강우량을 시간분포로 변환하는 데 있어 간결하고 효과적인 접근법을 제시하며, 실용성 측면에서도 유리한 결과를 도출했다. 한편, 강우량이 0 mm인 무차원누가지속기간(100.0% 초과)을 추가하는 접근방법은 시행착오법을 통해 지속기간이 100%일 때 누가강우백분율이 정확히 100%가 되는 지점을 찾아야 하는 어려움과 회귀계수의 유효숫자 범위 및 최소제곱오차와 같은 최적화 방법에 따라 회귀식 결과가 달라질 수 있다는 한계점을 가지고 있다. 그리고 3차 스플라인 회귀분석은 통계적으로 가장 완벽한 결과를 제시하며, 다른 방법들과 비교했을 때 오차가 가장 적었고 강우의 시간분포를 매우 정확하게 반영할 수 있었다.
따라서 본 연구에서 제시한 회귀식들을 활용한다면 기존 다항 회귀식의 한계를 극복하고, 이상적인 우량주상도를 도출할 수 있을 것이다. 이는 회귀식의 정확성이 향상됨에 따라 설계강우량의 시간분포에 대한 예측 정확도가 높아져 수공구조물 설계의 신뢰성을 높이는 데 기여할 것으로 기대된다. 향후 본 연구에서 제시한 회귀식과 기존 다항 회귀식을 적용하여 하천 및 댐과 같은 수공구조물의 임계지속기간을 고려한 홍수량 비교·검토 등의 연구가 수행된다면, 최적의 설계강우량 시간분포 회귀식을 도출할 수 있을 것으로 판단된다.