Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique

Hyoseob Noh; GeunSoo Son; Dongsu Kim; Yong Sung Park

doi:10.3741/JKWRA.2022.55.1.43

Preview

Research Article

Journal of Korea Water Resources Association. 31 January 2022. 43-57
https://doi.org/10.3741/JKWRA.2022.55.1.43

Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique

한국 하천의 지역별 유사특성의 군집화와 H-ADCP 기반 부유사 농도 관측 기법에의 활용 방안

Hyoseob Noh^a

GeunSoo Son^b

Dongsu Kim^c

Yong Sung Park^d^e^*

노 효섭^a

손 근수^b

김 동수^c

박 용성^d^e^*

^aPh.D Student, Department of Civil and Environmental Engineering, Seoul National University, Seoul, Korea

^bAssociate Researcher, Advanced Infra Division, Korea Institute of Hydrological Survey, Goyang, Korea

^cAssociate Professor, Department of Civil and Environmental Engineering, Dankook University, Yongin, Korea

^dAssociate Professor, Department of Civil and Environmental Engineering, Seoul National University, Seoul, Korea

^eAdjunct Researcher, Institute of Civil and Environmental Engineering, Seoul National University, Seoul, Korea

^a서울대학교 건설환경공학부 박사과정

^b한국수자원조사기술원 첨단인프라실 전임연구원

^c단국대학교 토목환경공학과 부교수

^d서울대학교 건설환경공학부 부교수

^e서울대학교 건설환경종합연구소 겸임연구원

^{*Corresponding Author}

ABSTRACT

Advances in measurement techniques have reduced measurement costs and enhanced safety resulting in less uncertainty. For example, an acoustic doppler current profiler (ADCP) based suspended sediment concentration (SSC) measurement technique is being accepted as an alternative to the conventional data collection method. In Korean rivers, horizontal ADCPs (H-ADCPs) are mounted on the automatic discharge monitoring stations, where SSC can be measured using the backscatter of ADCPs. However, automatic discharge monitoring stations and sediment monitoring stations do not always coincide which hinders the application of the new techniques that are not feasible to some stations. This work presents and analyzes H-ADCP-SSC models for 9 discharge monitoring stations in Korean rivers. In application of the Gaussian mixture model (GMM) to sediment-related variables (catchment area, particle size distributions of suspended sediment and bed material, water discharge-sediment discharge curves) from 44 sediment monitoring stations, it is revealed that those characteristics can distinguish sediment monitoring stations regionally. Linking the two results, we propose a protocol determining the H-ADCP-SSC model where no H-ADCP-SSC model is available.

Keywords

Clustering

H-ADCP

Suspended sediment concentration

유사량 계측 기술의 발달로 초음파 도플러 유속계(ADCP)의 산란도가 부유사 농도와 관계가 있다는 특성을 이용해 부유사의 농도를 짧은 시간 간격으로 계측하여 부유사 관측의 비용과 위험 문제를 극복하고자 하는 노력이 지속되고 있다. 국내에는 자동 유량 관측소에 횡방향 ADCP (H-ADCP)가 설치되어 있어 실시간으로 부유사 농도를 계측하는 기술의 적용이 가능하지만 자동 유량 관측소와 부유사 관측소의 위치가 항상 일치하지는 않아 모든 관측소에서의 모형 개발은 불가한 실정이다. 본 연구에서는 이러한 문제를 극복하기 위해 H-ADCP가 설치된 유사량 관측소 9개소에 대해 부유사 농도를 계측하는 H-ADCP-SSC 관계식을 개발하고 그 결과의 적용성에 대해 고찰하였다. 그리고 부유사 관측소별로 나타나는 특징에 대해 알아보기 위해 한국 하천의 부유사 관측소 44개소의 유역면적, 부유사와 하상토의 입도분포, 유량-유사량 관계식 등의 유사특성 자료를 이용해 비지도 기계학습 기법인 가우시안 혼합 모형(GMM)으로 군집분석을 수행하였다. 군집화 결과, 유사량 관측소를 공간적으로 구분해낼 수 있었으며, 특히 하천의 본류와 지류의 유사 특징을 구분해낼 수 있었다. 결과적으로, H-ADCP-SSC 관계식과 부유사 관측소의 군집분석 결과를 종합해 H-ADCP-SSC 관계식이 개발되지 않은 자동 유량 관측소에서 관계식을 적용하는 부유사 농도를 실시간으로 계측할 수 있도록 하는 프로토콜을 제안하였다.

키워드

군집화

H-ADCP

부유사 농도 계측

MAIN

1. 서 론
2. H-ADCP 이용 부유사 농도 계측
2.1 ADCP 초음파산란도를 이용한 부유사 농도 계측 방법론
2.2 H-ADCP-SSC 관계식 개발 결과
3. GMM 기반 부유사 관측소 공간분류
3.1 가우시안 혼합 모형
3.2 GMM의 최적 모형 결정 방법
3.3 군집화 대상자료
3.4 유사량 관측소 공간 분류
4. 군집화 결과를 이용한 H-ADCP-SSC 관계식의 확장 적용 방안
5. 결 론

1. 서 론

자연하천에서의 부유사 관측은 하천의 수질과 총유사량 산정의 주된 매개변수로서 매우 중요하다. 일반적으로 부유사량 관측은 채취된 부유사 시료를 분석함으로써 수행된다. 그러나 부유사를 채취하고 채취한 시료를 분석하는 재래식 방법의 비용이 많이 들며, 홍수기와같이 고유량일 때에는 부유사의 직접 채취가 매우 위험해 유사량 실측값의 빈도를 늘리는 데에는 한계가 따른다. ME (2019)에 따르면 2019년 기준으로 한국수자원조사기술원에서는 국내 하천에 위치한 44개소의 유사량 관측소가 운영되고 있으나, 비용 등의 문제로 인해 1년 동안 주기적으로 유사량을 계측 데에는 한계가 있는 실정이다.

유체 내 부유물과 음향신호의 상호작용에 대한 Urick (1948)의 연구 이래로 재래식 유사량 계측 방법의 한계를 극복하기 위해 초음파 도플러 유속계(ADCP)의 후방 산란도(backscatter)가 부유사 농도와 관계가 있다는 특성을 이용해 부유사의 농도를 계측하여 부유사 계측의 시공간적 제약을 극복하고자 하는 노력이 국내외로 지속되고 있다(Wall et al., 2006; Topping et al., 2006, 2007; Moore et al., 2012; Guerrero et al., 2013; Wright et al., 2010; Venditti et al., 2016; Seo et al., 2016; Son et al., 2020, 2021). 한편, 국내 하천에는 유량 관측을 위해 62개소의 자동 유량 관측소가 운영되고 있는데, 이 중 상당수의 관측소에는 횡방향 도플러 유속계(Horizontal-Acoustic Doppler current profiler, H-ADCP)가 설치되어 있다(ME, 2019). 자동 유량 관측소의 H-ADCP는 10분 단위로 유량 자료를 제공하기 때문에 H-ADCP를 부유사 농도 계측에 활용한다면 ADCP가 수면 아래에 잠겨있는 한 기존 재래식 채집법에 대비 대폭 적은 제약으로 양질의 부유사량을 계측할 수 있다는 장점이 있다. 최근에는 이러한 특성을 이용해 국내에서도 Seo et al. (2016)과 Son et al. (2020)이 H-ADCP를 이용한 실시간 부유사 계측 모형을 제안한 바 있다.

ADCP를 이용한 부유사 농도 SSC (suspended sediment concentration)의 계측에는 ADCP의 음파 신호가 수중의 부유사 입자로 인해 산란된 강도를 이용한다. 일반적으로 SSC는 유사 보정된 산란강도 SCB (sediment corrected backscatter)를 이용해 다음 식과 같은 관계식을 통해 산정된다(Landers et al., 2016).

(1)

\log_{10} S S C = C_{1} \times S C B + C_{2}

이때 부유사의 입도와 같은 유사 조건이 현장마다 다르기 때문에 보정된 회귀식(Eq. (1))의 계수 C₁, C₂ 또한 관측소마다 다르게 나타난다. 따라서 ADCP 신호의 산란강도와 부유사 농도 간의 관계식 개발 시 필수적으로 관측소별로 현장 채집을 통해 회귀식의 보정을 수행하여야 한다. 한편, Fig. 1은 국내 유사량 관측소와 2021년 기준 자동 유량 관측소의 위치를 각각 지도 위에 도시한 것으로 2019년 현재 자동 유량 관측소 62개소 중 유사량 실측이 함께 수행되는 지점은 18개소에 불과하다. H-ADCP를 이용해 부유사 농도를 계측하기 위해서는 실측값에 기초한 모형의 개발이 필요한데 자동 유량 관측소와 부유사 관측소의 공간적 괴리로 인해 모든 관측소에서 H-ADCP 기반의 부유사 계측법을 적용하기에는 한계가 있다.

위에서 언급한 문제들을 극복하고자 본 연구에서는 크게 세 단계의 분석을 수행하였다. 우선, 9개소의 관측소에서 확보된 자료를 대상으로 H-ADCP-SSC 모형을 개발하고 그 결과에 대해 고찰하였다. 다음으로, 통계적으로 유사특성에 있어 동질성을 가지는 관측소들을 구분해내기 위해 44개의 국내 부유사 관측소에 대해 가우시안 혼합 모형(Gaussian mixture model, GMM)을 적용해 관측소별로 군집화하였다. 그리고 각 유사량 관측소의 군집이 어떠한 특성을 지니는지에 대해 토의하였다. 부유사 농도의 산정식이 해당 지역의 유사특성에 좌우된다면 유사특성이 비슷한 두 지점에서는 SSC-SCB의 계수 C₁과 C₂가 크게 다르게 나타나지 않을 것으로 가정할 수 있다. 그러면 SSC-SCB 관계식이 보정되지 않은 지역에서는 SSC-SCB 관계식이 구축된 관측소 중 유사특성이 비슷한 관측소의 관계식을 참조할 수 있게 된다. 이 가정에 의거해 이 연구는 부유사 미계측 지점에서도 H-ADCP를 이용한 부유사 계측을 가능하게 하여 유사량 계측의 시-공간적 간극을 줄이는 방법을 제안한다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F1.jpg

Fig. 1.

Spatial view of the sediment monitoring stations and H-ADCP based automatic discharge monitoring stations

2. H-ADCP 이용 부유사 농도 계측

2.1 ADCP 초음파산란도를 이용한 부유사 농도 계측 방법론

ADCP가 변환기를 통해 음향 신호를 발사하면 수신기에서는 측정된 초음파 신호 reverberation level (RL) 만큼의 신호를 수신하게 된다. 이 값은 변환기(transducer)에서 발사된 초음파 신호 SL source level (SL)에서 신호가 매질에서 전파되는 동안 음파 확산, 유체, 점성, 산란 감쇠 등의 에너지 감쇠 요인들로 인해 신호가 손실되는 정도인 전송 손실(transmission loss, TL) 값을 발사되고 반사되어 돌아오는 동안 각각 빼준 뒤 초음파의 진행 경로 내 입자들에 의해 반향되는 정도인 표적 강도(target strength, TS)를 더해줌으로써 얻을 수 있다. 여기서, TS는 산란되는 입자의 직경과 파장의 비율에 지배된다고 알려져 있다(Haught et al., 2017). RL은 측정된 후방 산란(measured backscatter, MB)로도 표시되며, 측정된 RL은 Urick (1975)에 의해 단순화된 소나방정식을 통해 데시벨(dB) 단위의 대수 관계로서 계산될 수 있다(Eq. (2)).

(2)

R L = S L - 2 T L + T S

이 식에서 우항의 두 번째 항 2TL은 양방향 전송 손실(two-way transmission loss)라고로 불리우며, 유체와 유사에 의 한 감쇠를 각각 고려하는 것이 바람직하다. 유체와 유사에 의한 흡수를 고려했을 때 2TL은 다음 식과 같이 계산될 수 있다.

(3)

2 T L = 20 \log_{10} (ψ r) + 2 r (α_{w} + α_{s})

여기서, $ψ$ 는 초기 영역(near field)에 대한 보정 계수; r은 ADCP의 변환기와 측정된 위치의 거리; $α_{w}$ 와 $α_{s}$ 는 각각 물과 유사에 의한 흡수로 인한 감쇠 계수이다. Eq. (3)의 우변의 첫 번째 항은 초음파의 확산을 표현한 항이다. 일반적으로, 초음파의 확산 형태는 변환기로부터 구형(spherical)으로 퍼져나가는 것을 가정한다. 그러나 변환기로부터 가까운 초기 영역에서는 초음파가 불규칙적으로 발사되기 때문에 $ψ$ 를 통해 보정해주어야 한다. Downing et al. (1995)는 음파의 파장 $λ$ 와 초음파 센서의 반지름 a_t로 무차원화된 거리 값인 z를 이용해 다음과 같은 보정계수 계산식을 제안했다.

(4)

ψ = \frac{1 + 1.35 z + {(2.5 z)}^{3.2}}{1.35 z + {(2.5 z)}^{3.2}}, where z = \frac{r λ}{π a_{t}^{2}}

이때, 음파의 파장 $λ$ 는 수체 내에서의 파속과 초음파 신호 주파수로부터 역산될 수 있다. 여기에서 음파의 파속 c는 섭씨 수온 T의 함수로 표현되는 다음 식으로 계산할 수 있다.

(5)

c = 1.402385 \times 10^{3} + 5.038813 T - 5.799136 \times 10^{- 2} T^{2} + 3.287156 \times 10^{- 4} T^{3} - 1.398845 \times 10^{- 6} T^{4} + 2.787860 \times 10^{- 9} T^{5}

수체를 매질로 하여금 전파되는 음파는 파동이 진행됨에 따라 점차적으로 반사되는 에너지가 감소된다. 물의 음파 흡수로 인한 에너지 감쇠를 모델링하기 위해 도입되는 감쇠 계수 $α_{w}$ 는 이온, 염도, 온도, 점성, 대기압 등에 영향을 받는다고 알려져 있으며, Schulkin and Marsh (1962)는 앞의 요인들을 고려한 $α_{w}$ 의 대수식을 제안했다. 하천수는 바닷물에 비해 이온, 염도의 영향이 매우 적으므로, 물의 점성만을 고려할 수 있다. 대기압 조건 하에서 수온 변화에 따른 점성 변화만을 고려했을 때 Schulkin and Marsh (1962)의 식은 다음 식과 같이 정리된다.

(6)

α_{w} = 8.69 \frac{3.38 \times 10^{- 6} \times f^{2}}{21.9 \times 10^{6 - 1520 / (T + 273)}}

본 연구에서는 하천 자동 유량 측정소에 설치된 H-ADCP를 대상으로 하기 때문에 이온과 염도에 대한 영향을 무시한 식인 Eq. (6)를 이용해 물로 인한 감쇠 계수를 보정하였다.

유사로 인한 감쇠는 크게 매우 작은 입자의 경계에서 발생하는 전단력으로 인한 점성 효과와 큰 입자로 인한 산란 손실로 인해 발생한다. 점성 효과는 입자의 표면적에 비례하기 때문에 특정 부유사 농도에서는 입자의 크기가 작을 때 더욱 크게 나타난다. 반 면, 산란 효과는 입자 표면적보다는 입자의 직경과 더욱 큰 관계를 가진다. 입자의 직경이 d_s일 때 음파의 파장 $λ$ 가 입자의 원주 $π d_{s}$ 보다 매우 큰 경우에는 산란의 방향이 뒤를 향해 산란 손실이 커지고, 원주와 비슷해지면 산란의 경향이 매우 복잡해지고 음파의 주파수에 따라서 많이 바뀐다고 알려져 있다(Urick, 1948; Flammer, 1962). 두 관점을 모두 고려해 Landers (2012)와 Landers et al. (2016)은 Urick (1948)과 Sheng and Hay (1988)의 이론을 재고한 hybrid Urick-Sheng-Hay 식을 제안했다. 그러나 해당 식은 감쇠 계수의 산정을 위해 유사의 비중, 유사 농도, 그리고 유사의 입도를 필요로 한다. 한 편 Topping et al. (2006, 2007)은 음파의 진행경로 내에서 부유사 농도와 부유사의 입도분포가 균일할 때 $α_{s}$ 가 $α_{w}$ 로부터 산정 가능함을 보였다. 음파의 진행경로 내에 후방 산란강도의 변화가 없는 경우 물 보정 후방 산란강도(water corrected backscatter, WCB)와 SCB의 관계식인 Eq. (7)로부터 Eq. (8)와 같은 식을 얻을 수 있으며, 결과적으로 Eq. (9)을 이용해 직접적으로 $α_{s}$ 를 계산해낼 수 있다(Landers et al., 2016).

(7)

S C B = W C B + 2 r α_{s} = M B + 20 \log_{10} (ψ r) + 2 r α_{w} + 2 r α_{s}

(8)

\frac{d}{d r} (S C B) = \frac{d}{d r} (W C B + 2 r α_{s}) = 0

(9)

α_{s} = - \frac{1}{2} \frac{d}{d r} (W C B)

자동 유량 관측소에 설치된 H-ADCP는 보통 부유사특성을 함께 관측하지 않는 바, $α_{s}$ 의 계산에 있어 Topping et al. (2006, 2007)의 접근법을 적용하였다.

위 과정의 Eqs. (4)~(9)을 이용하면 최종적으로 SCB를 구할 수 있게 된다. 실측 샘플의 SSC와 SCB를 구하게 되면 Eq. (1)에서 추정된 SSC와 실측 SSC의 오차를 최소화 하도록 SSC를 산정하는 관계식의 계수 C₁와 C₂를 보정하면 최종적으로 SCB를 산정하는 관계식을 구할 수 있다.

2.2 H-ADCP-SSC 관계식 개발 결과

앞선 절에서 서술된 내용에 따라 유사량 관측소의 실측 부유사 농도를 이용해 H-ADCP-SSC의 관계식을 유도하였다. 여기서 관계식의 계수 C₁과 C₂는 2.1절의 과정을 통해 H-ADCP의 원시자료로부터 계산한 SCB 값과 참값인 실측 부유사 농도로 하여금 선형회귀 분석을 수행하여 계산하였다. 선형회귀 분석을 통해 유도된 관계식의 유도 조건(이용된 자료와 H-ADCP 주파수), 관계식의 계수(C₁과 C₂), 그리고 개발된 관계식의 결정계수 R²를 Table 1에 각각 정리하였다.

Table 1.

Derived H-ADCP-SSC equation coefficients and predictability

Station name	Catchment	Data year	H-ADCP signal frequency (kHz)	C₁	C₂	R²
Gyenae-ri	Nakdong River	2018	300	0.0771	-6.0976	0.86
Gumi Bridge	Nakdong River	2019	300	0.0759	-6.1559	0.94
Hoguk Bridge	Nakdong River	2018	300	0.0822	-6.6040	0.62
Jijeong Bridge	Seom River	2019	300	0.0538	-4.1514	0.84
Naju Bridge	Yeongsan River	2019	300	0.0331	-1.6931	0.8
Naju Bridge	Yeongsan River	2017	300	0.0350	-1.7520	0.93
Geukrak Bridge	Yeongsan River	2018	1,200	0.0599	-3.7040	0.64
Nampyeong Bridge	Jiseok Creek	2019	600	0.0405	-2.5729	0.86
Namhangang Bridge	Han River	2018	300	0.0320	-1.2236	0.59
Ipo Weir upstream	Han River	2019	300	0.0360	-1.6620	0.47

여기에서, 총 9개의 관측소에 대해 관계식이 유도되었으며, 나주대교 관측소는 2017년과 2019년 각각 유도된 계수를 함께 정리하였다. 피어슨의 상관계수 절대값을 기준으로 회귀모형의 성능을 해석할 때 상관계수의 절대값이 0.7보다 높으면 회귀식이 대상 자료와 강한 상관관계를 가진다고 말할 수 있다(Asuero et al., 2006; Schober et al., 2018). H-ADCP-SSC 관계식(Eq. (1))과 같이 선형 최소자승법 문제에서는 결정계수 R²가 피어슨의 상관계수의 제곱과 같아지므로(Asuero et al., 2006), R² > 0.49(= 0.7²)인 경우 회귀식이 현상을 설명하는 데에 있어 합리적이라고 판단할 수 있다. 이 기준을 적용했을 때, R²가 0.47로 나타난 이포보 상류 관측소를 제외하고 나머지 8개 관측소에서 유도된 모형들은 R² > 0.5로 합리적으로 이용할 수 있을 것으로 기대된다.

분석의 편의를 위해 유도된 H-ADCP-SSC 관계식의 계수를 산점도에 해당되는 하천을 각기 다른 표식으로 구분하여 Fig. 2에 산점도로 도시화 하였다. 이때, H-ADCP 신호의 주파수가 다른 경우에는 다른 모양의 마커를 사용했다. 동그라미로 표현된 관측소들인 300 kHz의 H-ADCP가 설치된 곳들은 같은 하천의 경우에는 비슷한 계수 값을 가지는 관계식이 유도되는 것으로 나타났으며, 이는 본 연구의 가정을 뒷받침하는 결과이다. 그러나 남한강의 지류인 섬강은 한강 본류 관측소 2개소와는 다소 계수가 다르게 나타났다. 주목할만한 점은 관계식들이 결정계수 0.98의 정확도로 Eq. (10)의 관계를 가진다는 것이다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F2.jpg

Fig. 2.

Scatter plot of H-ADCP-SSC equation coefficients

(10)

C_{2} = - 103.678 C_{1} + 1.8862

영산강 본류에 위치한 나주대교 관측소에서 2017년과 2019년의 자료를 이용해 각각 유도된 H-ADCP-SSC 관계식의 계수는 시기가 다름에도 각각 오차율이 10% 미만으로 나타났다. 이는 각각 한강이나 낙동강에서 인접한 관측소 간에 나타나는 계수 차이보다 적은 결과이다.

영산강의 본류와 지류인 지석천에 위치한 관측소에서는 다른 주파수의 H-ADCP를 사용하는 관측소들이 있는데, 이런 경우에는 본류 하천이 같더라도 다른 계수 값을 가지는 것으로 드러났다. 600 kHz의 남평교 관측소가 같은 하천 권역인 나주대교 관측소의 평균보다 C₁이 0.006 이상 크고, C₂는 0.850 가량 작았다. 영산강 권역의 극락교 관측소는 1,200 kHz의 H-ADCP를 운용 중인데, 이 경우에는 C₁의 증가량과 C₂의 감소량이 각각 0.026과 1.981로 더욱 큰 변동값이 나타났다. 한강과 낙동강 관측소가 비슷한 계수 값을 가지고 있음을 감안하고 극락교와 남평교의 C₁, C₂를 300 kHz의 H-ADCP를 이용해 유도했을 때 H-ADCP-SSC 관계식의 계수가 나주대교의 값에 근사된다고 가정하면 C₁, C₂는 H-ADCP의 주파수와 각각 양과 음의 관계를 가질 것으로 추정된다.

3. GMM 기반 부유사 관측소 공간분류

3.1 가우시안 혼합 모형

GMM은 자료가 주어졌을 때 자료의 확률밀도함수가 여러개의 다변량 가우스 분포 $N (x | μ, Σ)$ 가 혼합된 구조로 구성되었다고 가정하는 비지도 기계학습 방법이다.

(11)

N (x | μ, Σ) = \frac{1}{{(2 π)}^{D / 2}} \frac{1}{{|Σ|}^{1 / 2}} \exp (- \frac{1}{2} {(x - μ)}^{T} Σ^{- 1} (x - μ))

여기서, x는 임의의 입력 자료 포인트; $μ$ 는 평균 행렬; $Σ$ 는 공분산 행렬이다. 자료가 K개의 가우스 분포로 구성되어 있다는 특성을 이용했을 때 각 가우스 분포에서 특정 자료 포인트의 확률을 구하고 자료 포인트별로 가장 큰 확률을 가지는 가우스 분포로 모든 자료를 인덱싱할 수 있다. 즉, GMM을 구성하는 K개의 가우스 분포들의 확률을 이용하면 전체 자료를 K개의 군집으로 구분해낼 수 있다. K개의 가우스 분포로 구성된 GMM의 확률 밀도함수는 Eq. (12)으로 표현될 수 있다.

(12)

p (x) = \sum_{k = 1}^{K} τ_{k} N (x | μ_{k}, Σ_{k})

여기서, $τ_{k}$ 는 k번째 패턴의 가우스 분포가 전체 확률밀도에 기여하는 가중치; $μ_{k}$ 와 $Σ_{k}$ 는 각각 k번째 패턴의 가우스 분포가 가지는 평균과 공분산 행렬이다.

Fig. 3는 3개의 가우스 분포로 난수를 발생시킨 자료 포인트를 K = 3인 GMM으로 학습시킨 결과를 예시로 그린 것이다. 각 색깔별로 그려진 실선, 파선, 점선 타원들은 각각 가우스 분포의 공분산 행렬에서 표준편차가 1배, 2배, 3배가 되는 타원이다. 이 그림에서 각 색깔로 표현된 가우스 분포들에 소속되는 자료 포인트는 같은 색으로 표시하였다. 일반적으로, GMM은 최우도 방법이 바탕이 되는 학습 방법인 기대 최대화(Expectation Maximization, EM) 알고리듬(Dempster et al., 1977)을 이용해 학습된다. EM 알고리듬은 자료 포인트가 패턴에 소속되는 정도 $γ (z_{k})$ 를 계산하는 E-단계와 각 가우스 분포의 매개변수인 $μ, Σ, τ$ 를 계산하는 M-단계를 구한 후 로그 우도 값이 수렴할 때까지 반복한다. 상술한 네 개의 변수는 Eqs. (13)~(17)을 이용하면 구할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F3.jpg

Fig. 3.

Example of a mixture model of three Gaussian distributions

(13)

λ (z_{k}) \equiv p (z_{k} = 1 | x) = \frac{p (z_{k} = 1) p (x | z_{k} = 1)}{\sum_{j = 1}^{K} p (z_{j} = 1) p (x | z_{j} = 1)} = \frac{τ_{k} N (x | μ_{k}, Σ_{k})}{\sum_{j = 1}^{K} τ_{j} N (x | μ_{j}, Σ_{j})}

(14)

μ_{k} = \frac{1}{N_{k}} \sum_{n = 1}^{N} λ (z_{n k}) x_{n}

(15)

N_{k} = \sum_{n = 1}^{N} λ (z_{n k})

(16)

Σ_{k} = \frac{1}{N_{k}} \sum_{n = 1}^{N} λ (z_{n k}) (x_{n} - μ_{k}) {(x_{n} - μ_{k})}^{T}

(17)

τ_{k} = \frac{N_{k}}{N}

GMM을 EM 알고리듬을 이용해 학습시키는 방법은 Bishop (2006)에 의해 자세히 유도되어 있다.

3.2 GMM의 최적 모형 결정 방법

부유사 관측소의 군집화 기법으로 이용된 GMM은 초기화에 따라서 다른 수렴 결과가 나타나기 때문에 학습 결과의 성능이 매 실행마다 다르다. 또한 군집 개수 K를 사용자가 지정해주어야 한다는 특징이 있어 적당한 기준을 바탕으로 최적의 학습 결과를 결정해야 한다. 기본적으로 로그 우도 LL을 바탕으로 하는 GMM의 경우에는 LL이 높을수록 적합도가 높은 것으로 간주된다. 한 편, K가 증가함에 따라 매개변수가 많아져 LL이 높아질 수도 있지만 모형이 복잡해지는 과적합 상황은 바람직하지 않다. 과소적합과 과적합이 아닌 최적 모형을 찾기 위한 방법으로 매개변수 개수에 대해 패널티를 부여한 모형 성능 척도인 Akaike (1974)의 아카이케 정보 기준(Akaike information criterion, AIC)과 여기에 표본의 크기 N을 추가로 반영한 Schwarz (1978)의 베이지안 정보 기준(Bayesian information criterion, BIC)을 이용할 수 있다. AIC와 BIC는 모두 값이 작을수록 적합도가 높은 모형으로 판단하며, 두 식은 매개변수의 개수가 N_p개일 때 Eqs. (18) and (19)로 정의된다.

(18)

A I C = - 2 L L + 2 N_{p}

(19)

B I C = - 2 L L + N_{p} \log N

본 연구에서는 사용변수의 조합마다 최적의 GMM 학습 결과를 판단하기 위해 K를 2개부터 20개까지 증가시키면서 모든 군집 수 K에 대해서 400번씩 반복적으로 학습시켜 AIC와 BIC의 합을 최소화 하는 학습 결과를 최종 군집화 결과로서 이용했다. Fig. 4은 K를 늘려가며 가장 낮은 AIC와 BIC를 바탕으로 그래프를 그린 예시이다. 이 예시에서는 K = 4에서 AIC + BIC를 최소화하는 변수 조합을 최적의 변수 조합으로 판단할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F4.jpg

Fig. 4.

An example of AIC+BIC plot

3.3 군집화 대상자료

본 연구에서는 군집화 대상으로써 2019년 한국수문조사보고서(ME, 2019)의 유사량편을 이용하였다. 해당 보고서에는 국내 44개 유사량 관측소의 좌표와 유역면적, 그리고 직접 부유사를 채집해 계산된 부유사 농도와 실측 부유사량을 바탕으로 개발된 유량-부유사량 관계식과 Colby and Hambree (1954)가 제시한 수정 아인슈타인 방법으로 산정된 총유사량 값과 유량의 관계식을 제공한다. 이때 유량-부유사량 관계식은 아래 식의 형태로 유도된다.

(20)

Q_{S L} = a_{S L} Q^{b_{S L}}

여기서, Q_SL은 부유사량; a_SL과 b_SL은 유량-부유사량 관계식의 회귀계수이다. 유량-총유사량 관계식은 Eq. (20)와 형태가 동일하며, 본 연구에서는 두 관계식의 구분을 위해 총유사량과 유량-총유사량 관계식의 계수를 아래첨자 TL을 도입하여 각각 Q_TL, a_TL, 그리고 b_TL로 표시한다.

해당 보고서에는 부유사량, 유사량 관계식에 더불어 유사특성으로서 부유사와 하상토의 입도분포가 함께 수록되어 있다. 부유사 입도분포는 0.062 mm에서 8 mm 까지 8 단계로 구분된 입도별 중량 분포값을 포함한다. 하상토의 입도분포는 누적 백분율 값에 따라 5% 입도분포의 입경인 d₅부터 5% 간격으로 100%에 해당하는 입경인 d₁₀₀까지 20개의 입경 값을 제공한다. 그리고 입도분포 특성을 매개변수화한 균등계수C_u, 곡률계수 C_g, 그리고 표준편차 $ρ_{g}$ 가 Eqs. (21)~(23)가 계산되어 수록되어 있다.

(21)

C_{u} = \frac{d_{60}}{d_{10}}

(22)

C_{g} = \frac{d_{30}^{2}}{d_{10} \times d_{60}}

(23)

ρ_{g} = \sqrt{\frac{d_{84}}{d_{16}}}

Molinas and Wu (1998)은 자연하천에서의 총유사량 산정 시 입도의 그라데이션 계수 Gr과 d₅₀의 영향을 동시에 고려하여야 함을 강조했다. 따라서 본 연구에서는 추가적으로 하상토 특성으로서 Gr과 무차원 입경 d_*를 각각 아래 식들을 이용해 계산하였다(Julien, 2010).

(24)

G r = \frac{1}{2} (\frac{d_{84}}{d_{50}} + \frac{d_{50}}{d_{16}})

(25)

d_{*} = d_{50} {[\frac{g (G_{s} - 1)}{ν^{2}}]}^{1 / 3}

여기서, G_s는 유사의 비중; $ν$ 는 물의 운동학적 점성계수이다. 44개 유사량 관측소에서 실측된 변수 목록은 Table 2와 같다.

Table 2.

Variable summary of sediment monotoring stations

Location		Rating curve coeff.				SSPSD (mm)		BMPSD (mm or -)
Station Name	Cat. Area (m²)	a_SL	b_SL	a_TL	b_TL	0.062	2	d₂₀	d₅₀	d₈₀	C_u	C_g	$ρ_{g}$	d_*
Jucheon B.	533.75	0.3536	1.3882	0.4729	1.5946	80.3	0.2	0.4	0.7	7.6	3.7	0.6	3.2	17.20
Jijeong B.	1,186.67	0.0537	1.9211	0.0490	1.9781	59.7	0.2	0.5	1.1	6.2	4.7	1.1	4.7	27.07
Wonbu B.	519.53	0.7223	1.6889	1.0563	1.5802	82.9	0.0	0.3	1.0	3.7	6.0	0.7	4.0	24.54
Namhangang B.	10,947.38	0.0009	2.2668	0.0005	2.3932	70.7	4.8	0.5	0.9	7.0	3.0	1.2	3.1	21.75
Yeoju B.	11,114.18	0.0044	2.0392	0.0123	1.8530	77.1	2.4	0.6	1.5	12.1	5.6	1.1	5.1	37.94
Yulgeuk B.	177.33	1.6772	1.7213	10.7590	1.3184	89.8	0.2	0.4	0.9	3.8	3.8	0.8	3.4	22.77
Heungcheon B.	294.78	0.7853	1.7854	0.2471	2.0436	82.2	0.1	0.5	1.5	3.2	8.2	2.0	3.3	38.70
Ipo Weir upstream	11,774.88	0.0091	1.9562	0.0051	2.0853	40.5	14.6	0.4	1.2	13.7	8.9	0.8	6.7	30.61
Gyeongan B.	261.82	0.2261	2.0326	0.1218	2.2044	60.5	9.1	0.6	2.1	8.5	10.1	0.9	4.9	52.36
Hoeryong B.	1,514.28	0.1438	1.7813	0.4995	1.5273	75.2	2.5	0.7	1.3	1.9	3.2	1.1	2.1	32.13
Gimyong-ri	609.42	0.0612	1.6997	0.0480	1.7594	54.3	3.1	1.6	9.9	27.7	21.3	0.8	5.4	250.94
Hwagye B.	177.23	2.3218	1.3850	5.5478	1.2225	78.3	2.8	0.4	1.0	2.5	5.1	1.2	3.2	24.79
Bian B.	1,212.02	0.1461	1.7819	0.0891	2.1159	65.1	1.2	0.5	0.9	2.8	3.1	1.0	3.2	22.51
Museong-ri	472.69	0.0501	1.9671	0.1133	1.8683	73.6	2.0	0.8	4.4	21.5	21.9	0.5	6.8	110.29
Gimcheon B.	456.4	0.0794	1.9119	0.0745	2.0064	84.4	0.0	0.4	0.9	1.6	3.4	1.1	2.3	22.26
Seonju B.	987.52	0.3607	1.6316	0.7683	1.7826	68.8	2.7	0.5	1.0	1.6	3.7	1.3	2.2	24.28
Gumi B.	10,915.39	0.0108	1.7977	0.0001	2.5101	74.2	3.7	0.5	0.8	1.2	2.9	1.2	1.8	19.98
Hoguk B.	11,103.91	0.0080	1.8303	0.0039	1.9219	71.5	3.6	0.4	1.4	11.3	11.1	0.6	6.0	34.15
Geumchang B.	926.93	0.0051	1.8773	0.3981	1.2967	48.3	9.9	3.9	12.8	23.3	9.6	2.5	3.3	323.03
Ansim B.	1,386.9	1.1932	1.1748	1.0177	1.2343	25.8	16.0	13.8	38.3	21.3	16.0	0.9	5.9	967.57
Gangchang B.	2,090.22	0.0240	2.1127	0.0334	2.1284	51.4	9.0	0.5	0.8	1.3	2.8	1.1	1.8	19.73
Dojin B.	749.77	0.1396	1.7112	1.6770	1.2872	75.3	0.5	0.5	0.8	1.2	2.7	1.2	1.7	20.74
Hwanggang B.	1,240.66	0.6958	1.3793	0.1611	1.6815	42.6	11.7	0.5	0.8	1.2	2.5	1.1	1.6	20.24
Jeokpo B.	16,433.12	0.0011	2.2325	0.0027	2.1234	69.0	0.0	0.3	0.4	0.6	2.2	1.1	1.5	9.11
Jeongam B.	2,990.66	0.2107	1.4763	0.0087	2.0131	64.5	7.3	0.3	0.4	0.9	2.4	1.1	2.1	9.87
Gyenae-ri	2,0354.77	0.0044	1.9575	0.0027	1.9891	47.4	13.2	0.3	0.7	4.3	4.2	1.1	2.9	18.21
Singu B.	642.5	0.0751	1.9496	0.0118	2.5560	68.8	0.0	1.9	12.5	28.4	26.1	0.3	6.0	315.95
Palgyeol B.	908	0.9223	1.6350	1.1097	1.7519	80.0	1.1	0.9	1.9	7.6	4.5	0.8	3.8	47.81
Geumnam B.	6,946.3	0.0005	2.7478	0.0013	2.6217	75.6	0.3	0.4	1.0	3.0	4.2	0.9	3.3	25.04
Geumgang B.	7,213.3	0.0281	1.9442	0.0023	2.5410	60.3	1.4	0.4	1.7	16.3	23.0	0.3	6.9	43.51
Jicheon B.	209	0.0411	2.1927	0.0053	2.1745	76.7	0.1	0.4	1.0	7.3	7.3	1.1	6.4	26.31
Baekjae B.	8,328.8	0.0900	1.5481	0.0522	1.6805	79.5	0.9	0.2	0.5	1.1	4.5	1.1	2.9	12.65
Yongsan B.	442.58	0.0979	1.8422	0.0562	2.0517	84.1	0.0	0.5	1.9	13.0	13.6	0.9	7.3	49.07
Yuchon B.	103.47	3.7123	1.4493	3.1277	1.5521	30.4	12.4	0.6	3.8	19.1	19.2	0.6	7.3	95.62
Geukrak B.	683.5	0.0730	1.8954	0.9305	1.8424	74.8	1.6	0.6	1.4	7.4	5.7	1.0	4.9	35.67
Jangrok B.	555.08	0.0876	1.8602	0.2719	1.7000	77.6	0.2	0.3	3.2	17.2	41.5	0.7	9.9	80.19
Nampyeong B.	585.05	0.0602	1.8845	0.0997	1.7579	78.4	0.0	1.0	4.1	17.6	11.3	0.4	5.8	103.71
Naju B.	2,055.78	0.0308	1.9557	0.0207	2.0263	63.1	4.7	0.4	4.4	12.0	24.7	0.2	9.5	111.05
Donggang B.	2,599.85	0.5893	1.3265	0.4066	1.4097	89.5	0.2	0.5	2.0	5.4	13.3	1.3	4.6	49.58
Nakdan B.	9,399.97	-	-	-	-	78.09	0	0.66	2.22	13.61	9.99	0.69	5.83	56.16
Ilseon B.	9,532.76	0.003	2.0493	-	-	81.12	0	0.46	1.16	5.73	6.52	1.13	5.13	29.34
Oin B.	109.21	-	-	-	-	66.7	0.92	0.26	0.79	2.21	7.43	1.15	4.3	19.98
Gukjae B.	257.4	0.1793	1.8529	-	-	66.57	0	0.72	1.39	3.74	3.25	0.91	2.83	35.16
Pungyeongjeongcheon 2 B.	66.85	-	-	-	-	79.97	0	1.02	5.14	15.37	19.66	1.33	5.3	130.02

3.4 유사량 관측소 공간 분류

3.3절에서 서술된 대상 자료에서 관측소의 위도와 경도, 유역면적의 공간 변수, 유량-유사량 관계식의 계수[a_SL, b_SL, a_TL, b_TL], 부유사 입도분포, 하상토의 입도분포와 입도 매개변수가 군집화 입력 변수로서 채택되었다. 특히, 모래질 유사와 실트질 유사를 나누는 기준인 0.062 mm와 2 mm가 해당되는 부유사 분포의 백분율 값과 하상토의 대표 입경으로서 d₂₀, d₅₀, d₈₀만을 이용한 경우에도 별도로 군집화를 수행하였다. 군집화 변수들이 군집화 결과에 미치는 영향을 고려하기 위해 변수들의 조합을 바꾸어 가면서 총 26개의 변수 조합에 대해 군집화를 수행하였다. 각 변수 조합에서 이용된 변수들을 초록색으로 표시하고 입도분석 자료를 적용할 때 모든 계급값을 이용한 경우와 특정 계급값만을 이용한 경우를 구분해 Table 3에 정리하였다.

본 연구에서는 공간적으로 분류 결과가 비슷하거나 AIC + BIC값이 수렴하지 않아 과도하게 많은 군집이 형성되는 결과가 나타나는 변수 조합의 경우는 44개의 관측소를 대상으로 군집분석 시에 적합하지 않다고 판단하여 분석에서 제외하였다. 결과적으로 대표 군집화 결과를 Fig. 5와 같이 6개의 대표 변수 조합으로 정리할 수 있었다. Fig. 4에서 SSPSD와 BMPSD는 각각 부유사의 입도분포와 하상토의 입도분포에서 모든 계급값을 전부 입력 변수로 사용한 경우이며, 그 이외에 부유사와 하상토의 대표 입경 사이즈만을 이용한 경우는 별도로 표시하였다. 지도에서 한강, 낙동강, 금강, 영산강, 섬진강의 권역은 회색조로 구분하였고, 관측소의 군집화 결과는 지도에 색깔로 구분하였다.

Figs. 5(a)~5(c)는 관측소의 지리적 위치(위도와 경도)에 부유사 입도 분포, 하상토 입도분포를 달리하여 군집화 한 결과로 Table 3에서는 각각 3, 5, 1번 변수 조합에 해당된다. 여기서, 위치와 하상토 입도 분포만을 이용한 경우가 위치와 부유사 입도 분포만 고려한 경우보다 위치, 부유사와 하상토의 입도 분포를 모두 고려한 경우와 비슷하게 나타났다. 이는 44개의 유사량 관측소를 구분하는 데에 있어 하상토 입도 분포가 부유사의 입도 분포보다 보다 명확하게 군집의 경계를 나누어 군집화 결과에 큰 영향을 미침을 보여준다.

Table 3.

Clustering cases

Case	K	X	Y	Cat. Area (m²)	a_SL	b_SL	a_TL	b_TL	SSPSD (%)			BMPSD (mm)		C_u	C_g	$ρ_{g}$	Gr	d_*
Case	K	X	Y	Cat. Area (m²)	a_SL	b_SL	a_TL	b_TL	all	0.062	0.062,2	all	d₂₀d₅₀d₈₀	C_u	C_g	$ρ_{g}$	Gr	d_*
1	4
2	4
3	9
4	9
5	4
6	4
7	4
8	7
9	6
10	5
11	5
12	5
13	5
14	6
15	5
16	5
17	2
18	6
19	6
20	11
21	12
22	6
23	12
24	4
25	4
26	4

변수 조합 7, 15, 19에 해당하는 나머지 세 개의 군집화 결과(Figs. 5(d)~5(f))에서는 유역면적의 영향을 비교하였다. 상류에 위치한 소유역 하천들은 세 개의 군집화 시행에서 모두 1번 군집(빨간색)으로 분류되었다. 유역면적이 고려된 경우에는 금강 본류에 위치한 3개 관측소들은 관측소의 좌표 변수에 관계없이 독립된 군집으로 분류되었다. Fig. 5(a)에서도 금강 권역의 관측소들이 유사한 형태로 분류되었는데, 이는 금강 유역의 부유사 입도 특성이 유역면적과 유사한 패턴을 지니고 있음을 시사한다.

Figs. 5(e) and 5(f)는 각각 유역면적을 고려한 경우에서 관계식의 계수를 추가한 경우와 부유사와 하상토의 입도 분포를 추가한 경우로 두 변수 조합에 의한 군집화 결과 모두 유역면적과 위치 좌표만을 고려한 Fig. 5(d)에 비해 영산강과 낙동강 유역의 본류에 위치한 관측소들에서 세분화된 결과를 보여준다. 관계식의 계수를 고려한 경우에 비해 부유사와 하상토의 입도를 추가로 고려한 경우가 비교적 소유역 하천에서의 구분이 많이 되었다는 차이가 있다. 특히 한강 유역에서는 남한강의 지류인 섬강에 위치한 지정대교 관측소와 본류에 위치한 남한강교 관측소가 유역면적과 유사특성을 함께 고려했을 때 구분되었다. 그리고 영산강 유역에서는 하류의 나주대교 부근이 1번 군집으로 분류된 지석천에 위치한 관측소나 나주대교보다 상류에 위치한 관측소와 구분되는 결과가 나타났다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F5.jpg

Fig. 5.

Representative clustering cases for sediment measurement stations

Table 4는 Fig. 5(f) (변수 조합 19)에서 군집별로 해당되는 관측소의 통계값을 정리한 것이다. 이 결과에서는 소유역 관측소에 해당되는 1번 군집에 17개의 관측소가 분류된 반면, 3, 4, 5, 6번 군집에서는 5개 이하의 관측소만 해당되었다.

2번 군집의 평균 유역면적은 1번 군집과 4번 군집의 중간정도지만, d₅₀의 평균이 1번군집보다 크다는 면에서 구분된다. 한강 유역에서 2번 군집으로 분류된 지정대교 관측소는 섬강에 위치한 곳으로 Lee et al. (2010)의 조도계수 현장실측에 의하면 섬강은 호박돌로 이루어져 있다고 알려져 있다. 한편 율극교 관측소는 또 다른 한강 지류인 양화천에 위치하는데, 양화천은 자갈-모래질 하천으로 보다 d₅₀이 작은 1번 군집으로 분류되었다.

금강 권역의 하류 관측소 2개소는 6번 군집으로 구분되었다. Table 4에 따르면 해당 관측소는 다른 군집에 비해 중간정도의 유역면적이 나타나는 곳이다. 그러나 다른 군집들에 비해 부유사의 입도가 가장 작게 나타난다는 특징이 있어 여러 변수 조합 내에서 독립적인 군집으로 분류되었다.

Table 4.

Statistic summary of each cluster

Cluster		Stat.	1	2	3	4	5	6
Count			17	8	5	4	2	3
Location	Cat. Area	mean	439.641	1,170.373	11,171.148	2,434.128	18,393.945	7,496.133
		std	198.933	218.317	349.193	446.696	2,773.025	733.364
		min	103.470	908.000	10,915.390	2,055.780	16,433.120	6,946.300
		max	749.770	1,514.280	11,774.880	2,990.660	20,354.770	8,328.800
Rating curve coeff.	a_SL	mean	0.6214	0.4401	0.0066	0.2137	0.0028	0.0395
		std	1.0247	0.4447	0.0040	0.2649	0.0023	0.0458
		min	0.0411	0.0051	0.0009	0.0240	0.0011	0.0005
		max	3.7123	1.1932	0.0108	0.5893	0.0044	0.0900
	b_SL	mean	1.7862	1.6478	1.9780	1.7178	2.0950	2.0800
		std	0.2224	0.2562	0.1884	0.3759	0.1945	0.6113
		min	1.3850	1.1748	1.7977	1.3265	1.9575	1.5481
		max	2.1927	1.9211	2.2668	2.1127	2.2325	2.7478
	a_TL	mean	1.4483	0.5116	0.0044	0.1174	0.0027	0.0186
		std	2.8047	0.4154	0.0049	0.1931	0.0000	0.0291
		min	0.0053	0.0490	0.0001	0.0087	0.0027	0.0013
		max	10.7590	1.1097	0.0123	0.4066	0.0027	0.0522
	b_TL	mean	1.7953	1.6710	2.1527	1.8944	2.0563	2.2811
		std	0.3571	0.3077	0.2886	0.3272	0.0950	0.5217
		min	1.2225	1.2343	1.8530	1.4097	1.9891	1.6805
		max	2.5560	2.1159	2.5101	2.1284	2.1234	2.6217
SSPSD (mm)	0.062	mean	73.67	58.18	66.81	67.15	58.19	71.77
		std	14.14	18.19	14.94	16.02	15.22	10.17
		min	30.41	25.79	40.46	51.44	47.43	60.25
		max	89.77	80.00	77.10	89.51	68.95	79.48
	2	mean	1.89	5.64	5.81	5.29	6.60	0.85
		std	3.52	5.99	4.97	3.81	9.29	0.57
		min	0.00	0.17	2.41	0.24	0.03	0.28
		max	12.37	15.99	14.57	9.01	13.17	1.41
BMPSD (mm or -)	d₂₀	mean	0.65	2.65	0.49	0.40	0.28	0.34
		std	0.44	4.67	0.09	0.10	0.04	0.11
		min	0.32	0.45	0.43	0.25	0.25	0.22
		max	1.86	13.84	0.64	0.48	0.31	0.41
	d₅₀	mean	3.00	7.24	1.14	1.88	0.54	1.07
		std	3.35	13.18	0.31	1.80	0.25	0.61
		min	0.68	0.80	0.79	0.39	0.36	0.50
		max	12.49	38.25	1.50	4.39	0.72	1.72
	d₈₀	mean	11.25	8.24	9.03	4.90	2.45	6.79
		std	9.05	9.00	5.04	5.12	2.67	8.29
		min	1.15	1.15	1.17	0.94	0.56	1.09
		max	28.43	23.32	13.65	11.97	4.33	16.30
	C_u	mean	12.40	5.91	6.30	10.79	3.21	10.58
		std	10.50	4.63	3.61	10.55	1.40	10.72
		min	2.66	2.53	2.94	2.39	2.22	4.24
		max	41.50	15.98	11.07	24.67	4.20	22.96
	C_g	mean	0.85	1.20	0.94	0.93	1.07	0.76
		std	0.40	0.55	0.26	0.47	0.03	0.39
		min	0.26	0.75	0.56	0.23	1.05	0.34
		max	1.96	2.50	1.16	1.29	1.09	1.10
	$ρ_{g}$	mean	5.03	3.33	4.53	4.48	2.20	4.39
		std	2.14	1.43	2.02	3.56	0.93	2.20
		min	1.73	1.64	1.81	1.75	1.54	2.94
		max	9.92	5.86	6.66	9.48	2.86	6.92
	d_*	mean	75.95	183.08	28.89	47.56	13.66	27.07
		std	84.70	333.37	7.79	45.57	6.44	15.53
		min	17.20	20.24	19.98	9.87	9.11	12.65
		max	315.95	967.57	37.94	111.05	18.21	43.51

낙동강 권역은 가장 군집이 세분화 된 곳으로 4번과 5번 군집은 낙동강 권역에서만 나타났다. 5번 군집은 낙동강 본류 하류부에 위치한 곳들로 구성되고, 4번 관측소는 상대적으로 하류에 위치한 지류 관측소들로 구성되어 있다. a_SL은 부유사량이 유량 변화에 얼마나 민감하게 반응하는가를 보여주는 척도로 이용할 수 있는데, 5번 군집은 가장 낮은 값이 나타나 부유사량 변화가 강건한 지역으로 나타났다. 이 군집화 결과에서는 a_SL이 분석 변수로 이용되지 않았음에도 a_SL로 인한 지역적 특성이 드러났는데, 이는 부유사와 하상토의 입도, 그리고 유역면적이 특정 지역의 유사 이송 특성 변수으로 널리 이용되는 것을 고려하면 자명한 결과라고 판단된다. 반면 4번 군집들은 2 mm 부유사의 평균 값이 2와 같이 5 이상으로 다소 크게 나타났음에도 하상토의 입경은 상대적으로 작게 나타났다는 점에서 다른 군집들과 구분된다.

이 결과는 하천별로 다르지만 비슷한 부유사와 하상토의 특징을 보이는 관측소끼리 구분되었음을 보여준다. 이를 감안하면 군집화 결과의 선정 시 전체 유사특성을 고려하는 것이 바람직하다고 판단된다. 한 편, 군집화 시 유역면적 749.77 m² 이하의 소유역 관측소가 가장 많은 비율을 차지하는 바, 유역면적이 고려된 변수 조합 중 소유역 관측소의 구분이 가장 세분화된 Fig. 5(f)를 대표 군집화 결과로 선정했다.

4. 군집화 결과를 이용한 H-ADCP-SSC 관계식의 확장 적용 방안

Fig. 6은 위치, 유역면적, 부유사와 하상토 대표 입도 분포 값을 이용한 국내 유사량 관측소의 군집 결과와 H-ADCP- SSC 관계식이 유도된 관측소의 위치를 마름모 마커로 표시하여 함께 그린 것이다. 여기에, 분석의 용이함을 위해 Fig. 2를 함께 도시하였다.

한강 권역의 경우에는 H-ADCP-SSC 관계식의 계수가 비슷한 이포보와 남한강교가 함께 군집 3으로 군집화 되었다. 한 편 관계식의 계수가 한강 본류에 위치한 두 관측소와 다소 차이가 있는 섬강의 지정대교 관측소의 경우에는 2번 군집으로 성공적으로 구분되었다.

Fig. 6에서 볼 수 있듯이, 유도된 계수들의 값을 비교했을 때에는 영산강 권역의 나주대교와 한강 권역의 이포보, 남한강교 관측소가 유사하게 나타났다. 한강 본류 관측소들이 3번 군집으로 분류된 반면, 영산강 본류의 나주대교는 4번 군집으로 구분되었다. 계수 값이 비슷함에도 불구하고 다른 군집으로 분류된 것은 지리적으로 멀리 떨어져 있기 때문인 것으로 판단된다.

낙동강 권역에 위치한 구미대교와 호국의다리 관측소는 군집3으로 한강 권역의 이포보 상류 관측소와 남한강교 관측소와 같은 군집으로 나타났다. 한편 구미대교와 매우 유사한 H-ADCP-SSC 관계식이 유도된 함안 계내리 관측소는 5번 군집에 소속되었다.

한강 권역의 경우, 같은 권역 내에서는 군집화에 의한 분류가 유효하다고 할 수 있다. 그러나 한강과 영산강에서 비슷한 H-ADCP-SSC 관계식임에도 다른 군집으로 분류된 것으로 미루어 보아 서로 다른 권역 간에는 군집화 결과가 상대적으로 덜 유의미하게 작용한다고 판단된다. 따라서, H-ADCP-SSC 관계식이 개발되지 않은 구역에서는 권역 내에 같은 군집으로 분류된 관측소의 계수를 이용하는 방법을 대안으로 제시한다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F6.jpg

Fig. 6.

Spatial overlapping of the clustering result with the stations where the H-ADCP-SSC equations exist (left-hand side figure is originally from Fig. 2)

본 연구에서는 전술한 분석 내용을 바탕으로 하여 H-ADCP-SSC 관계식이 개발되지 않은 관측소에서도 H-ADCP 기반 부유사량 모니터링 방법을 적용할 수 있는 대안 프로토콜을 제시한다. 이 프로토콜은 적용 대상 지역이 본 연구에서 군집화 대상으로 이용된 44개의 부유사 관측소인 경우와 그렇지 않은 경우로 구분하여 적용할 수 있다. 제시되는 프로토콜의 설명을 위해 Fig. 7에 군집화 결과를 보로노이 다각형(Voronoi polygon)과 함께 군집별로 영향을 미치는 범위를 표시하고 두 가지 예시에 대해 설명을 추가하였다. 보로노이 다각형은 평면을 주어진 기준점들로부터 유클리드 거리가 가장 가까운 영역으로 구분지은 것으로, 또한 티센 다각형(Thiessen polygon)으로도 불린다. 보로노이 다각형은 평면 내에 위치한 점들 중 서로 가장 가까운 두 개의 점을 모두 연결한 뒤 각 연결선의 수직이등분선을 그려 구성할 수 있다. Fig. 7에서는 44개의 관측소를 기준점으로 하여 보로노이 다각형을 구성함으로써 각 관측소에서 가장 인접한 영역을 찾아냈다.

첫 번째 예시는 H-ADCP-SSC 관계식이 개발되지 않은 유사량 관측소에서 프로토콜을 적용하는 경우이다. 우선 H-ADCP-SSC 관계식 데이터셋에서 같은 권역에서 개발된 식들을 추려낸다. 다음으로 같은 권역에서 같은 군집화 결과를 추려내고, 같은 권역에 같은 군집으로 분류된 관측소 중에 지리적으로 가장 인접한 관측소의 H-ADCP-SSC 관계식을 이용한다. Fig. 7의 예시 1은 구미대교 관측소가 관계식 미개발 구역을 예시로 든 경우이다. 구미대교의 경우에는 낙동강 권역의 군집 3번 지점을 추려내면, 구미대교와 호국의 다리가 남게 된다. 따라서 호국의다리 부유사 관측소에서 개발된 부유사 계측 모형을 적용하면 되는 방식이다.

두 번째 경우에는 대안 프로토콜 적용 대상 지역이 본 연구에서 적용한 군집화 대상인 부유사 관측소가 아닌 자동 유량 관측소인 경우이다. 이런 경우에는 동일 권역의 관측소를 추려내는 과정까지는 앞의 경우와 동일하다. 그러나 이 경우에는 해당 관측소가 소속된 군집을 알 수 없다. 직접적으로 군집 번호를 참조하는 대신에 대상 관측소가 Fig. 7에서 어떤 보로노이 폴리곤 영역에 포함되는지 판단되면 해당 영역이 어떠한 군집에 소속하는지 판단할 수 있다. 이 방법으로 동일 군집을 추려내면, 첫 번째 경우와 같이 가장 인접한 관측소의 모형을 대신 이용할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F7.jpg

Fig. 7.

Flowchart of the H-ADCP-SSC equation determination protocol

위에 서술한 프로토콜의 보다 직관적인 이해를 위해 Fig. 8에 순서도를 추가로 제시하였다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F8.jpg

Fig. 8.

Flowchart of the H-ADCP-SSC equation determination protocol

본 H-ADCP-SSC 관계식 확장 적용 방안의 예시 결과로서 시험하기 위해 구미대교를 대상으로 2019년 실측 농도 범위인 2.57 mg/l~493.29 mg/l를 아우르도록 SCB의 범위를 80 dB에서 118 dB 사이의 값으로 부여한 뒤 해당 SCB 구간에서 각각 호국의다리, 지정대교, 그리고 남한강교 관측소의 H-ADCP-SSC 관계식을 각각 적용하고 그 결과를 Fig. 9에 대수눈금 그래프로 나타냈다. 그 결과 구미대교 관측소의 R²는 호국의다리, 지정대교, 남한강교 관측소에서 각각 0.14, -0.39, -0.44로 나타났다. 세 관측소의 관계식 모두 R²가 0.2 이하로 나타나 구미대교 관계식과 낮은 상관관계를 보였다. 추가로 평균제곱근편차(root mean squared error, RMSE)와 평균 퍼센트 오차율(percent bias, PBIAS)을 평가했으며, RMSE와 PBIAS는 낮을수록 오차가 적은 모형이라고 말할 수 있다. 구미대교 관측소 결과와의 RMSE 값은 호국의다리, 지정대교, 그리고 남한강교 관계식들의 156.8 mg/l, 124.3 mg/l, 그리고 62.13 mg/l로 계산되어 R²값과 반대되는 결과가 나타났다. 한편, PBIAS는 호국의다리가 56%로 RMSE가 가장 낮은 남한강교 관계식의 315%보다 5.6배가량 낮게 나타났고 지정대교는 40%로 호국의다리보다 낮은 PBIAS가 나타났다. Fig. 9를 보면 구미대교 관계식과 접접이 나타나는 부유사 농도가 호국의다리, 지정대교, 남한강교 관계식의 순서대로 커지는데, 접점이 낮은 부유사 농도에서 발생하면 상대적으로 높은 부유사농도일 때 오차의 제곱근 편차가 크게 나타난다. 이에 호국의다리 관계식의 RMSE가 가장 크게 평가되고 남한강교 관측소의 RMSE가 가장 작음에도 남한강교 관계식은 부유사 농도가 낮을 때 오차비율이 1,166%로 나타나 전반적인 적용성은 가장 떨어진다고 볼수 있다. R², RMSE, PBIAS를 종합적으로 평가했을 때, 구미대교 관측소의 대체모형으로 본 확장 적용 방안 적용 결과로 제안되는 호국의다리 관측소가 나머지 두 관측소의 관계식에 비해 적합한 것으로 판단된다.

하천은 홍수와 같은 자연적 요인과 하천 및 도시 개발과 같은 인공적 요인 등 다양한 요인으로 지속적으로 변화한다. 자연하천의 변화 양상을 감안하면, 유사량 계측 방법에 이용되는 방법론들 또한 매년 갱신되어야 하고, 한국수문조사보고서에서도 매년 유사량 관측소에서의 유량-유사량 관계식을 갱신하고 있다. 이런 관점에서 보았을 때, 본 연구의 결과는 2019년의 자료만을 이용한 결과로, 이후에 실무에서 적용 시에는 다소 오차가 발생할 수 있으나 나주대교에서 2017년과 2019년에 각각 개발된 H-ADCP-SSC 관계식의 계수가 보이는 시간적 변동이 크지 않아 최소한 2년 간격에서는 유효할 것으로 사료된다. 또한, 본 연구에서는 2019년 부유사 관측 대상지점인 44개소의 유사량 관측소만을 대상으로 하였기 때문에 대상 자료에 포함되지 않은 섬진강 유역이나 동해안에 위치한 하천들에 본 연구 결과를 적용할 시 불확도가 클 것으로 예상된다. 또한, 시범적용 결과에 따르면 원본 구미대교 관계식과 H-ADCP-SSC 관계식 프로토콜로 대체된 호국의다리 관계식으로 산정한 모형이 R² = 0.17로 타 관측소의 관계식보다는 우수하지만 상관성은 다소 낮다고 평가할 수 있다. 따라서 모형 개발 시기와 실무 적용 시기의 괴리에서 오는 시공간적 불확도를 줄이기 위해서는 유사량 관측망의 자료가 추가되는 대로 지속적인 모형 갱신이 필요하다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-01/N0200550105/images/kwra_55_01_05_F9.jpg

Fig. 9.

Estimated SSC graphs of the four tested H-ADCP-SSC models for a given SCB range

5. 결 론

본 연구의 성과는 다음과 같이 요약된다.

1) 비지도 기계학습 기법인 GMM을 활용해 국내 44개소의 부유사 관측소를 지역적인 유사특성에 따라 분류하고 그 결과에 대해 고찰하였다.

2) 자동 유량 관측소와 부유사 관측소에 위치한 H-ADCP를 이용해 실시간으로 부유사 농도를 계측할 수 있는 H-ADCP-SSC 관계식을 개발하고 관계식들의 계수를 비교했다.

3) 1) 단계의 유사 관측소의 공간적 분류 결과와 2) 단계에서 제안되는 H-ADCP-SSC 모형 사이의 관계를 비교하고 그 결과로 H-ADCP-SSC 관계식 미개발 관측소에서도 모형을 적용하는 프로토콜을 제안했다.

세부적으로, H-ADCP-SSC 관계식 대체 프로토콜의 제안에 앞서 수행된 두 단계의 분석에서는 다음과 같은 사항을 발견할 수 있었다. 부유사 관측소의 군집분석을 통해 유역면적, 부유사와 하상토의 입도 특성을 군집분석의 주된 변수로 적용해 이 지역인 특성을 가진 군집으로 구분될 수 있음을 보였다. 그리고 H-ADCP-SSC 관계식의 계수를 유도해 관계식의 계수가 지역별로 동질성을 지니고, 이러한 동질성이 군집분석 과정에서 나타난 지역적 특징과 유사함을 보였다. 이 연구 결과는 기 설치된 H-ADCP를 이용해 실시간으로 부유사량을 계측하는 방법에서 더 나아가 유사특성을 이용한 지역 군집화 결과와 H-ADCP-SSC 관계식의 유사성을 이용해 관계식이 개발되지 않은 자동 유량 관측소에서도 실시간 부유사량 관측을 가능케 해 유량과 유사량 계측에 있어서의 시공간적 간극을 줄이는 데에 기여한다.

Acknowledgements

본 연구는 환경부의 재원으로 한국환경산업기술원의 수요대응형 물공급서비스 연구사업의 지원을 받아 수행되었으며 이에 감사드립니다(2020002650001).

References

Akaike, H. (1974). "A new look at the statistical model identification." IEEE Transactions on Automatic Control, Vol. 19, No. 6, pp. 716-723. 10.1109/TAC.1974.1100705

Asuero, A.G., Sayago, A., and Gonzalez, A. G. (2006). "The correlation coefficient: An overview." Critical Reviews in Analytical Chemistry, Vol. 36, No. 1, pp. 41-59. 10.1080/10408340500526766

Bishop, C.M. (2006). Pattern recognition and machine learning. springer, New York, U.S.

Colby, B.R., and Hembree, C.H. (1954). "Computations of total sediment discharge, Niobrara River near Cody, Nebraska." Science, Vol. 119, No. 3097, pp. 657-658. 10.1126/science.119.3097.657-a17732017

Dempster, A.P., Laird, N.M., and Rubin, D.B. (1977). "Maximum likelihood from incomplete data via the EM algorithm." Journal of the Royal Statistical Society: Series B (Methodological), Vol. 39, No. 1, pp. 1-22. 10.1111/j.2517-6161.1977.tb01600.x

Downing, A., Thorne, P.D., and Vincent, C.E. (1995). "Backscattering from a suspension in the near field of a piston transducer." The Journal of the Acoustical Society of America, Vol. 97, No. 3, pp. 1614-1620. doi: 10.1121/1.412100 10.1121/1.412100

Flammer, G.H. (1962). Ultrasonic measurement of suspended sediment, (Vol. 1141). US Government Printing Office, Washington, D.C., U.S.

Guerrero, M., Szupiany, R.N., and Latosinski, F. (2013). "Multi-frequency acoustics for suspended sediment studies: An application in the Parana River." Journal of Hydraulic Research, Vol. 51, No. 6, pp. 696-707. 10.1080/00221686.2013.849296

Haught, D., Venditti, J.G., and Wright, S.A. (2017). "Calculation of in situ acoustic sediment attenuation using off the shelf horizontal ADCPs in low concentration settings." Water Resources Research, Vol. 53, No. 6, pp. 5017-5037. 10.1002/2016WR019695

Julien, P.Y. (2010). Erosion and sedimentation. Cambridge University Press, Cambridge, UK. 10.1017/CBO9780511806049

Landers, M.N. (2012). Fluvial suspended sediment characteristics by high-resolution, surrogate metrics of turbidity, laser-diffraction, acoustic backscatter, and acoustic attenuation. Ph. D. dissertation, Georgia Institute of Technology, GA, US.

Landers, M.N., Straub, T.D., Wood, M.S., and Domanski, M.M. (2016). Sediment acoustic index method for computing continuous suspended-sediment concentrations, No. 3-C5. US Geological Survey, Washington, D.C., U.S. 10.3133/tm3C5

Lee, C.J., Kim, J.S., Kim, Y.J., and Kim, W. (2010). "Method for estimation of roughness coefficient by field measurement and its application." Proceedings of the Korea Water Resources Association Conference, KWRA, pp. 504-508. (in Korean)

Ministry of Environment (ME) (2019). Hydrological annual report in Korea. (in Korean)

Molinas, A., and Wu, B. (1998). "Effect of size gradation on transport of sediment mixtures." Journal of Hydraulic Engineering, Vol. 124, No. 8, pp. 786-793. 10.1061/(ASCE)0733-9429(1998)124:8(786)

Moore, S.A., Le Coz, J., Hurther, D., and Paquier, A. (2012). "On the application of horizontal ADCPs to suspended sediment transport surveys in rivers." Continental Shelf Research, Vol. 46, pp. 50-63. 10.1016/j.csr.2011.10.013

Schober, P., Boer, C., and Schwarte, L.A. (2018). Correlation coefficients: Appropriate use and interpretation. Anesthesia & Analgesia, Vol. 126, No. 5, pp. 1763-1768. 10.1213/ANE.000000000000286429481436

Schulkin, M., and Marsh, H.W. (1962). "Sound absorption in sea water." The Journal of the Acoustical Society of America, Vol. 34, No. 6, pp. 864-865. 10.1121/1.1918213

Schwarz, G. (1978). "Estimating the dimension of a model." The Annals of Statistics, Vol. 6, No. 2, pp. 461-464. 10.1214/aos/1176344136

Seo, K., Kim, D., and Son, G. (2016) "Estimation of suspended sediment concentration in small stream with acoustic backscatter from horizontal ADCP based on real-scalefield experiment." Journal of Korean Society of Civil Engineers. Vol. 36, No. 6, pp. 1023-1035. (in Korean) 10.12652/Ksce.2016.36.6.1023

Sheng, J., and Hay, A.E. (1988). "An examination of the spherical scatterer approximation in aqueous suspensions of sand." The Journal of the Acoustical Society of America, Vol. 83, No. 2, pp. 598-610. 10.1121/1.396153

Son, G., Kim, D., and Roh, Y.S. (2020). "Development of a Surrogate Technology Load Based upon Horizontal ADCP for continuous estimation of suspended sediment." Proceedings of the Korea Water Resources Association Conference, KWRA, p. 47. (in Korean)

Son, G., Kim, D., Kwak, S., Kim, Y.D., and Lyu, S. (2021). "Characterizing three-dimensional mixing process in river confluence using acoustical backscatter as surrogate of suspended sediment." Journal of Korea Water Resources Association, Vol. 54, No. 3, pp. 167-179. doi: 10.3741/JKWRA.2021.54.3.167 (in Korean)

Topping, D.J., Wright, S.A., Melis, T.S., and Rubin, D.M., (2006). "High-resolution monitoring of suspended-sediment concentration and grain size in the Colorado River using laser-diffraction instruments and a three-frequency acoustic system" Proceedings of the Eighth Federal Interagency Sedimentation Conference, U.S. Geol. Surv., Reno, Nev., pp. 539-546.

Topping, D.J., Wright, S.A., Melis, T.S., and Rubin, D.M. (2007). "High-resolution measurements of suspended-sediment concentration and grain size in the Colorado River in Grand Canyon using a multi-frequency acoustic system." Proceedings 10th International Symposium on River Sedimentation, World Assoc. for Sediment. and Erosion Res., Moscow, Russia, Vol. 3, pp. 330-339.

Urick, R.J. (1948). "The absorption of sound in suspensions of irregular particles." The Journal of the acoustical society of America, Vol. 20, No. 3, pp. 283-289. 10.1121/1.1906373

Urick, R.J. (1975), Principles of underwater sound for engineers, McGraw Hill, NY, U.S., p. 384.

Venditti, J.G., Church, M., Attard, M.E., and Haught, D. (2016). "Use of ADCPs for suspended sediment transport monitoring: An empirical approach." Water Resources Research, Vol. 52, No. 4, pp. 2715-2736. 10.1002/2015WR017348

Wall, G.R., Nystrom, E.A., and Litten, S. (2006). "Use of an ADCP to compute suspended-sediment discharge in the tidal Hudson River." U.S. Geological Survey Scientific Investigations Report 2006-5055, U.S. Geological Survey, Reston, New York, U.S. 10.3133/sir20065055

Wright, S.A., Topping, D.J., Williams, C.A. (2010). "Discriminating silt-and-clayfrom suspended-sand in rivers using side-looking acoustic profilers." Proceedings of the 2nd Joint Federal Interagency Sedimentation Conference, U.S. Geol. Surv., LasVegas, NV, U.S.

Journal of Korea Water Resources Association ISSN:2799-8746(Print) 2799-8754(Online) 한국수자원학회 논문집

Preview

Clustering of sediment characteristics in South Korean rivers and its expanded application strategy to H-ADCP based suspended sediment concentration monitoring technique

ABSTRACT

MAIN

(1)

Fig. 1.

Spatial view of the sediment monitoring stations and H-ADCP based automatic discharge monitoring stations

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

Table 1.

Derived H-ADCP-SSC equation coefficients and predictability

Fig. 2.

Scatter plot of H-ADCP-SSC equation coefficients

(10)

(11)

(12)

Fig. 3.

Example of a mixture model of three Gaussian distributions

(13)

(14)

(15)

(16)

(17)

(18)

(19)

Fig. 4.

An example of AIC+BIC plot

(20)

(21)

(22)

(23)

(24)

(25)

Table 2.

Variable summary of sediment monotoring stations

Table 3.

Clustering cases

Fig. 5.

Representative clustering cases for sediment measurement stations

Table 4.

Statistic summary of each cluster

Fig. 6.

Spatial overlapping of the clustering result with the stations where the H-ADCP-SSC equations exist (left-hand side figure is originally from Fig. 2)

Fig. 7.

Flowchart of the H-ADCP-SSC equation determination protocol

Fig. 8.

Flowchart of the H-ADCP-SSC equation determination protocol

Fig. 9.

Estimated SSC graphs of the four tested H-ADCP-SSC models for a given SCB range

Acknowledgements

References