1. 서 론
2. 연구 방법
2.1 대상 유역 및 자료 구축
2.2 다변량 구조 분석 및 패턴 도출
2.3 네트워크 기반 기여율 및 패턴 유사성 분석
3. 연구결과
3.1 연구대상지역 현황 분석
3.2 다변량 구조 평가
3.3 네트워크 기반 기여율 분석 결과
4. 결 론
1. 서 론
최근 기후변화와 환경변화로 인해 하천으로의 유입되는 오염물질이 더욱 다양해 지고있으며 수질 및 수생생태계의 오염이 가속화되고 있다(Akhtar et al., 2021). 또한 도시화 및 산업화로 인해 환경오염이 주요 관심사로 떠오르고 있다(Seo et al., 2019; Lee et al., 2022). 급격한 도시화는 오염원의 발생률을 높여 비점오염물질의 증가로 강우시 하천에 유입되어 하천 수질을 악화에 영향을 미친다(Yu et al., 2020). 이러한 수질 악화에 대응하고자 국내에서는 하천과 오염원 관리를 통해 수질을 개선하고자 수질오염총량제를 운영하고 있다(Ha et al., 2025). 이러한 관리 외에도 하천에서의 수질을 개선하기 위해서 원인을 파악할 방법이 필요하다.
유역에서 발생하는 오염부하량은 생활계·축산계·산업계 등 점오염원뿐만 아니라 강우 시 지표유출을 통해 유입되는 비점오염원을 포함한다. 이들 오염원은 강우 강도, 계절적 유량 변동, 수위 조절, 보 운영 등 다양한 조건에 따라 본류 수질에 미치는 영향이 달라지며, 특정 시기에는 지류·지천으로부터의 유입이 본류 수질 변화를 결정짓는 주요 요인이 되기도 한다. 따라서 오염부하의 절대량뿐 아니라, 소권역별 상대적 기여도와 양상을 분석하는 방안이 필요하다.
낙동강은 유역 규모가 크고 여러 지역의 생활·공업·농업용수를 동시에 공급하는 특징을 지니고 있어, 수질 변화가 사회·환경적으로 갖는 의미가 매우 크다. 특히 낙동강과 같이 지류·지천이 다수 분포하고 지역 간 토지이용 형태가 크게 상이한 수계에서는, 본류 수질을 효과적으로 관리하기 위해 지류하천의 수질관리 및 개선방안이 고려된다. 특히 특정 소권역이 높은 오염부하를 지속적으로 발생시키거나 강우 시 본류에 미치는 영향이 큰 경우, 해당 지역을 우선관리 대상으로 설정하는 것이 수질개선 효율을 높이는 핵심 전략이 될 수 있다. 이는 본류 중심의 관리만으로는 수질 개선에 구조적 한계가 존재함을 시사하며, 중권역·소권역 단위의 정밀한 기여도 분석이 정책적 의사결정의 기반으로 필요함을 의미한다.
수질 모니터링 자료를 활용한 통계분석 국내외 사례로 다변량 통계분석을 활용한 사용한 사례가 많이 있다. 국내 적용 사례로 한강, 영산강, 금강을 대상으로 다변량 통계기법을 활용하여 지역, 계절에 따른 수질 특성 차이를 연구하였다(Kim and Lee, 2011; Jung et al., 2012; Lee et al., 2017). 낙동강수계 지류 모니터링 자료를 사용하여 지류의 오염 특성을 분석한 사례가 있다(Park et al., 2019). 한강 수계 주요 지류 하천에 대하여 통계분석(상관 분석, 주성분 분석, 군집분석)을 이용, 하천 등급화 방법에 따라 우선 관리되어야 할 지류 하천을 선정 수질 개선 방안 제시하였으며(Cho et al., 2019), 미호천 수계의 6년간의 수질 자료를 이용하여 수질변동과 주요 오염원 특성을 분석하였다(Yoon et al., 2019).
이러한 배경에서 본 연구는 낙동강 수계 중 물금, 매리와 같은 주요 취수장 상류에 위치한 낙동밀양 중권역을 대상으로 하여, 소권역별 오염부하 특성과 수질악화 원인의 영향력을 통합적으로 분석하고, 이를 토대로 중점관리 대상 구역을 도출하는 것을 목적으로 한다. 본 연구는 데이터를 기반으로 유역의 누적 오염특성을 함께 고려하여, 기존 농도 중심 평가에서 한 단계 확장된 데이터 기반 기여도 분석 체계를 제시하고자 한다. 이를 통해 낙동강 유역의 수질관리에 실질적인 근거자료를 제공하고, 향후 유역 단위 통합관리 전략 수립에 기여하고자 한다.
2. 연구 방법
2.1 대상 유역 및 자료 구축
본 연구에서는 대상 유역으로 낙동강에 위치한 낙동밀양 중권역을 대상으로 연구를 수행하였다. 낙동밀양 중권역은 소규모 하천이 많이 위치해있고 낙동강 중상류 지역에 주요 중권역이다. 낙동밀양 중권역은 낙동강 본류의 낙동창녕 중권역의 말단인 남강합류점부터 밀양강 합류전까지의 본류 46.7 km에 해당하며, 강은 대부분 서쪽에서 동진하여 낙동강하구언 중권역과 연결된다(Shim et al., 2020). 낙동밀양 중권역에는 계성천, 광려천, 주천강, 화포천 등 많은 지류하천이 위치하고 있어 주요 소권역을 선정하여 분석을 수행하였다. 본 연구에서는 낙동밀양 중권역을 대상으로 다년간 축적된 수질관측 자료를 기반으로 분석을 수행하였다.
분석에 활용한 수질자료는 2015년 부터 2019년까지 물환경정보시스템(http://water.nier.go.kr)에서 제공하는 물환경측정망 자료를 이용하여 분석하였다. 기상자료는 기상자료개방포털(https://data.kma.go.kr)에서 제공하는 자료를 활용하였으며, 기상관측소 자료를 활용하였다. 관측지점과 시기에 따라 자료의 형식과 측정 간격이 상이하므로 자료의 일관성과 비교 가능성을 확보하기 위해 동일한 기준에 따라 전처리를 수행하였다. 관측자료는 요인분석의 기본 전제로서 시간적 일관성을 확보하기 위해 동일한 관측일시의 자료만을 선별하였다. 이후 결측치와 비정상값은 통계적 기준과 시계열 검토를 바탕으로 이상값을 식별하였다. 오차로 판단되는 값은 제거하고 경계 수준의 변동으로 추정되는 값은 보간을 통해 적용하였다. 이러한 절차를 통해 분석에 활용할 신뢰도 높은 자료를 구축하였다.
분석 변수는 해당 유역의 수환경 특성을 대표하며 시·공간적 변동성이 두드러진 항목을 중심으로 선정하였다. 최종 분석에 포함된 변수는 수온(Temp), 수소이온농도(pH), 용존산소(DO), 생물·화학적 산소요구량(BOD, COD), 부유물질(SS), 영양염류(TN, TP, NO3--N, NH3-N, DTN, DTP), 조류지표(Chl-a), 전기전도도(EC) 등으로 구성하였다. 이러한 변수들은 서로 다른 오염원 영향과 계절적 변화 요인을 반영하는 항목들로 수질구조 분석에 적합한 다변량 자료 기반을 제공한다. 낙동밀양 중권역의 유역도는 Fig. 1과 같으며 중점 소권역 선정을 위해 계성천(GS), 광려천(GR), 남지(NJ), 삼랑진(SR), 임해진(IH), 주천강(JC), 청도천(CD), 하남(HN), 함안(HA), 화포천(HP)에 위치한 수질측정망 자료를 활용하였다.
2.2 다변량 구조 분석 및 패턴 도출
수질항목 간의 상관구조와 지배적 변동 특성을 파악하기 위해 탐색적 요인분석(Exploratory Factor Analysis, EFA)을 적용하였다. EFA는 고차원의 변수 집합에서 공통된 변동성을 요인으로 축약하는 데 적합한 기법으로, 기존 연구(Kim et al., 2017)에서도 유사한 수질패턴 해석을 위해 활용된 바 있다. 본 연구에서는 우선 변수 간 상관행렬 R을 구성하고 고유값 분석과 스크리 검토를 통해 요인 수를 결정하였다. 요인모형은 다음과 같다(Eq. (1)).
여기서 는 표준화된 변수 벡터, 𝛬는 요인적재행렬, 는 공통요인, 𝜖은 특이요인이다. 요인 회전은 변수 간 구조를 보다 명확하게 도출하기 위해 Varimax 방식을 적용하였다. Varimax 회전은 직교회전 방식으로 요인 간 상관을 허용하지 않아 요인구조를 명확하게 하는 장점이 있으나, 수질항목과 같이 상호종속성이 존재하는 자료에서는 잠재요인 간 상관성을 충분히 반영하지 못하는 한계를 가진다. 본 연구는 요인 간 결합구조를 직접 해석하기보다, 요인좌표를 이용한 구조 패턴 비교에 초점을 두어 이러한 한계를 해석범위 내에서 고려하였다. 또한 각 변수의 공통성()은 다음 과 같으며 해당 변수가 전체 요인구조로부터 설명되는 비율을 확인하였다(Eq. (2)).
요인분석 결과를 종합적으로 해석하기 위해 요인적재값과 공통성을 반영한 구조기반 행렬(structure-based matrix, )를 도출하였다. 구조행렬은 다음과 같다(Eq. (3)).
여기서 은 요인적재값에 공통성을 반영하여 보정한 행렬이다. 구조행렬의 대각성분은 각 변수의 구조적 기여도(structural contribution)를 나타내며, 비대각성분은 변수 간 구조적 연관성 또는 상호 영향(interaction strength)을 의미한다. 이러한 구조행렬은 전통적인 요인적재행렬의 해석을 확장하여 변수들의 결집 특성·영향관계·패턴 구조를 보다 정교하게 반영할 수 있는 기반자료로 활용된다. 본 연구에서 활용한 구조행렬의 비대각성분은 두 항목이 요인공간에서 공유하는 구조적 패턴의 유사성을 나타내는 통계적 연관성 지표이며, 인과적 영향이나 방향성을 의미하지 않는다. 따라서 기여도는 물리적 부하량의 기여가 아닌, 요인구조에 기반한 상대적 구조특성을 정량화한 값이다. 또한, 구조행렬 해석의 용어 혼선을 방지하기 위해, 대각성분은 구조적 강도(structural magnitude), 비대각성분은 구조적 유사성(structural similarity)으로 정의하여 일관되게 사용하였다.
2.3 네트워크 기반 기여율 및 패턴 유사성 분석
구조행렬을 바탕으로 변수 간 관계를 직관적으로 파악하기 위해 네트워크 분석을 수행하였다. 네트워크는 각 수질항목을 노드(node)로 구성하고 구조행렬의 비대각성분을 노드 간 연결강도(edge weight)로 반영하였다. 네트워크 구성 시 노드의 크기는 구조행렬의 대각성분을 기반으로 하여 각 항목의 패턴 명확도와 상대적 기여도를 나타내도록 설정하였으며 연결선의 굵기는 항목 간 상호영향도의 크기를 표현하도록 하였다. 노드 간 배치는 Kamada-Kawai 모델을 적용하여 패턴이 유사한 항목이 인접하게 상반된 특성을 보이는 항목은 멀어지도록 설정하였다. Kamada-Kawai 모델은 두 노드 간 이상적 거리와 실제 거리의 차이를 최소화하는 방식으로 배치되며 그 에너지 함수는 다음과 같이 표현된다(Eq. (4)).
여기서 는 두 노드 간 실제 거리, 는 이상적 거리, 는 연결강도 조절계수이다. 이러한 네트워크 기반 분석은 변수 간 상호작용과 패턴 유사성을 동시에 시각화할 수 있어, 단순 상관관계나 요인기여도만으로는 파악하기 어려운 다변량 수질구조의 특징을 효과적으로 도출할 수 있다. 이를 통해 각 항목의 상대적 기여도, 지배적 오염원인, 항목 간 결집구조를 통합적으로 해석함으로 중권역 수질변동의 주요 특성을 규명한다.
기여율 산정은 구조행렬에서 중심항목의 구조값 중 상대적으로 큰 항목을 우선적으로 선별한 뒤, 이들의 상대적 크기를 합으로 정규화하여 계산하였다. 이는 구조적으로 결집된 항목들의 상대적 영향도를 나타내는 통계적 지표이며, 물리적 오염부하 기여도와는 구분된다.
기여율은 특정 중심항목과 다른 항목 간 구조값 중 상대적으로 큰 항목 값들의 상대적 크기를 정규화하여 산정하였다. 이는 구조적 패턴 유사성의 상대적 비중을 나타내는 지표이며, 절대적 영향력이나 인과적 기여도를 의미하지 않는다. 따라서 본 연구에서 제시한 기여도는 동일 요인 내 또는 지점 간 비교가 가능하도록 상대적 구조지표로 해석되어야 한다.
3. 연구결과
3.1 연구대상지역 현황 분석
2015년부터 2019년까지 낙동밀양에 위치한 측정망 자료를 활용하여 분석하였다. 지류하천의 경우 하천의 하류에 위치한 측정망 자료를 활용하였다. 계성천(GS), 광려천(GR), 남지(NJ), 삼랑진(SR), 임해진(IH), 주천강(JC), 청도천(CD), 하남(HN), 함안(HA), 화포천(HP)에 대하여 BOD, T-P농도를 확인하였을 때 계성천, 주천강, 화포천의 수질값이 높게 나타났다(Figs. 2 and 3). 이처럼 지류하천의 관리가 필요한 것을 확인 할수 있었다. 이후 분석에서는 지류하천에 대하여 중점적으로 분석하였다.
3.2 다변량 구조 평가
지류하천별 다변량 구조 평가를 위해 활용한 자료는 아래 Table 1과 같다. 지류하천에서의 데이터의 수집주기가 달라 분석에는 월 평균 값을 분석에 활용하여 시간적 해상도를 일치시켰다.
Table 1.
Data used for analysis of the influence relationship between tributary rivers
다변량 구조 평가는 네트워크 기반의 기여율 및 패턴 분석을 위하여 선행되어야 하는 분석으로 각 하천별로 하천의 수질에 영향을 미치는 지점들을 포함하여 분석하였다.
각 지류하천별로 수질에 대한 영향관계를 분석하였다. 지류하천의 말단부에 위치한 지점과 다른 인자들과의 관계를 분석하였다. 계성천에 대하여 우선적으로 적용하였다. 인자간의 거리는 패턴의 유사성, 인자(원)의 크기는 패턴의 선명도, 선의 굵기는 상호영향도를 나타낸다. Fig. 4는 계성천 하류와 남지하수종말처리장을 분석한 결과로 BOD의 경우 남지하수처리장의 방류량과 계성천의 BOD 농도의 영향이 높게 나타났으며 TP의 경우 남지하수종말처리장과 계성천의 관계가 뚜렷하게 나타나지 않았다. Figs. 4 and 5에는 계성천하류와 관곡천, 계성천 상류와의 관계를 분석하였다. 분석 결과를 확인하였을 때 BOD는 계성천 상류와의 상호영향이 있는 것으로 나타났으며 TP의 경우 계성천상류, 관곡천과 영향이 있는 것으로 나타났다. 주천강과 화포천도 동일한 방식으로 분석을 수행하였으며 다변량 분석 결과를 네트워크 기반 기여율 분석에 활용하였다.
BOD를 중심으로 한 네트워크에서는 Q.hs와 COD.gs가 굵은 연결선으로 나타나 BOD.gs와 가장 높은 구조적 연관성을 보였으며, Rain 등 일부 항목은 상대적으로 약한 결합을 보여 구조패턴 유사성이 낮게 나타났다. Q.hs를 중심으로 할 경우에는 TP.hs와 BOD.hs가 강하게 연결되어 유량 변화와 총인·BOD가 유사한 구조적 변동성을 가진 것으로 나타났고, COD.hs나 TN.hs 등은 약한 연결로 표현되었다. 총인을 중심으로 한 TP.hs 네트워크에서는 BOD.hs와 Q.hs가 주요 결집항목으로 나타나 총인 변동이 이들 항목과 높은 구조적 유사성을 보였으며, COD.gs와 Rain은 상대적으로 낮은 구조 결집도를 보였다. 마지막으로 COD 중심 네트워크에서는 BOD.hs와 TP.hs가 굵은 연결로 나타나 COD 변동과의 구조적 연관성이 높았고, TN.hs나 Rain과의 연결은 약하게 나타나 결집도가 낮았다(Fig. 4).
COD.gg를 중심으로 한 네트워크에서는 TOC.gg와의 연결이 가장 굵게 나타나 두 항목 간 구조적 연관성이 가장 높게 확인되었으며, BOD.gg·DO.gg 등 유기물 지표들과도 비교적 강한 결집패턴을 보였다. 반면 EC.gg나 Rain 등 일부 항목은 상대적으로 연결이 약하게 나타났다. TP.gg를 중심으로 구성된 네트워크에서는 TN 계열 항목과 COD.hs가 상대적으로 굵은 연결선으로 표현되어 총인의 변동과 이들 항목의 구조적 유사성이 크게 나타났고, DO.gg 등 기타 항목들은 약한 결집을 보였다. BOD.gg 중심 네트워크에서는 BOD.gg-COD.gg-TOC.gg 축이 가장 강하게 결집하여 유기물 관련 항목 간 구조적 유사성이 특히 크게 나타났으며, TN.hs나 Rain과의 연결은 상대적으로 약하게 형성되었다. COD.hs 중심 네트워크에서는 TP.hs·TN.hs와의 결합이 굵은 선으로 관찰되어 영양염류 계열과의 구조적 연관성이 높게 나타났다(Fig. 5).
COD.gsup을 중심으로 한 네트워크에서는 TOC.gsup과 Chla.gsup이 굵은 연결선으로 나타나 COD와 가장 높은 구조적 유사성을 보였으며, EC.gsup, Rain, TN.gsup 등은 상대적으로 약한 결합을 보여 구조패턴 유사성이 낮게 나타났다. BOD.gsup을 중심으로 할 경우에는 TOC.gsup, COD.gsup, Chla.gsup이 강하게 연결되어 BOD 변동과 이들 항목이 유사한 구조적 변동성을 가진 것으로 나타났고, EC.gsup, Rain, TN.gsup 등은 약한 연결로 표현되었다. TP.gsup을 중심으로 한 네트워크에서는 Temp.gsup, COD.gsup, TOC.gsup, Chla.gsup가 주요 결집항목으로 나타나 총인 변동이 이들 항목과 높은 구조적 유사성을 보였으며, TN.gsup, EC.gsup, Rain은 상대적으로 낮은 구조 결집도를 보였다. 마지막으로 TN.gsup 중심 네트워크에서는 TP.gsup, Temp.gsup, DO. gsup, EC.gsup가 굵은 연결로 나타나 TN 변동과의 구조적 연관성이 높았고, COD.gsup, TOC.gsup, Chla.gsup와의 연결은 약하게 나타나 결집도가 낮았다(Fig. 6).
3.3 네트워크 기반 기여율 분석 결과
다변량 분석 결과를 바탕으로 네트워크 기반의 기여율 및 패턴 유사성 분석을 수행하였다. 대상지류 하천의 말단지점을 기준으로 하여 영향을 주는 각 요소와의 관계성을 확인하고자 하였다. 이를 통해 각 항목의 상대적 기여도와 원인을 결과로 도출하고자 하였다. BOD, TP를 중점적으로 확인하였으며 Table 2는 BOD, Table 3은 TP를 대상으로 정리하였다. BOD 분석결과 계성천은 계성천 상류와 관곡천의 BOD의 변화에 따라 각각 43%, 47%의 기여도를 나타냈으며 Chl-a와도 45%가량의 기여도가 나타났다. 화포천의 경우 화포천 상류의 BOD와 46%의 기여율을 나타냈다. 주천강은 주항천 DO와 연관이 있는 것으로 나타났으나 주남저수지와의 주천강 또한 DO, pH와 연관성을 나타냈다. TP의 경우 계성천은 계성천상류, 관곡천 TP와 54%, 41% 기여율을 보였으며 화포천은 용덕천, 퇴래천 TP와 46%, 40%의 기여율을 나타냈다. 주천강은 주항천의 BOD, SS, TP, COD와 43%, 41%, 41%, 36%의 기여율을 나타냈다. 이처럼 네트워크 기반의 기여율을 분석하였을 때 계성천은 BOD 관리를 위해 계성천상류, 관곡천의 우선관리 지점인 것을 확인 할 수 있었으며 화포천은 화포천상류의 BOD, TOC, COD에 대한 관리가 필요하며 주천강은 주남저수지의 관리가 필요하다는 결과를 도출할수 있었다. TP의 경우에는 계성천은 계성천상류, 관곡천 순서로 우선관리가 필요하며 화포천은 용덕천, 퇴래천 순서로 주천강은 주항천의 BOD, TP의 영향이 크다는 결과를 확인 할 수 있었다. 이러한 결과를 요소들간의 네트워크 기반 분석 결과를 도식화 하여 나타내었다(Fig. 7).
Table 2.
Results of Network-based contribution rate analysis - BOD
Table 3.
Results of Network-based contribution rate analysis - TP
4. 결 론
낙동밀양 중권역은 낙동강 주요 취수지역인 물금, 매리 취수장 상류에 위치하고 있어 수질관리에 매우 중요한 중권역이다. 해당 중권역에 대한 수질관리를 위하여 소권역, 지류하천 단위의 기여율 분석을 수행하였다. 다변량 통계분석을 활용하여 변수들 간의 결집 특성 및 영향관계를 파악하였다. 분석 결과를 기반으로 네트워크 기반 기여율 및 패턴 유사성 분석을 수행하였다. 계성천에서는 계성천상류, 관곡천, 남지하수종말처리장, 기상자료를 사용하였으며 화포천에서는 화포천상류 용덕천, 퇴래천, 기상자료를 사용, 주천강에서는 주항천, 주남저수지, 기상자료를 사용하여 다변량 수질구조의 분석을 통해 기여율을 분석하였다. 기여율 분석 결과 계성천에서 BOD, TP 모두 계성천상류, 관곡천의 기여도가 높게 나타났으며 화포천 BOD는 화포천상류의 BOD, TOC, COD로 나타났으며 TP는 용덕천, 퇴래천의 기여도가 나타났다. 주천강은 주항천의 BOD, TP의 기여도가 크다는 결과를 확인 할 수 있었다. 하천에서의 수질악화는 복합적인 요소들이 결합되어 나타나는 현상으로 한가지의 요소만으로 파악하기 힘들다는 어려움이 있다. 본 연구에서는 지류에서의 다변량 수질구조의 특성을 반영한 기여율 분석을 통하여 지류하천의 오염에 기여하는 인자를 정량화하였다. 이러한 기여율은 하천의 수질관리에 있어 우선순위를 판단하는데 활용이 가능할 것으로 판단되어지며 본류의 수질개선을 위한 지류하천에서의 수질 악화 원인을 파악하는데 기여율을 통한 정량화에 활용되어질 것으로 판단된다.









