Research Article

Journal of Korea Water Resources Association. 31 December 2022. 1235-1249
https://doi.org/10.3741/JKWRA.2022.55.S-1.1235

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 상수도 수질 사고 웹크롤링 및 사후양상 분석 모형

  •   2.1 웹크롤링 과정

  •   2.2 토픽 모델링

  •   2.3 감성분석

  • 3. 적용 및 결과

  •   3.1 수질 사고에 대한 언론 매체 분석

  •   3.2 토픽 모델링 분석 결과

  •   3.3 감정분석 결과

  • 4. 결 론

1. 서 론

본 연구에서는 웹크롤링 방법을 이용한 자료수집, 텍스트 마이닝을 활용한 데이터 분석 등과 같은 빅데이터 분석기법을 이용하여 국내 상수도 수질 사고에 대한 정보를 추출하고, 추출된 결과에 대한 정확도 비교분석, 새로운 정보 추출, 사고에 대한 전개양상 분석 등을 수행하고자 하였다. 이와 같은 연구를 수행하기 위한 사전의 의문점은 다음과 같다. 첫째, 상수도 시스템의 수질 사고에 대한 언론 매체의 공개와 사고 발생 시 대응, 복구에 대한 관련 정보가 뉴스기사를 통해 빠른 제공이 되고 있는지에 대한 여부이다. 둘째, 사고발생시 장기간의 피해 지속성이 있는 수질사고에 대한 뉴스기사 언론보도는 시간에 따라 어떤 양상으로 변화하는가 이다. 위와 같은 연구동기에 대한 문제해결을 위해 우선, 상수도 시스템의 수질사고 빅데이터 뉴스의 추출을 위한 웹크롤링 기법을 적용하고 정확한 수질사고 뉴스를 획득하고자 알고리즘을 절차화하여 제시하였다. 또한 추출된 수질사고의 경우 사고발생에 따른 사고인지, 사고확산, 사고대응, 사고해결 등과 같은 전개양상이 나타나므로, 각 단계에 따른 적절한 뉴스기사를 추출하고, 이에 따른 정보분석을 실시하였다. 즉, 각 단계 별 주요 키워드, 감성분석을 통한 수질사고 전개양상분석을 사례기반으로 상세히 실시하고 그 의미를 분석, 도출하였다. 추가로 수질사고 기간에 따른 기사들의 긍·부정도의 변화를 시각화하고 분석하였다.

수자원 환경 관련 이슈 중에서 수돗물에 관한 언론보도분석 연구는 거의 이뤄지지 않았다. 수돗물과 관련된 뉴스를 분석한 국내 연구로는 다음과 같다. Kim and Lee (2007)은 국내 주요 언론(10개 종합일간지 대상)에 보도된 수돗물 관련 기사에 대한 내용분석을 실시하여 무작위 표본 추출 방법을 이용하여 자료 추출의 타당도를 살폈다. 최종적으로 수집된 신문에 대해 뉴스 가치 유목을 실시하였고, 비교 항목을 이용하여 수돗물 기사 성격의 변화를 살폈다. Lee and Kim (2020)는 국내에서 최초로 발생한 ‘수돗물 유충’과 관련된 대량의 뉴스 빅데이터를 대상으로 분석하였다. 텍스트 내에 잠재된 의제(토픽)를 파악하는 토픽 모델링 분석 방법을 실시하였다. ‘수돗물 유충’과 관련된 토픽과 주요 키워드를 파악하여, 환경문제에 대한 위기 대응력 제고 방안을 제안하기 위해 수행하였다. 국내에서 처음으로 토픽 모델링 기법을 활용한 연구로써, 비정형 데이터로 나타나는 환경 관련 이슈를 체계적으로 분석했다는 의의가 있다. 국외의 경우 Zheng et al. (2017)은 지표수 수질을 모니터링하기 위하여 WeChat 기반의 WeChat응용 프로그램 플랫폼을 활용하여 수질 모니터링에 적극적인 자원봉사자를 모집하고, 다양한 지표 기반의 모니터링 결과를 포함한 보고서를 수집하여 분석하는 연구를 수행하였다. 제안된 방법은 시민으로부터 수질 데이터를 수집하는 틀을 제공하고 향후 연구에서 빅데이터 분석을 위한 기본 기반을 제공하였다는 점에서 의의가 있다. Ragini et al. (2018)은 재난의 대응과 복구분야에 빅데이터 기반의 감성분석을 적용하였다. 본 연구에서는 재난으로 인해 피해를 입은 사람들의 다양한 기본 욕구에 대한 감정을 시각화하고 분석하는 방법론을 제안하였으며, 소셜미디어 빅데이터의 실시간 분류 및 분류는 효과적인 재난 대응 및 복구에 기여할 수 있음을 결론으로 제시하였다.

본 연구의 목적은 사람들이 쉽게 접할 수 있는 포털의 뉴스 검색 결과를 활용하여 쉽게 분석하지 못하는 상수도 수질 관련 정보를 모아 분석하는 것이다. 빅데이터 기반 수질 사고 분석의 경우 수질사고는 소비자의 신뢰도에 직접적인 영향을 미치므로 소비자의 심리상태를 반영한 기사를 단계에 따라 분석하고, 향후 수질 사고 대응에 활용할 양질의 가치를 획득하는데 그 목적이 있다.

2. 상수도 수질 사고 웹크롤링 및 사후양상 분석 모형

본 연구에서 제안하는 비정형 수질사고 정보의 분석모형은 크게 웹크롤링 과정, 토픽모델링, 그리고 감성분석의 과정으로 구성되며, 그 상세 단계는 Fig. 1과 같다. 웹크롤링은 대상지역과 사고의 키워드를 중심으로 관련된 기사를 자동적으로 수집하는 단계를 의미하며, 감성분석은 웹크롤링된 자료를 활용하여 사건의 진행 단계별 긍부정분석을 실시하는 것이다. 토픽 모델링은 시기별 사고의 주요 의제를 파악하는 것을 의미한다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F1.jpg
Fig. 1.

Flow chart of water quality accident analysis method

2.1 웹크롤링 과정

본 연구에서 웹크롤링을 위해 활용한 검색포털은 네이버로 설정하였으며, 네이버에 게시되는 언론사의 기사 중 총 360개 언론사를 대상으로 검색을 실시하였다. 검색 키워드는 수질에 관련한 사고 건수에 대해 2019년에 발생한 지자체의 이름과 사고로, 즉 “인천 유충”과 같이, 인천 유충 사태의 인천과 사태의 대표적인 단어를 합하여 검색 키워드를 선정하였다. 본 연구는 수질사고 발생이후 사건의 전개양상을 분석하고 그 정도를 감성분석하는 것으로 중복기사를 제외하는 과정은 거치지 않는다. 다만, 1차로 검색된 자료 중 수질사고와 직접적으로 관련이없는 기사는 제외 되도록 불필요한 단어와 어구를 삭제하고, 관련이없는 기사의 내용은 삭제하는 불용어 처리 작업을 수행한다. 본 연구에서는 수질 사고 기사의 정확한 추출을 위해 235개의 불용어를 설정하였다.

본 연구는 ‘인천 유충’ 사태의 뉴스 빅데이터를 분석함으로써, ‘인천 유충’과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고 방안을 제안하기 위해 수행되었다. 분석 기간으로는 2020년 7월 13일부터 2021년 8월 31일까지 보도된 1,992건의 ‘인천 유충’ 관련 뉴스를 대상으로 분석하였다.

2.2 토픽 모델링

본 연구에서는, “인천 유충”과 관련된 뉴스에서 나타난 시기별 의제(토픽)를 파악하는 것이 연구목적이므로 토픽 모델링 분석 방법을 활용하였다. 토픽 모델링은 텍스트 데이터에서 사용된 주제어들의 동시 사용 패턴을 바탕으로, 해당 텍스트들을 대표하는 특정 주제나 이슈, 주제 그룹들을 자동으로 추출하는 분석 기법이다. 특히, 토픽모델링 분석 방법은 텍스트 데이터에서 사용된 주제어들의 동시 사용 패턴을 바탕으로, 해당 텍스트들을 대표하는 특정 토픽이나 이슈, 주제 그룹들을 자동으로 추출하는 분석 기법이다. 뉴스에 잠재된 의제(토픽)를 도출하는 연구에 많이 사용하고 있는 토픽 모델링 기법인 LDA 기법(잠재 디리클레 할당)은 다른 토픽 모델링 기법에 비해 결과 해석이 용이하고, 과적합(Overfitting) 문제를 해결하기 때문에 방대한 비정형 데이터로부터 여러 가지 토픽(프레임)들을 도출하는 데 유리하다. LDA 기법은 데이터로부터 잠재 변인을 유추하고 복잡한 데이터의 차원을 축소해 데이터를 효과적으로 이해하고자 한다는 점에서 탐색적 요인 분석(exploratory factor analysis)과 유사하다(Steyvers and Griffiths, 2007). 그리고 기존의 군집분석 기법과 비교해 볼 때, 다대다 대응이 가능하다는 차이점을 갖고 있다. 즉, 1개의 문서당 1개의 주제만 대응되는 것이 아니라, 여러 가지 주제들을 포함할 수 있다는 측면에서 실제 텍스트의 본질을 잘 반영한다는 장점을 갖고 있다(Kim and Lee, 2016). 또한 토픽 모델링 기법은 Fig. 2와 같이 주제들이 서로 어떻게 연결되어 있고, 시간이 어떻게 변화돼가는지 분석할 수 있는 통계적 방법이다(Blei, 2012).

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F2.jpg
Fig. 2.

Schematic diagram of LDA algorithm (Blog in Analytic Vidhya, 2021)

2.3 감성분석

수질 사고 분석을 통한 가치 추출을 위해 웹 크롤링 진행 후 수집된 뉴스 기사는 각각의 기간에 대해 KNU 감성 사전을 사용하여 전체 뉴스에서 각 긍·부정 단어 점수 산정하여, 긍·부정 비율을 산정하였다. KNU 한국어 감성사전은 Table 1과 같이 1-gram, 2-gram, 어구(n-gram) 그리고 문형 등 다양한 형태의 14,843개의 어떤 도메인에도 사용될 수 있는 보편적인 긍·부정어로 구성되어 있다. KNU 감성사전은 표준국어대사전을 구성하는 각 단어의 뜻풀이를 분석하여 긍부정어를 추출하고, 1-gram, 2-gram, n-gram (어구, 문형), 축약어, 이모티콘 등의 다양한 종류의 긍부정어를 포함한다는 특징이 있어 한국어 감성분석에 많이 활용되고 있다. 긍·부정 분석으로 나타나는 결과는 다음 7가지로 나타난다. 1. 워드크라우드, 2. 연관성, 3. 부정 워드크라우드, 4. 긍정 워드크라우드, 5. 긍·부정 단어 중 가장 높은 빈도를 차지한 상위 10개 단어 그래프, 6. 하나의 기사를 각 긍·부정단어로 점수화하여 0점을 기준으로 긍·부정 기사 분류, 7. 전체 기사의 긍·부정, 중립 퍼센트 시각화로 나타내었다.

Table 1.

Positive/Negative word statistics

Positive/negative Word count
1-gram positive negative 6,223
2-gram positive negative 7,861
positive/negative phrase 278
positive/negative sentence 253
positive/negative abbreviation 174
positive/negative emoticon 54
1-gram positive/negative 6,451
2-gram positive/negative 8,135
3-gram positive/negative 226
4-gram positive/negative 20
5-gram positive/negative 5
6-gram positive/negative 3
7-gram positive/negative 2
8-gram positive/negative 1
very positive (2) 2,597
positive (1) 2,266
Neutral (0) 154
negative (-1) 5,029
very negative (-2) 4,797

3. 적용 및 결과

3.1 수질 사고에 대한 언론 매체 분석

본 연구는 ‘인천 유충’ 사태의 뉴스 빅데이터를 분석함으로써, ‘인천 유충’과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고 방안을 제안하기 위해 수행되었다. 2020년 7월 13일부터 2021년 8월 31일까지 보도된 1,992건의 ‘인천 유충’ 관련 뉴스를 분석 기법인 토픽 모델링 기법으로 분석하였다. 그 결과 언론에서 나타난 사태가 발생기, 확산기, 수습기로 구분하였으며, 5개의 토픽을 각각 선정하여, 환경문제의 발생과 추진과정을 확인할 수 있었다. 분석 결과를 바탕으로 환경문제에 대한 위기 대응 방안을 다음과 같이 제안하였다. 추가로 웹 크롤링으로 구한 데이터들은 감정분석을 통하여 기사 건수에 대한 시민들의 관심도, 그 기간에 따른 긍·부정 비율의 변화, 주요 사건을 그래프 및 표로 표현하여 시각적 자료를 획득하였다.

3.2 토픽 모델링 분석 결과

분석대상 언론 매체는 네이버에서 제공하고 있는 네이버 뉴스의 360개 언론사를 대상으로 크롤링을 이용하여 기사를 수집하였다. ‘인천 유충’이라는 키워드로 검색한 기사를 대상으로 프로그래밍 언어인 R을 활용하여 연구를 실시하였다. 분석 기간은 ‘인천 유충’이 최초 보도되었던 2020년 7월 13일부터 관련 사고 건수가 종료된 시점 이후 1년을 대상으로 진행하였다. 1차 웹크롤링 결과 보도 빈도가 Fig. 3Table 2와 같이 4단계 단계를 기준으로 변화하였고 Table 3과 같이 정부의 사고대응 및 수습양상이 전개되었으므로, 사건전개양상을 4개의 시기로 구분하여 분석했다. 제1기는 7월 13일부터 7월 18일까지, 제2기는 7월 19일부터 7월 26일까지, 제3기는 7월 27일부터 8월 31일까지, 제4기는 9월 1일부터 1년 뒤인 2021년 8월 31일까지다. Fig. 3과 같이 제1기, 제2기, 제3기 후에 기사 건수가 줄어드는 9월 1일 전까지 많은 언론이 보도된 것을 확인할 수 있었다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F3.jpg
Fig. 3.

Reporting trends regarding “Incheon larvae” by date

Table 2.

Number of news cases analyzed for “Incheon larvae” (cases)

Phase 1 Phase 2 Phase 3 Phase 4 Total
First collected news 301 448 478 765 1,992
Exclude news 115 221 318 418 1,072
Analyzed news 186 227 160 347 920
Table 3.

“Incheon larvae” major social issues

Date (2020) Major social issues
07.13 First report of tap water larvae
07.28 Ministry of Environment announces results of nationwide water purification plant inspection
08.02 Incheon City Announces Tap Water Stabilization
07.20 Nationwide spread
08.10 Joint Investigation Team Announces Interim Investigation Results
08.29 Joint Investigation Team Announces Final Investigation Results

인천 유충 사고와 직접적인 관련 기사를 도출하는 정제작업을 통해 분석대상 뉴스 건수는 Table 2와 같이 총 920건으로, 최초 수집된 1,992건에서 중복, 부적합뉴스 1,072건을 제외하였다. 본 연구에서는 R을 통해 수집한 비정형 데이터인 뉴스 기사에 대한 전처리와 형태소 추출이 완료된 데이터를 활용하여 분석을 수행하였다.

본 연구에서 활용한 분석프로그램은 R이며, LDA (Latent Dirichlet Allocation)를 통해 텍스트 분류를 실시하였다. 각 기사별로 출현한 단어의 빈도를 나타낸 행렬로 뉴스 기사에서 추출된 키워드를 LDA분석(α=0.1, β=0.01)을 실시하였다. 적합한 토픽 수를 5개로 선정하였다.

이를 바탕으로 토픽 모델링을 실시하였다. 토픽별로 출현 비율이 높은 순서대로 키워드를 도출한 후 다음과 같은 과정으로 수행하였다. 첫째, 도출된 키워드와 뉴스 기사 원문을 비교하여 어떤 맥락에서 키워드가 사용되었는지 파악했다. 둘째, 토픽별로 도출된 키워드들을 종합적으로 분석하여 토픽명을 부여했다.

3.2.1 제1기 ‘사태 발생기’단계 분석 결과

제1기에 해당되는 2020년 7월 13일부터 7월 18일까지 보도된 인천 유충 관련 뉴스 301건을 분석한 결과, 주요 키워드 간의 연관성 분석 및 네트워크는 Figs. 4 and 5, 토픽은 Table 4와 같이 나타났다. 1기에서는 학교-유충은-피해-민원-불안감 등의 키워드가 공동으로 출현하면서, 수질 환경문제 발생과 시민 공론화 과정, 국민들의 인식 촉발 이 이슈로 부각되어 ‘사태 발생기’로 명명하였다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F4.jpg
Fig. 4.

“Incheon larvae” primary keyword correlation analysis

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F5.jpg
Fig. 5.

“Incheon larvae” 1st major keyword network

Table 4.

Phase 1 Topics and key keywords

Topic
Name
Key
Keywords
Appearance
Rate
Main news Headlines No. of News
Articles
(cases)
Topics
Share
(%)
[Topic 1]
Detect tap
water larva
problems
school 0.004 [School] Suspension of larvae reported in Incheon tap water one
after another
35 18.8
meal service 0.006 Incheon Metropolitan Office of Education decided to suspend
[meal service] due to the Seo-gu tap water larvae incident
tap water 0.006 Incheon [tap water] The cause of detection of larvae is yet to be
identified
investigation 0.003 Incheon tap water larva outbreak authorities [investigation]
tap water 0.003 The larvae found in Incheon [tap water] are midget larvae
[Topic 2]
Safe supply
of tap
water in
Cheonan
larvae 0.006 [Larvae found in Incheon] Midget, 10,000 generations Emergency
Comprehensive
17 9.1
Cheonan City 0.003 [Cheonan City] Safe use without worrying about tap water
safely 0.003 Drink tap water [safely] in Cheonan
enjoy drink 0.002 Cheonan-si tap water is safe [Enjoy drink]
harmful 0.002 Incheon tap water larvae are fungus [harmful], but do not drink
[Topic 3]
Tap water
larva
identity
confirmation
after Corona 0.008 [After Corona] Until the larvae of tap water, Incheon restaurant
cafe owners can’t even buy bottled water
45 24.2
damage 0.002 Ganghwa Seo-do tap water larvae Incheon Seo-gu and other areas
complained of [damage] one after another
Gyeyang 0.002 Incheon tap water larva Seo-gu, Ganghwa [Gyeyang]
Bupyeong-do reported
Seo-gu 0.02 Incheon City [Seo-gu] Held an emergency countermeasure
meeting following the discovery of tap water larvae
Bupyeong-gu 0.002 Insect larvae found in Yeongjong Island tap water following
[Bupyeong-gu] in Seo-gu, Incheon
[Topic 4]
Request to
prevent
recurrence
of tap
water
larvae
incident
complaints 0.006 Insect found at Gongchon Water Purification Plant in Incheon City
[Complaints] Total 101 cases
36 19.4
Incheon City 0.006 United Party [Incheon City] Party requests to prevent recurrence
related to tap water larvae incident and punish those involved
soaring stock
price
0.002 Dissemination of controversy over larvae of characteristic stocks
Related stocks such as New Botech [soaring stock price]
Siheung 0.003 From various places in Incheon to Gyeonggi [Siheung] Hwaseong,
tap water bug larvae are one wave
Gongchon
water purifi-
cation plant
0.002 Except for [Gongchon Water Purification Plant] in Incheon,
the possibility of larvae occurring is small.
[Topic 5]
Tap Water
Larvae
Anxiety
Spreads
anxiety 0.003 Residents of Incheon tap water larvae incident [anxiety] continues to
increase Presumed possibility of inflow from outside in some areas
53 28.5
midget 0.009 Incheon tap water larva shower filter Edo [Midget] Dermatitis concerns
water purifi-
cation plant
0.006 Experts say the Incheon tap water larvae incident is due to poor
management of [water purification plant]
Ganghwado 0.003 Incheon larvae tap water body pain [Ganghwado] came out
anxiety 0.004 Larvae cooked with bottled water attached to restaurants in Incheon
[Anxiety] continues
SUM 186 100

[토픽1]은 ‘학교’, ‘급식’, ‘수돗물서’, ‘조사’, ‘수돗물에서’ 등의 키워드가 도출됨에 따라, 인천 서구 일대 유충 발견에 대한 보도 내용을 고려하여, 토픽명을 ‘수돗물 유충 문제 감지’로 부여하였고, 관련 뉴스건수는 35건(18.8%)이다. [토픽2]는 ‘유충은’, ‘천안시’, ‘안심하고’, ‘드세요’, ‘유해성’ 등의 키워드가 도출됨에 따라, 인천시 등 일부 지자체의 수돗물에 유충이 발생하여 큰 파문을 일으키고 있으나 천안시는 예방조치로 유충 발생 가능성을 최소화하기 위한 총력을 기울인다는 보도내용을 고려하여, 토픽명을 ‘천안시 수돗물 안전 공급’으로 부여하였고, 관련 뉴스건수는 17건(9.1%)이다.

[토픽3]는 ‘이어’, ‘피해’, ‘계양’, ‘서구’, ‘부평구’ 등의 키워드가 도출됨에 따라, 강화군 지역에서도 수돗물에서 유충이 발견됐다는 신고가 접수, 유충이 발견되면서 인천시 긴급 회의 개최 및 현재까지 조치된 사항과 향후 대응 방안 논의 등 보도내용을 고려하여, 토픽명을 ‘수돗물 유충 정체 확인’으로 부여하였고, 관련 뉴스건수는 45건(24.2%)이다. [토픽4]는 ‘민원’, ‘인천시’, ‘급등’, ‘시흥’, ‘공촌정수장’ 등의 키워드가 도출됨에 따라, 민원이 잇따라 제기되고, 박남춘 인천시장의 사과와 재발방지 및 관련자 처벌 요구에 대한 보도 내용을 고려하여, 토픽 명을 ‘수돗물 유충 사태 재발방지 요구’으로 부여하였고, 관련 뉴스 건수는 36건(19.4%)이다. [토픽5]는 ‘불안감’, ‘깔따구’, ‘정수장’, ‘강화도서도’, ‘불안’ 등의 키워드가 도출됨에 따라, 수돗물 내 유충과 관련된 청원이 발생하는 보도 내용을 고려하여, 토픽명을 ‘수돗물 유충 불안 확산’으로 부여하였으며, 관련된 뉴스의 건수는 53건(28.5%)이다.

3.2.2 제2기 ‘사태 확산기’단계 분석 결과

제2기에 해당되는 2020년 7월 19일부터 7월 26일까지 보도된 수돗물 유충 관련 뉴스 448건을 분석한 결과, 주요 키워드 간의 연관성분석 및 네트워크는 Figs. 6 and 7, 토픽은 Table 5와 같이 나타났다. 2기에서는 필터-인천-방지-배수지-총리 등의 키워드가 공동으로 출현하면서, 인천에서 처음으로 발견되면서 논란이 된 ‘수돗물 유충’사태가 전국으로 확산, 관련 신고가 잇따르며 이슈로 부각 되었기에 ‘사태 발생기’로 명명하였다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F6.jpg
Fig. 6.

Analysis of key keyword relations in the 2nd period of “Incheon Larva”

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F7.jpg
Fig. 7.

“Incheon larvae” 2nd major keyword network

Table 5.

2nd term topics and key keywords

Topic Name Key
Keywords
Appearance
Rate
Main news Headlines No. of News
Articles
(cases)
Topics
Share
(%)
[Topic 1]
Bottled
water
sales soar
filter 0.009 Shower [filter] attracts attention as a damage prevention method
after finding tap water larvae
55 24.2
bottled water 0.009 Perhaps...even in my tap water, larvae filter [bottled water] sales
are skyrocketing
sales 0.004 Fear of water brought by tap water larvae Increased amount of
bottled water [sales]
sale
increasing
0.003 Tap water phobia diffusion water filter [sale increasing] for
detecting larvae
rapid
increase
0.003 Sales of bottled water due to tap water larvae outbreak [Rapid increase]
[Topic 2]
Increase in
complaints
about larvae
Incheon 0.03 Investigation of all civil complaints of tap water by the Minister of
Environment..Only [Incheon] found larvae
96 42.3
added 0.004 Incheon tap water larvae that do not shrink [added] 25 cases
cumulative 211 cases
estimated 0.004 Larvae found in water purification plants nationwide [estimated]
that Seoul and Busan were introduced from outside
objects 0.004 Presumably [objects] dead larvae found at Bupyeong Water
Purification Plant, Ministry of Environment, Incheon
tap water 0.003 To Paju [tap water] larva discovery report
[Topic 3]
Establish-
ment of
measures
to prevent
recurrence
prevent 0.001 Instructions to prepare measures to [prevent] the recurrence of
sentinel larvae in tap water
17 7.5
struggle 0.001 Pohang city larvae prevention [struggle]
anxiety 0.002 [Anxiety] heightened due to the spread of tap water larvae
supply 0.0008 Safe and healthy tap water in Cheonan [supply]
focused 0.0008 Toxic tap water larvae complaints to Incheon [focused]..The reason?
[Topic 4]
Special
sanitation
manage-
ment of
water
facilities
reservoir 0.003 Incheon [Reservoir] No larvae found as a result of water quality
monitoring such as the direct water pipe of the meter
29 12.8
no 0.003 Jeollanam-do Waterworks Facilities Special Sanitation Management
Treatment Plants 77 larvae [no]
confirmed 0.006 Cheongju tap water larva report [confirmed] but not found
water
facilities
0.001 Naju City [Water Facilities] Emergency inspection No midget larvae,
all judged suitable
change 0.001 [Change] from open type to closed type at local water purification
plants in Incheon
[Topic 5]
Reinforcing
tap water
manage-
ment
Prime
Minister
0.004 Chung [Prime Minister] Apologies to the public for tap water larvae 30 13.2
Jeong
Sye-gyun
0.003 [Jeong Sye-gyun] Inspecting the response situation of the Bupyeong
water purification plant Apologies to the public for tap water larvae
outbreak 0.003 On-site inspection of Chilseo Water Purification Plant related to
Cho Geun-je Haman-gun City tap water larvae [outbreak]
to the
people
0.003 Prime Minister Chung Sye-gyun Tap Water Larvae [To the people]
The best way to end the billing scandal
safety 0.003 Tap water in Cheongju City [Safety] No midget larvae Reinforced
water purification plant management
SUM 227 100

[토픽1]은 ‘필터’, ‘생수’, ‘판매’, ‘불티’, ‘급증’ 등의 키워드가 도출됨에 따라, 인천 서구 지역을 중심으로 수돗물에서 유충이 나왔다는 신고에 의해 생수 매출이 급증한다는 보도내용을 고려하여, 토픽명을 ‘생수 판매 급증’으로 부여하였고, 관련 뉴스건수는 55건(24.2%)이다.

[토픽2]는 ‘인천’, ‘추가’, ‘추정’, ‘물체’, ‘수돗물서’ 등의 키워드가 도출됨에 따라, 유충 민원이 증가함에 따라 인천 수돗물의 하루 유충 발견량이 줄지 않음, 배수지에서 유충 추정물체 확인되는 보도내용을 고려하여, 토픽명을 ‘전국 정수장에 대한 긴급점검’으로 부여하였고, 관련 뉴스건수는 96건(42.3%)이다.

[토픽3]는 ‘방지’, ‘안간힘’, ‘불안감’, ‘공급’, ‘몰린’, 등의 키워드가 도출됨에 따라, 인천에서 시작된 수돗물 유충 사태의 계속 확산, 수돗물 유충 발생 상황을 점검한 뒤 재발방지 대책 수립에 대한 보도 내용을 고려하여, 토픽 명을 ‘재발방지 대책 수립’으로 부여하였고, 관련 뉴스 건수는 17건(7.5%)이다.

[토픽4]는 ‘배수지’, ‘없어’, ‘종합’, ‘수도시설’, ‘바꾼다’ 등의 키워드가 도출됨에 따라, 가정집에서 수돗물 유충 발견, 정총리가 부평정수장을 찾아 대응상황 점검 보도내용을 고려하여, 토픽명을 ‘수도시설 특별 위생점검’으로 부여하였고, 관련 뉴스건수는 29건(12.8%)이다.

[토픽5]는 ‘총리’, ‘정세균’, ‘발생’, ‘국민께’, ‘안전’ 등의 키워드가 도출됨에 따라, 유충 발생 원인으로 추정되는 활성탄 흡착지와 방충 시설물 등 고도정수처리시설 점검, 배수지 점검반 상시 운영 등 수돗물 관리 강화에 대한 보도 내용을 고려하여, 토픽 명을 ‘수돗물 유충 불안 확산 및 주민 대응’으로 부여하였고, 관련 뉴스 건수는 30건(13.2%)이다.

3.2.3 제3기 ‘사태 수습기’단계 분석 결과

제3기에 해당되는 2020년도 7월 27일부터 8월 31일까지 보도되었던 인천 유충 관련 뉴스 765건을 분석하였다. 분석한 결과, 주요 키워드 간의 연관성 분석 및 네트워크는 Figs. 8 and 9, 토픽은 Table 6과 같이 나타났다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F8.jpg
Fig. 8.

Analysis of key keyword relations in the 3rd period of “Incheon Larvae”

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F9.jpg
Fig. 9.

“Incheon larvae” 3rd major keyword network

Table 6.

Term 3 topics and key keywords

Topic
Name
Key
Keywords
Appearance
Rate
Main news Headlines No. of News
Articles
(cases)
Topics
Share
(%)
[Topic 1]
Free
emergency
support for
affected
areas
support 0.01 Emergency supply of 22,400 bottles of Jeju Samdasoo to the
central region affected by torrential rains [Support]
47 29.4
emergency 0.007 Jeju Samdasoo [emergency] support for areas affected by
torrential rains
provide 0.004 Kwangdong Pharmaceutical [Provides] 10,000 bottles of Corn
Silk Tea and Guangdong Hengae Tea to flood victims
jeju lava
water
0.003 Donated [Jeju lava water] to Orion Group Incheon schools
Orion 0.003 [Orion] donated Jeju lava water to schools in Seo-gu, Incheon of
the Orion Group
[Topic 2]
Started tap
water safety
service
Suwon City 0.003 [Suwon City] Providing safe tap water services to the vulnerable 14 8.8
visiting 0.002 Launched [Visiting] tap water safety service for female households
in vulnerable groups in Suwon
safe service 0.002 Tap water [Safe service] for the vulnerable in Suwon
vulnerable
class
0.001 Suwon City [Vulnerable Class] Visiting Tap Water Safety Service
prevent 0.002 Continued efforts to [prevent] recurrence after stabilizing tap
water in Incheon
[Topic 3]
Smart pipe
network
management
infrastructure
construction
project
smart 0.003 Buan-gun [Smart] Secured 4.9 billion won to build pipe network
management infrastructure
14 8.8
promotion 0.003 Incheon Peace and Welfare Solidarity Namchon Industrial Complex
[Promotion] Call for suspension
infrastructure 0.002 Signal Inequality and Greens from Incheon Tap Water Larvae
[Infrastructure]
Buan-gun 0.002 [Buan-gun] Establish a smart management system that incorporates
technology throughout the entire process of tap water supply
water supply
network
management
0.002 Buan-gun smart [water supply network management] infrastructure
construction project selection
[Topic 4]
Additional
confirmation
of Incheon
midget larvae
found 0.007 Ministry of Environment tap water larvae survey No problem,
only some filters [found]
69 43.1
Water
Environment
Management
Division
0.002 Jeonbuk-do Innovative Hero of the Month [Water Environment
Management Division] Park Ji-yong selected
cumulative 0.002 Incheon tap water confirmed 2 additional cases of midget larvae
[cumulative] 254 cases
Uijeongbu 0.002 [Uijeongbu City] Complaints about caterpillars have nothing to do
with the tap water supply system
water
treatment
plant
0.01 Minister of Environment [Water Treatment Plant] Examination of
Researcher Placement to Reinforce Professionalism Qualification
Exam
[Topic 5]
Buan-gun
water
supply
facility
inspection
Buyeo-gun 0.002 [Buyeo-gun] Inspection safety of major waterworks facilities 16 10
facility 0.002 Buyeo-gun water supply main [facility] emergency inspection
main 0.002 Hong Seok-bong Yeonggwang-bu-gun water purification plant
[main] facility inspection
eco-friendly 0.001 Jeju Samdasoo Social Contribution [Eco-friendly] Efforts Minister
Award Result
pollution
mearsures
0.001 Lee Dong-eop, Gyeongbuk Provincial Councilor Urges
[pollution measures] for heavy metals in the Hyeongsan River
SUM 160 100

3기에서는 지원-수원시-스마트-발견-부여군 등의 키워드가 공동으로 출현하면서, 환경부에서 실시한 전국 정수장 전수조사 결과에서는 이상이 없었음에도 유충이 추가로 발견되었고, 수돗물 유충 원인규명과 국민의 알권리를 위 한 정보의 제공 및 교육 그리고 수돗물에 대한 신뢰 회복이 필요하다는 것을 보여주는 이슈가 부각 되었기에 ‘사태 발생기’로 명명하였다.

[토픽1]은 ‘지원’, ‘긴급’, ‘광동제약’, ‘제주용암수’, ‘오리온’ 등의 키워드가 도출됨에 따라, 수돗물 유충 발생 사건으로 피해를 입은 인천 지역 등지에 제주삼다수 전달 대한 보도내용을 고려하여, 토픽명을 ‘피해지역 긴급 무상지원’으로 부여하였고, 관련 뉴스건수는 47건(29.4%)이다. [토픽2]는 ‘수원시’, ‘찾아가는’, ‘안심서비스’, ‘최약계층’, ‘방지’ 등의 키워드들이 도출됨에 따라, 상수도사업소가 ‘정보 취약계층’을 대상으로 안전하게 수돗물을 이용할 수 있도록 찾아가는 서비스를 제공하는 보도 내용을 고려하여, 토픽 명을 ‘수돗물 안심서비스 개시’으로 부여하였고, 관련 뉴스 건수는 14건(8.8%)이다. [토픽3]는 ‘스마트’, ‘추진’, ‘인프라’, ‘부안군’, ‘관망관리’ 등의 키워드가 도출됨에 따라, 환경부에서 실시한 스마트 관망관리 인프라 구축사업에 대한 보도 내용을 고려하여 토픽명을 ‘스마트 관망관리 인프라 구축사업’으로 부여하였고, 관련 뉴스건수는 14건(8.8%)이다. [토픽4]는 ‘발견’, ‘무관’, ‘누적’, ‘의정부시’, ‘정수장’ 등의 키워드가 도출됨에 따라, 전국 일반정수장 435곳을 전수 조사, 인천 수돗물서 깔따구 유충 추가 확인에 대한 보도내용을 고려하여, 토픽명을 ‘인천 서구 학교 생수 지원’로 부여하였고, 관련 뉴스건수는 69건(43.1%)이다. [토픽5]는 ‘부여군’, ‘시설물’, ‘주요’, ‘친환경’, ‘오염대책’ 등의 키워드가 도출됨에 따라, 부여군은 최근 인천 수돗물에서 유충이 발견됨에 따라 관내 상수도 시설물에 대한 일제 점검 실시에 보도내용을 고려하여, 토픽명을 ‘부안군 상수도 시설물 일제 점검’으로 부여하였고, 관련 뉴스건수는 16건(10%)이다.

3.2.4 제4기 ‘사태 보상’단계 분석 결과

제4기에 해당되는 2020년 9월 1일부터 2021년 8월 31일까지 보도된 인천 유충 관련 뉴스 1,992건을 분석한 결과, 주요 키워드 간의 연관성분석 및 네트워크는 Figs. 10 and 11, 토픽은 Table 7과 같이 나타났다.

4기에서는 공급-수질관리-유충-덕적도-박남준 등의 키워드가 공동으로 출현하면서, 9월 수돗물 위생관리 종합대책 발표가 부각되어 ‘사태 보상’으로 명명하였다.

[토픽1]는 ‘공급’, ‘연휴’, ‘진주시’, ‘붉은’, ‘생산’ 등의 키워드가 도출됨에 따라, 인천시 ‘붉은 수돗물(적수)’ 사태 등으로 추락한 시민의 신뢰를 회복에 나서는 보도 내용을 고려하여, 토픽명을 ‘시민의 신뢰 회복’으로 부여하였고, 관련 뉴스건수는 80건(23.1%)이다.

[토픽2]는 ‘수질관리’, ‘옛말’, ‘세미나’, ‘샤워기’, ‘찾아가는’ 등의 키워드가 도출됨에 따라, 경북도의 ‘스마트 관망관리 인프라 구축사업’ 추진, 서울시 상수도사업본부가 상수도 공급계통 수질관리 강화방안 마련을 위한 온라인 공개 세미나 개최에 대한 보도 내용을 고려하여, 토픽명을 ‘상수도 수질관리 방안 마련’로 부여하였고, 관련 뉴스건수는 25건(7.2%)이다. [토픽3]는 ‘유충’, ‘깔따구’, ‘제주’, ‘발견’, ‘유입’ 등의 키워드가 도출됨에 따라, 환경당국이 제주 수돗물 유충 사태를 계기로 지역 특성에 맞는 정수시설 관리 매뉴얼 마련 검토, 제주 수돗물 유충 발견 신고에 대한 보도 내용을 고려하여, 토픽명을 ‘제주도 유충 발견 신고’으로 부여하였고, 관련 뉴스건수는 162건(46.7%)이다. [토픽5]는 ‘박남준’, ‘투입’, ‘인천시장’, ‘부산’, ‘예산’ 등의 키워드가 도출됨에 따라, 환경부가 지난 7월 인천지역에서 발생한 수돗물 유충 사태와 같은 사고를 예방하고 기후변화·환경위기에 대한 대응력을 강화하기 위해 내년도 예산 1조715억 원 투입에 대한 보도 내용을 고려하여, 토픽명을 ‘유충 사태 방지 방안 마련’으로 부여하였고, 관련 뉴스건수는 56건(16.1%)이다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F10.jpg
Fig. 10.

Analysis of key keyword relations in the 4th period of “Incheon Larvae”

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F11.jpg
Fig. 11.

“Incheon larvae” 4th major keyword network

Table 7.

4th Topic and key keywords

Topic
Name
Key
Keywords
Appearance
Rate
Main news Headlines No. of News
Articles
(cases)
Topics
Share
(%)
[Topic 1]
Restoring
public trust
supply 0.009 Ministry of Environment Tap water sanitation management
innovation throughout the entire process [Supply]
80 23.1
holidays 0.003 Chuseok [holidays] Emergency treatment situation room operated
Jinju City 0.003 [Jinju City] Inspection of the water purification plant in preparation
for the red tide of the council No abnormality in tap water
red water 0.002 Incheon City [red water] after removing the stigma of tap water and
restoring trust
production 0.002 Jinju-si Chuseok holiday stable tap water [production] supply
all-out efforts
[Topic 2]
Preparation
of water
quality
management
plan
water quality
management
0.002 Lee Seon-gu, member of Gyeonggi-do Province, urges thorough
tap water [water quality management]
25 7.2
old word 0.001 Capital Green Water Now [old word] 131.6 Billion Invested to
Build Smart Pipeline Management in Gyeongbuk Province
seminar 0.001 Real-time disclosure of Seoul’s tap water quality management solution
[Seminar]
shower tap 0.0009 Growing Subscription Economy Detergent Seedlings [Shower tap]
Expansion of items with filters
visiting 0.0009 Held [Visiting] customer meeting to increase reliability of
tap water in Osan
[Topic 3]
Jeju Island
larva
discovery
report
larvae 0.03 Minister of Environment Jeju’s tap water [larvae] incident needs a
customized manual for the region
162 46.7
midjet 0.009 [Midget] larvae found at a local water purification plant
Jeju 0.008 Environment Minister Cho Myung-rae [Jeju] is also conducting a
comprehensive investigation into the regret of the caterpillar incident
discovered 0.004 Jeju Island tap water larvae are different from those [discovered]
in Incheon.
enter 0.003 [Enter] due to localized heavy rain
[Topic 4]
-
Deokjeokdo 0.004 Airborne control is useless [Deokjeokdo] Pest control is still active 24 6.9
control 0.003 Early monitoring Timely [control] Minimizing forest damage
through prompt response
disease and
pest
0.002 Deokjeok Island, Ongjin-gun, Incheon-si [disease and pest] Control by
air control
Ongjin-gun 000.2 Incheon [Ongjin-gun] Deokjeokdo Island forest disease and pest
control and all-out response to tree water restoration
disease and
pest
prevention
0.001 Ongjin-gun, Deokjeok-do forest [disease and pest prevention]
[Topic 5]
Preparation
of measures
to prevent
larvae
Park
Nam-chun
0.004 Visiting the water purification plant [Park Nam-chun] Mayor of
Incheon
56 16.1
input 0.003 Ministry of Environment Incheon tap water caterpillar incident
prevention, etc. Trillion won next year [input]
Mayor of
Incheon
0.002 Park Nam-chun [Mayor of Incheon] Conducts on-site inspection for
safe and clean tap water supply
Busan 0.002 Water purification plant tap water food handling measures to
prevent larvae in [Busan]
budget 0.002 Ministry of Environment, the largest trillion won ever [budget]
Organized Society Kim Ji-won
SUM 347 100

3.3 감정분석 결과

3.3.1 제1기 ‘사태 보상’단계 감정분석 결과

“인천 유충” 사태의 제1기(2020년 7월 13일부터 7월 18일)까지 보도된 인천 유충 관련 뉴스 218건을 감정분석한 결과는 Fig. 12와 같다. “인천 유충” 사태 제1기의 경우 수돗물 유충 발생으로 인해 학교 급식 중단 및 수돗물 유충 원인 파악하는 보도내용이 주를 이루고 있다. 유충이라는 단어가 1,967번으로 가장 많이 출현하고, 그 다음 수돗물(1,792번), 서구(770번), 발견(593번) 순으로 단어가 출현한 것으로 확인할 수 있다.

연관성 분석의 경우 Fig. 12와 같이, 유충, 수돗물, 인천, 서구, 발견, 인천시순으로 연관성이 큰 것을 확인할 수 있다. “인천 유충”에 관련된 218건의 뉴스기사중 긍·부정 기사는 각각 12.8%, 41.6%로 제1기에 대해 부정적인 것을 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F12.jpg
Fig. 12.

“Incheon larvae” first stage emotional analysis result

3.3.2 제2기 ‘사태 보상’단계 감정분석 결과

“인천 유충” 사태의 제2기(2020년 7월 19일부터 7월 26일)까지 보도된 인천 유충 관련 뉴스 224건을 감정분석한 결과는 Fig. 13과 같다. “인천 유충” 사태 제2기의 경우 수돗물 사고로 인한 관내 정수장 긴급 점검 및 수돗물 유충에 의한 피해 발생과 관련된 보도내용이 주를 이루고 있다. 유충이라는 단어가 2,709번으로 가장 많이 출현하고, 그 다음 수돗물(1,614번), 발견(1,043번), 정수장(774번) 순으로 단어가 출현한 것으로 확인할 수 있다.

연관성 분석의 경우 Fig. 13과 같이, 유충, 수돗물, 인천, 발견순으로 연관성이 큰 것을 확인할 수 있다. “인천 유충”에 관련된 591건의 뉴스기사중 긍·부정 기사는 각각 20.6%, 37.5%로 제1기에 비해 긍정적인 기사가 증가한 것을 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F13.jpg
Fig. 13.

“Incheon larvae” 2nd stage emotional analysis result

3.3.3 제3기 ‘사태 보상’단계 감정분석 결과

“인천 유충” 사태의 제3기(2020년 7월 27일부터 8월 31일)에 보도된 인천 붉은 물 관련 뉴스 63건을 감정분석한 결과는 Fig. 14와 같다. “인천 유충” 사태 제 3기의 경우 환경부 전국 정수장 전수조사 결과와 수돗물 유충 원인규명에 대한 보도내용이 주를 이루고 있다. 유충이라는 단어가 1,481번으로 가장 많이 출현하고, 그 다음 수돗물(1,378번), 정수장(434번), 발견(424번) 순으로 단어가 출현한 것으로 확인할 수 있다.

연관성 분석의 경우 Fig. 14와 같이, 유충, 수돗물, 인천순으로 연관성이 큰 것을 확인할 수 있다. “인천 유충”에 관련된 63건의 뉴스기사중 긍·부정 기사는 각각 29.4%, 29.4%로 제1, 2기에 비해 긍정적인 기사가 증가한 것을 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F14.jpg
Fig. 14.

“Incheon larvae” 3rd stage emotional analysis result

3.3.4 제4기 ‘사태 보상’단계 감정분석 결과

“인천 유충” 사태의 제4기(2019년 7월 15일부터 2020년 9월 30일)까지 보도된 인천 유충 관련 뉴스 1,204건을 감정분석한 결과는 Fig. 15와 같다. “인천 유충” 사태 제4기의 경우 수돗물 위생관리 종합대책 발표에 대한 보도내용이 주를 이루고 있다. 예산이라는 단어가 48번으로 가장 많이 출현하고, 그 다음 인천(40번), 내년(35번), 수돗물(35번) 순으로 단어가 출현한 것으로 확인할 수 있다.

연관성 분석의 경우 Fig. 15와 같이 수돗물, 유충, 정수장순으로 연관성이 큰 것을 확인할 수 있다. “인천 붉은 물”에 관련된 1.204건의 뉴스기사중 긍·부정 기사는 각각 70.6%, 17.6%로 제1, 2, 3기에 비해 긍정적인 기사가 급격하게 증가한 것을 확인할 수 있다.

종합적 분석 결과, 수질사고와 같이 소비자의 삶에 직접적인 영향을 미치는 사건은 뉴스 기사 언론보도의 논조 및 소비자의 긍부정도가 시간에 따라 명확히 변화됨을 확인할 수 있었다. 특히, 또한, 분석 기간에 대한 감정분석을 진행할 때, 보상단계로 진행될수록 긍정도가 상승하는 것을 직접확인하였다. 이것은 공급자 입장에서의 수질사고의 전개양상은 시설물의 빠른 복구도 매우 중요하지만 소비자의 긍정도를 높이기 위한 소비자 중심의 사고 대응과 복구 관련 정책마련의 필요성을 제시하고 있다.

https://cdn.apub.kr/journalsite/sites/kwra/2022-055-12S/N020055S-107/images/KWRA_2022_55S-1_1235_F15.jpg
Fig. 15.

“Incheon larvae” 4th stage emotional analysis result

4. 결 론

본 연구에서는 웹 크롤링 방법을 이용한 자료수집, 텍스트 마이닝을 활용한 데이터 분석과 같은 빅데이터 분석기법을 이용하여 국내 상수도 수질 사고에 대한 전개양상 분석을 수행하였다. 상수도 시스템의 수질사고 빅데이터 뉴스의 추출을 위한 웹크롤링 기법을 적용하고 정확한 수질사고 뉴스를 획득하고자 알고리즘을 절차화하여 제시하였다. 또한 대규모 수질사고의 경우 사고발생에 따른 사고인지, 사고확산, 사고대응, 사고해결 등과 같은 전개양상이 나타나므로, 각 단계에 따른 적절한 뉴스기사를 추출하고, 이에 따른 정보분석을 실시하였다. 360개의 언론에서 보도하는 뉴스 기사를 분석대상으로 결정하고, 수질 사고 분석 기간으로는 수질 사고가 최초 언론에 보도된 기간부터 사태가 종료된 이후 1년간의 기간을 각각 선정하였다. 수질 사고는 “인천 유충”이라는 키워드를 이용하여 수집한 기사에 대해 주요 기사에 대한 분석 기간을 설정하여 진행 및 각각의 기간에 대해서 분석을 진행하였다.

분석한 방법은 토픽 모델링 기법을 활용하였으며, 분석 결과로는 각 사태마다 나누었던 기간에 대해 주요 키워드를 출현 비율에 따라 각각의 토픽 명이 군집에 따라 의제를 파악할 수 있었으며, 토픽별 키워드 간에 연결된 의미관계는 한계가 존재한다는 것을 알 수 있었다. 처음 관련 뉴스 기사가 언론이 되었을 때와 인식이 좋아지는 시점부터 점차 언론보도가 감소하는 것으로 나타났다. 또한, 분석 기간에 대한 감정분석을 진행할 때, 보상단계로 진행될수록 긍정도가 상승하는 것으로 도출되었다. 추후 연구에서는 과거 유사 사건을 분석하여 적절한 대응과 만족스러운 보상과정을 진행할 수 있을 것으로 판단되어, 기사의 기간을 늘리거나 긍·부정 검사에 더 세세한 기준을 마련하여 편향된 감정평가 데이터를 방지할 수 있고, 더욱 정교하게 발전시킨다면 좀 더 실증적인 결과 데이터가 나타날 것이다. 이와 같은 웹 크롤링을 통한 대규모 사고 또는 재해발생에 대한 피해자 또는 소비자의 긍부정도의 조사기법 및 결과는 방재의 관점에서 위기상황 발생 이후의 대응과 복구 세부전략을 명확히 결정하고, 시민의 정서적 피해 등을 고려한 시민관점의 대응과 복구가 가능하게 되는 기초자료로의 활용이 가능하다.

Acknowledgements

본 결과물은 환경부의 재원으로 한국환경산업기술원의 지능형 도시수자원 관리사업의 지원을 받아 연구되었습니다(2019002950002).

Conflicts of Interest

The authors declare no conflict of interest.

References

1
Analytic Vidhya (2021). Part 3: Topic Modeling and Latent Dirichlet Allocation (LDA) using Gensim and Sklearn, accessed 1 October 2022, <https://www.analyticsvidhya.com/blog >.
2
Blei, D.M. (2012). “Probabilistic topic models.” Communications of the ACM, Vol. 55, No. 4, pp. 77-84. 10.1145/2133806.2133826
3
Kim, J.S., and Lee, S.J. (2016). “Revisiting the cause of unemployment problem in Korea’s labor market: The job seeker’s interests-based topic analysis.” Management & Information Systems Review, Vol. 35, No. 1, pp. 85-116. 10.29214/damis.2016.35.1.005
4
Kim, S.T., and Lee, C.H. (2007). “A study on the media coverage of public issue: Focusing on drinking-water issues.” Korean Journal of Communication and Information, Vol. 39, pp. 40-68.
5
Lee, S.Y., and Kim, T.J. (2020). “News big data analysis of ‘Tap Water Larvae’ using topic modeling analysis.” The Journal of the Korea Contents Association, Vol. 20, No. 11, pp. 28-37.
6
Ragini, J.R., Anand, P.R., and Bhaskar, V. (2018). “Big data analytics for disaster response and recovery through sentiment analysis.” International Journal of Information Management, Vol. 42, pp. 13-24. 10.1016/j.ijinfomgt.2018.05.004
7
Steyvers, M., and Griffiths, T. (2007). Probabilistic topic models. Handbook of Latent Semantic Analysis. Psychology Press, London, England, pp. 439-460.
8
Zheng, H., Hong, Y., Long, D., and Jing, H. (2017). “Monitoring surface water quality using social media in the context of citizen science.” Hydrology and Earth System Sciences, Vol. 21, No. 2, pp. 949-961. 10.5194/hess-21-949-2017
페이지 상단으로 이동하기