• Title/Summary/Keyword: 뉴스 데이터 분석

Search Result 389, Processing Time 0.034 seconds

The Analysis of the Recent News on Domestic Drought Situation by National Drought Information-Analysis System (국가가뭄정보분석시스템을 활용한 최근 가뭄관련 언론현황 분석 및 고찰)

  • Lee, Ho Sun;Chun, Gun Il;Park, Jae Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.340-340
    • /
    • 2017
  • 최근 전 세계적으로 기후변화로 인한 가뭄이 빈번히 발생하고 있으며 우리나라도 '14~'15년 장기화된 가뭄으로 인해 많은 어려움을 겪었다. 이러한 가뭄은 비교적 느린 속도로 진행되고 그 영향이 복잡하게 나타나기 때문에 적절한 사전대응이 이루어지지 않으면 상당한 피해를 겪게 된다. 최근 기존 수자원 정보의 수집과 분석을 탈피해서 다른 사회 시스템과의 연계 추진하는 빅데이터 개념의 적용시도가 이루어지고 있다. K-water 국가가뭄정보분석센터에서는 가뭄의 사전인지와 영향평가의 보조적인 수단으로서 뉴스를 활용하는 방법론을 도출하고 이를 시스템에 구현하여 적용하여 활용성을 분석하였다. 언론(뉴스)정보는 가뭄의 발생, 영향, 대응 등을 포괄적으로 검색할 수 있도록 가뭄진행 순서에 따라 가뭄징조 및 예측, 가뭄발생, 가뭄영향, 가뭄대응, 가뭄대비 및 해소 관련 5개 카테고리와 이와 관련된 69개 세부 키워드로 구분하고 이를 시스템에 반영하였다. 빅데이터 기능을 적용하여 인터넷 뉴스를 해당키워드를 적용해 자동으로 수집할 수 있도록 하였으며 중복되거나 관련 없는 뉴스를 제외하고 이를 다시 발생지역으로 공간 구분하여 GIG 맵에 표출될 수 있도록 구축하였다. 구축된 시스템을 활용하여 '16년을 대상으로 수집된 총 448건의 뉴스자료를 분석한 결과 시스템에 구축되어 있는 '16년 용수공급체계를 반영한 가뭄평가결과와 발생위치, 발생시기, 피해내용 등이 '16년 물수급 현황을 잘 나타내는 것으로 나타났다. 향후 센터에서는 뉴스이외에 소셜미디어와 SNS등에서 다양한 가뭄관련정보를 빅데이터 수집방식에 의해 확보하고 이를 가뭄인자와 영향평가에 대한 참고자료로서 활용하기 위한 방안과 시스템 적용을 통한 검증을 지속적으로 진행할 예정이다.

  • PDF

AI-based language generation model analysis (인공지능 기반의 언어 생성 모델 분석)

  • Lee, Seung Cheol;Jang, Yonghun;Park, Chang-Hyeon;Seo, Yeong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.519-522
    • /
    • 2020
  • 1989년에 WWW(World Wide Web)이 도입 되면서 세계적으로 인터넷의 보급이 시작되었다. 정보화 시대라고 알려진 3차 산업혁명 이후로 대량의 정보들이 소셜 미디어를 통하여 생산되었다. 소셜미디어는 2007년에 인터넷 사용자들 중 56%의 이용률을 보였지만 2008년 2분기에는 75%의 이용률로 증가함에 따라 대부분의 사용자들이 많이 사용하며 의존하게 되었다. 또한 소셜 미디어를 통해 발생 되는 데이터들을 이용하여 기업들은 이윤 창출을 할 수 있다. 하지만 이러한 소셜 미디어는 악의적인 목적을 통해 주가 조작, 정치적 선동 등을 할 수 있는 가짜 뉴스와 허위 정보들을 생성할 수 있으며 이에 따라 대책이 시급하다. 또한 가짜 뉴스는 사람이 글을 작성할 수도 있지만 최근 인공지능 기술의 발달에 따라 프로그램을 통해 자동적으로 생성 될 수도 있다. 본 논문에서는 이와 같은 실제 뉴스와 인공지능을 기반으로 한 뉴스를 분석한다. Kaggle에서 실제 뉴스 데이터를 수집하여 헤드라인을 OpenAI의 GPT-2 언어 모델을 통해 뉴럴 가짜 뉴스를 생성 하였다. 파이썬의 NLTK 모듈을 이용하여 전처리를 진행하였고 t-검정과 박스 플롯을 활용하여 분석을 진행하였다. 분석된 주요 속성들을 의사결정트리를 통해 모델 검증을 하였고 k-fold 교차검증을 통해 분류 모델을 평가하였다. 결과로 전체 분류 정확도 평균 89%의 성능을 보여주었다.

Automatic Detection of Anchorperson Shots for News Video Abstraction (뉴스 동영상 요약을 위한 앵커 장면 자동 추출 알고리즘)

  • 정진국;이태연;낭종호;김경수;하명환;정병희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.274-276
    • /
    • 2001
  • 최근 많이 사용되는 대용량의 뉴스 비디오의 편리한 검색 및 관리 방법이 필요하게 되면서 뉴스 비디오 데이터를 자동으로 분석하여 저급 수준의 정보로부터 고급 수준의 내용 정보를 자동으로 추출하는 기술이 필요하게 되었다. 특히 뉴스를 요약하는데 있어서는 이런 기술이 더 유용하게 쓰일 수 있다. 앵커, 그래픽, 인터뷰, 기자보도, 회견/연설 장면 등이 뉴스 비디오의 고급 수준 내용 정보가 될 수 있는데 그 중에서도 앵커 장면은 뉴스의 기사를 나누는 고급 수준의 정보로서 중요한 의미를 갖게 된다. 본 논문에서는 이러한 앵커 장면을 자동으로 추출하는 방법을 제안한다. 앵커 장면의 공통된 특징을 이용하여 검출하게 되는데 첫 번째 특징은 한 뉴스 프로그램을 진행하는 앵커는 동일하다는 점이고 두 번째 특징은 동일한 스튜디오 안이라는 점이다. 본 논문에서는 앵커를 판별하는 방법으로 얼굴의 검출방법과 옷 색깔의 히스토그램 비교방법을 이용한다. 본 논문의 알고리즘을 여러 개의 KBS 9시 뉴스 비디오 데이터에 적용하여 실험한 결과 Recall과 Precision 모두 96% 이상 나오는 것을 알 수 있었다.

  • PDF

News Clipping System Through Dynamic Data Extraction (동적 데이터 추출을 통한 뉴스 클리핑 시스템)

  • 전호철;신성혁
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.727-730
    • /
    • 2003
  • 인터넷의 빠른 보급으로 많은 양의 정보가 유통되기 시작했다. 그러나 사용자들은 필요한 정보들을 취사 선택하기엔 정보들은 양이 너무 방대하다. 각종 사이트에 있는 뉴스들을 실시간으로 사용자들에게 필요한 정보를 제공할 수 있는 뉴스 클리핑은 이러한 사용자들의 요구를 충족할수 있다 하지만 기존의 뉴스 클리핑 시스템은 각 사이트에 접근 후, 수동적인 분석을 통해 뉴스 정보 및 뉴스 기사의 위치를 파악하고 이를 추출하도록 하는 시스템들이다. 본 논문에서 제안하고자 하는 시스템은 사이트의 구조를 파악하고, 뉴스 기사들을 동적으로 추출함으로써 기존 시스템의 단점을 극복하고, 내용 기반의 뉴스기사 검색이 가능하도록 한다.

  • PDF

Reproduction of drought index using news big data analysis (뉴스 빅데이터 분석을 활용한 가뭄지수 재생산)

  • Jung, Jin Hong;Park, Dong Hyeok;Ahn, Jae Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.386-386
    • /
    • 2020
  • 가뭄은 강수, 증발산, 대기온도, 토양수분 등 다양한 수문기상학적 인자들이 복합적으로 작용하여 발생되기 때문에 가뭄의 정확한 사상을 분석하는 것은 매우 어렵다. 또한 어떤 요인을 중심으로 고려하느냐에 따라 가뭄은 다양한 시각으로 정의되고 있다. 일정기간 평균 강수량보다 적은 강수로 인해 건조한 날이 지속되는 것, 즉 기상요소를 중심으로 가뭄을 정의하는 것을 기상학적 가뭄이라 하며, 작물의 생육에 필요한 수분을 중심으로 고려하는 것을 농업적 가뭄이라 한다. 또한 하천유량, 댐 저수량 등 전반적인 수자원 공급원의 부족을 수문학적 가뭄이라 한다. 이와 같이 다양하게 나타는 가뭄의 발생특성을 정량적으로 해석하기 위해 다양한 가뭄지수가 개발되어 왔다. 그러나 현재까지 개발된 가뭄지수들은 공통적으로 정형데이터를 활용하여 산정한다. 하지만 최근에는 비정형데이터를 활용하여 지수(Index)를 산정하거나, 재난관리에 적용하는 등 비정형 데이터의 활용이 급증하고 있다. 따라서 본 연구에서는 비정형 데이터(뉴스 데이터)를 활용하여 가뭄지수를 산정하고 기존의 가뭄지수들과의 상관성 분석을 실시 한 뒤, 지수결합을 통해 가뭄사상 분석의 새로운 방안을 제시하고자 하였다. 본 연구의 공간적범위는 2014~2015 충남서북부가뭄 지역 중 가장 큰 피해를 입었던 보령지역으로 선정하였으며 시간적범위는 2013~2016년으로 설정하였다. 비정형 데이터의 구축은 크롤링(Crawling)을 활용하여 네이버 뉴스의 기사를 수집하였으며 자료의 신뢰성을 위해 URL이 동일한 중복기사 및 '보령', '가뭄' 단어가 없는 기사는 제거하였다. 구축된 데이터를 기반으로 월별 빈도를 산출하고 표준점수(Z-score)로 환산하여 가뭄지수를 산정하였다. 산정된 가뭄지수가 어떤 가뭄의 유형(기상학적, 농업적, 수문학적)을 보이는지 확인하기 위해 기존의 가뭄지수들과 상관성분석을 실시하였으며, 가장 높은 상관성을 보이는 가뭄지수와 결합을 통해 새로운 가뭄 사상을 분석하였다. 본 연구에서 진행한 가뭄사상 분석은 향후 가뭄만이 아니라 다양한 재난분야에서 비정형 데이터를 활용한 분석의 기초로자료로 활용될 수 있을 것이다.

  • PDF

News Big Data Analysis on Disaster Warning Text Message (재난문자에 대한 뉴스 빅데이터 분석)

  • Lee, Hyun-Ji;Byun, Yoon-Kwan;Choi, Seong-Jong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.194-196
    • /
    • 2019
  • 본 연구에서는 재난문자에 대한 뉴스양과 주요 이슈에 대해 알아보았다. 뉴스 빅데이터 서비스인 빅카인즈를 통해 분석을 실시한 결과, '재난문자' 관련 뉴스가 2016년에 186건으로 전년대비 약 18.6배 증가하는 급격한 성장세를 보였다. 이후 '재난문자' 관련 뉴스는 높은 수치를 유지하는 것으로 나타났다. 지진이 다른 재난에 비해 많은 비중을 차지하였지만 지진이 다수를 차지한 2016년 대비 2017년과 2018년은 지진 외에 다양한 재난에 대해 다루어졌다. 그리고 '재난문자' 연관어 중 행정안전부(국가안전처, 행안부 용어 포함)가 가장 비중 있게 다루어졌고, 기상청과 국민도 비중 있게 다루어진 용어로 나타났다.

  • PDF

COVID-19 News Analysis Using News Big Data : Focusing on Topic Modeling Analysis (뉴스 빅데이터를 활용한 코로나19 언론보도 분석 :토픽모델링 분석을 중심으로)

  • Kim, Tae-Jong
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.5
    • /
    • pp.457-466
    • /
    • 2020
  • The purpose of this study is to find out what the main agenda of social formation is and how it changes through the media by utilizing the news big data of COVID-19 which is spreading recently, and to suggest the direction of future reporting. In order to achieve the purpose of the research, 47,816 cases of news big data reported from December 31, 2019 to March 11, 2020 were divided into four periods based on the fourth stage of the crisis warning for infectious diseases, and a total of 20 topics were derived. Based on the results of the Topic Modeling analysis, this study proposed the following. First, it is necessary to refrain from provocative expressions such as "anxiety" and "fear" and use neutral and objective reporting terms. Second, more in-depth and contextual news production is required, breaking away from simple event news production. Third, it is necessary to prepare detailed crisis communication manuals for each situation related to infectious diseases. Fourth, we need reports that focus on citizens-led efforts to overcome the crisis. This research has the academic significance that it is the first paper to analyze news big data on COVID-19 using the Topic Modeling Analysis method, and the policy significance that can be used as the basis for developing national crisis communication policy.

A Study on the redesign Oh my News article metadata (오마이뉴스 기사 메타데이터 재설계방안에 관한 연구)

  • Jeong, Seong-Suk
    • The Korean Journal of Archival Studies
    • /
    • no.34
    • /
    • pp.107-163
    • /
    • 2012
  • The share of the internet has grown significantly in terms of usage and level of influence. Among the internet media, OhmyNews is considered a alternative media representing Korea's independent internet news, and a typical example displaying characteristics of the internet news. The processing step can be divided as five stage, with recorded information and applicable technical element extractable from each stage. In this thesis paper, we have analyzed domestic and overseas metadata standard examples to devise metadata design plans. Items to be focused when redesigning metadata based on domestic and foreign case studies are as follows: First, user access should be convenient; second, connection with related information should be considered; third, accumulation of production, management, usage, storage, and action history should be considered; and fourth, the design should allow higher utilization of contents. In depth researches over internet media are already being carried out in external academic disciplines including the media information studies, information and communication studies, and communications studies. We expect that it will also be necessary to consider such researches over the internet media for mass media record management research going forward.

Analysis of Domestic Security Solution Market Trend using Big Data (빅데이터를 활용한 국내 보안솔루션 시장 동향 분석)

  • Park, Sangcheon;Park, Dongsoo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.20 no.5
    • /
    • pp.492-501
    • /
    • 2019
  • To use the system safely in cyberspace, you need to use a security solution that is appropriate for your situation. In order to strengthen cyber security, it is necessary to accurately understand the flow of security from past to present and to prepare for various future threats. In this study, information security words of security/hacking news of Naver News which is reliable by using text mining were collected and analyzed. First, we checked the number of security news articles for the past seven years and analyzed the trends. Second, after confirming the security/hacking word rankings, we identified major concerns each year. Third, we analyzed the word of each security solution to see which security group is interested. Fourth, after separating the title and the body of the security news, security related words were extracted and analyzed. The fifth confirms trends and trends by detailed security solutions. Lastly, annual revenue and security word frequencies were analyzed. Through this big data news analysis, we will conduct an overall awareness survey on security solutions and analyze many unstructured data to analyze current market trends and provide information that can predict the future.

Emergency Disaster Support Fund of Korea in 2020 confirmed through News Articles of Major Newspaper (주요 신문사 뉴스 기사를 통해 살펴본 2020년도 대한민국의 긴급재난지원금)

  • Kwon, Choong-hoon;Lee, Hyoung-Ha
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.169-170
    • /
    • 2020
  • 본 연구는 코로나19 상황에서 대한민국 긴급재난지원금의 모습을 주요 신문사 뉴스 기사들을 통해 분석하고 그 결과를 제시하고자 한다. 분석대상은 2020년 3월 22일부터(긴급재난지원금 첫 보도) 5월 31일까지, 중앙일간지(11개 신문사)의 '긴급재난지원금' 관련 신문기사들이다. 신문기사 분석방법론은 관련 연구주제가 선행연구가 축적되지 않는 상황에서 나름 가치 있는 연구접근법이다. 본 연구에서는 뉴스기사 빅데이터 분석 서비스인 빅카인즈를 활용하여, 관련기사의 뉴스 트렌드, 연관어, 관계도 등을 분석하여 제시하였다. 본 연구는 향후 해당 분석대상을 가지고, 보다 밀도 있고 깊이 있는 언어네트워크(의미망) 분석으로 확장해 나갈 계획이다.

  • PDF