• 제목/요약/키워드: 뉴스기사

검색결과 505건 처리시간 0.026초

텍스트마이닝을 활용한 해양스포츠에 대한 언론 보도기사 분석: 요트, 조정, 카누를 중심으로 (Text Mining Analysis of Media Coverage of Maritime Sports: Perceptions of Yachting, Rowing, and Canoeing)

  • 김지현;김보경
    • 해양환경안전학회지
    • /
    • 제29권6호
    • /
    • pp.609-619
    • /
    • 2023
  • 본 연구는 국내 해양스포츠의 사회적 인식이 어떻게 형성되었는지를 알아보고자 수행되었다. 이를 위해 해양스포츠의 대표적 종목인 요트, 조정, 카누와 관련된 최근 10년간 국내 언론 보도기사의 키워드 및 토픽을 활용하여 빅데이터 분석 방법 중 텍스트 마이닝 분석을 실시하였으며, 도출된 결과는 다음과 같다. 첫째, TF 분석과 워드 클라우드 분석 결과 해양, 대회, 체험, 관광, 세계, 요트, 카누, 레저, 참여등이 상위 키워드로 나타났다. 둘째, 의미연결망 분석 결과 요트는 해양, 산업, 대회, 레저, 관광, 보트, 시설, 사업 등과 상관관계가 나타났고, 조정은 대회, 충주 등과, 카누는 해양, 대회, 체험, 레저, 관광 등과 상관관계가 나타났다. 셋째, 토픽모델링 분석 결과 요트, 조정, 카누가 엘리트 체육과 해양레저스포츠로서 인식이 형성된 것을 알 수 있었으나 시간의 변화에 따라 사회전반적인 쟁점과 의견의 흐름 및 사회적 변화는 미미한 것으로 나타났다. 이상의 결과를 종합하면 요트와 카누는 엘리트 체육이라는 인식에서 해양레저스포츠로 점차 인식이 형성되어 해양레저산업에 중요한 요소로 활용되고 있다는 것을 알 수 있었으며, 조정은 엘리트 체육 중심의 사회적 인식이 크게 변하지 않아 해양레저스포츠로서 대중화가 아직은 미미한 것으로 사료된다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

웹보메트릭스를 활용한 지역관광자원 발굴 및 네트워크 분석: 대구 수성구를 중심으로 (Identifying Regional Tourism Resources Using Webometric Network Analysis: A case of Suseong-gu in Daegu, South Korea)

  • 송화영;주우붕;김지은;오정현;박한우
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.475-486
    • /
    • 2020
  • 이 연구는 웹보메트릭스를 활용한 지역관광자원 발굴 및 뉴스 네트워크를 대구 수성구를 중심으로 분석한 연구이다. 데이터는 Bing, Naver 등 웹 데이터를 사용했으며, 네트워크 분석과 댓글 분석을 하였다. 연구문제는 총 세가지로 첫째, 대구 내부에서 수성구의 검색엔진 최적화 수준은 어떠한가? 둘째, 수성구 관광자원의 온라인 출현도는 어떠한가? 셋째, 높은 온라인 출현도를 보이는 관광자원의 뉴스 기사와 댓글은 어떤 내용이 주를 이루는가?이며 그 결과를 보면 첫째, 수성구는 검색엔진 최적화 수준이 대구 내부에서 하위권에 속하며 이는 수성구 관광을 언급한 자료들의 온라인 가시성이 미약한 수준임을 알 수 있다. 둘째, 수성구에서 온라인 출현도가 높은 관광자원들은 대부분 수성못 중심이다. 셋째, 수성못 언론 보도의 내용과 댓글을 살펴본 결과 수성못 교통문제와 열대야가 최대 관심사로 나타나, 관광기반시설에 대한 접근성 개선과 관광자원 개발이 요구된다. 이러한 분석결과는 수성구 관광자원 관련 정책의 개발 및 서비스 운영에 기여 할 수 있고 지역 경제에 대한 해답이 될 것이다.

우리나라 주요 일간지 및 TV 건강정보의 내용분석 (Contents Analysis on the Health Information of Major Daily Newspaper and TV in Korea)

  • 임규광;이무식;홍지영;유인숙
    • 한국산학기술학회논문지
    • /
    • 제10권10호
    • /
    • pp.2945-2951
    • /
    • 2009
  • 본 연구는 본 연구는 일반대중이 건강관련 정보 습득의 한 경로인 대중매체 중 주요 일간지와 KBS1 9시 뉴스, TV 방송국의 건강연재 프로그램에서 다루고 있는 건강관련 기사의 내용을 예보성 정보를 중심으로 분류하고 살펴봄으로서 일반대중이 제공받는 건강관련 정보의 경향을 파악하여 환자 및 일반인에게 유용한 건강정보를 제공하는 기초자료로 활용하고, 궁극적으로 건강 예보제 실시를 위한 현황분석 등의 자료를 제공하기 위하여 실행되었다. 분석대상 기간은 2006년 1월 1일부터 2006년 12월 31일까지 1년간을 분석대상으로 하였으며, 업무량의 고려하여 컴퓨터를 이용한 무작위 추출에 의하여 50%를 분석대상 표본으로 하였다. 건강정보의 주제를 보면 일간지에서는 병의 원인 및 위험인자(15.5%), 치료 및 술기, 투약(15.4%), 건강증진(14.6%)순이었고, TV 뉴스는 병의 원인 및 위험인자(27.5%)가 가장 많았고, 역학(24.2%), 행정(11.3%)순이었다.

대용량 데이터베이스를 이용한 한국어 운율 특성에 관한 연구 (A Prosodic Study of Korean Using a Large Database)

  • 김종진;이숙향
    • 한국음향학회지
    • /
    • 제24권2호
    • /
    • pp.117-126
    • /
    • 2005
  • 본 연구는 대용량 데이터베이스 분석을 통한 한국어의 운을 특성 규명을 시도하였다. 남녀 화자 1명씩 각각 낭독한 650개의 뉴스기사 문장 (총 1,300 개)은 분절음 레이블링과 운율 레이블링을 한 후, 각 운율단위의 성조유형과 크기, 상위운율단위의 크기와 하위 운율단위 수간의 상관관계, 그리고 강세구의 하강곡선과 상승곡선의 기울기와 F0 값에 대한 비교분석을 수행하였다. 운율단위의 지속시간, 어절수, 음절수와 하위 운율단위의 수는 화자뿐만 아니라 운율단위 위치에 따라서 차이를 보였으며 하위 운율단위의 수는 상위 운율단위의 음절수와 지속시간과 높은 상관관계를 보였다. 강세구 내의 하강곡선의 기울기는 강세구 음절수와 반비례 관계를 보였으며 강세구 첫 성조의 유형에 따라 기울기 값에 차이가 있었다. 이 차이는 고성조로 시작한 강세구 성조의 F0 상승과 성조 간 상승 폭의 차이로 설명할 수 있었다. 강세구 경계의 하강곡선은 일정하면서 강세구 내의 하강곡선에 비해 다소 급격한 기울기를 보였다. 강세구 내의 두 상승곡선은 유사한 기지값을 보였으나 강세구 시작 상승곡선의 F0 변화량이 끝 상승곡선의 F0 변화량보다 크게 나타났다. 그리고 하나의 상승곡선이 강세구를 이루는 L Ha의 경우에는 강세구의 음절수에 반비례 관계를 보였다.

사용자의 국가 R&D 정보 이용 접근성 향상을 위한 큐레이션 서비스 : 이슈로 보는 R&D 사례를 중심으로 (Curation Service to Improve User's Access to National R & D Information : Focusing on Issues R&D Service)

  • 유은지;최광남;황유나
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.1-10
    • /
    • 2020
  • 국가 R&D 데이터는 기초과학 연구부터 산업화 부분까지 전 분야에 대한 정보를 포괄하고 있지만 전문적인 용어로 표현되며 이로 인해 대중의 이용에는 어려움이 있다. 이에 NTIS 는 국가 R&D 데이터를 이용한 데이터 큐레이션 서비스를 개발하여 국가적인 현안과 사회적 이슈에 대해 국가 R&D 정보를 선별하여 제공하고 있다. 이에 본 연구에서는 NTIS 의 데이터 큐레이션 서비스인 이슈로 보는 R&D 서비스 분석을 통해 국가 R&D 정보를 이용한 데이터 큐레이션 서비스 구축 방안을 제안하고자 하며 이 서비스가 국가 R&D 정보에 대한 사용자의 접근성 향상에 미친 영항도 분석하였다. 이슈로 보는 R&D 서비스는 뉴스기사에서 추출한 이슈와 관련된 국가 R&D 과제, 성과, 주요 연구기관 등을 매핑하여 정리, 제공한다. 패키징에 이용된 데이터는 모두 오픈되어 있고 관련 자료는 보고서 형식으로 정리돠어 PDF 파일로 제공된다. 또한 해당 프로세스를 자동화 하여 관리자 뿐 만 아니라 NTIS 이용자라면 누구나 개인적인 이슈패키징을 가능하게 하였다. 이 밖에 Special Issue 코너를 개설하며 주요 현안에 대한 사용자의 접근,이용 편의성을 높였고 코너 개설 이후 접속자의 페이지뷰가 증가한 것으로 나타났다.

북한이탈주민의 범죄행위 및 범죄피해에 대한 효과적인 예방대책 (A Study on the Preventive Measures of Criminal Behaviors and Criminal Damages of North Korean Defectors)

  • 임창호
    • 시큐리티연구
    • /
    • 제49호
    • /
    • pp.217-246
    • /
    • 2016
  • 국내에 입국한 북한이탈주민의 수가 3만 명이 되는 상황에서 북한이탈주민에 의한 범죄 및 범죄피해, 위장탈북 간첩, 재입북 사건, 해외 위장망명 사건 등이 증가하면서, 북한이탈주민의 한국 사회 정착 부적응으로 인한 다양한 사회일탈 문제들이 우리 사회의 관심사가 되고 있다. 북한이탈주민들은 목숨을 걸고 북한에서 한국으로 왔지만 문화적인 이질감, 편견, 사회주의 체제 습성 등 여러 가지 이유들로 인해서 한국 사회 부적응 현상을 보이고 있다. 대부분의 북한이탈주민들은 사회적 약자로서 한국 사회의 최저 빈곤층을 형성하고 있으며, 그 결과 이들의 주요 목표는 경제적 성취이다. 이런 상황에서 북한이탈주민들은 돈을 벌기 위해서 범죄를 범하거나 범죄피해를 당하는 경우가 많다. 이 연구의 목적은 북한이탈주민들의 범죄행위 및 범죄피해의 실태를 분석한 후 효과적인 예방대책들을 제안하는 것이다. 이 연구를 위해서 북한이탈주민에 의한 범죄행위 및 범죄피해에 대한 각종 문헌들을 연구하고, 관련 통계자료를 활용하고, 관련 사례의 경우에는 뉴스기사를 참고하고, 특히 신변보호 담당관과 심층 인터뷰를 함으로써 북한이탈주민들의 범죄행위 및 범죄피해의 효과적인 예방대책들을 제안하고자 하였다. 먼저, 북한이탈주민에 의한 범죄행위를 예방하기 위해서, 한국 사회 구성원으로서의 정체성을 고양시키고, 초기 적응교육을 내실화하고, 취업보호 및 정착도우미제도를 체계화하고, 북한이탈주민의 적응 유형별로 관리하고, 북한이탈주민 관리 네트워크를 정비하고, 경찰관서 내에 탈북자 관리부서를 신설하고, 교도소 재소자의 교육을 강화하며, 비보호 대상자에 대한 관리를 강화해야 한다. 다음으로, 북한이탈주민의 범죄피해를 예방하기 위해서는 취약 북한이탈주민을 효과적으로 관리하고, 신변보호 경찰관과 연락체계를 유지하고, 해외여행시 사전에 신변안전대책을 마련하고, 일상생활에 대한 법률교육을 강화하고, 여성의 사회화에 대한 재교육을 실시할 필요가 있다.

  • PDF

텍스트 마이닝과 퓨쳐스 휠 기법을 활용한 정부정책의 미래 성공 예측 : 임금피크제의 미래 정책예측 (Predicting Success of Government Policy in the Future with Futures Wheel and Text Mining : Predicting the Future Policy of Wage Peak System)

  • 김형중;김진화
    • 디지털융복합연구
    • /
    • 제14권12호
    • /
    • pp.141-153
    • /
    • 2016
  • 본 연구의 목적은 다양한 자료를 검토 한 후 텍스트 마이닝 기법과 미래예측기법인 퓨쳐스휠 기법 그리고 극성선택 기법을 활용하여 임금피크제에 대한 미래 모습을 과학적으로 그려보고자 하였다. 이를 위해 논문, 뉴스기사, SNS(트위터, 블로그), 연구보고서 등을 수집하였다. 수집된 자료를 토대로 텍스트 마이닝 기법을 활용하여 메인주제 단어에 대한 키워드를 추출하고 퓨쳐스휠 기법과 극성선택 기법을 활용하여 임금피크제 미래 성공에 대한 최종결론을 도출하였다. 분석결과 임금피크제 미래 예측은 긍정적으로 예측되었다. 총 5가지의 메인 주제 중 임금피크제 찬반논란과 임금피크제 해결과제는 부정적으로 예측되었지만 임금피크제 배경이나 임금피크제의 목적 및 이유, 임금피크제 대안에 대해서는 긍정적으로 예측 되었다. 따라서 최종적으로 5가지 메인 주제 중 3가지가 긍정적으로 예측되어 임금피크제에 대한 미래는 긍정적으로 예측되었다. 임금피크제의 목적은 고령 근로자들의 정년보장과 고용안정일 것이다. 그러나 임금피크제가 성공적으로 실행되기 위해서는 단순히 연령만 고려된 임금삭감이 아니라 근로시간이나 직원의 직무 유형 등 다양한 특성들을 고려하는 지원이 필요할 것이다.

텍스트 마이닝을 이용한 매체별 에볼라 주제 분석 - 바이오 분야 연구논문과 뉴스 텍스트 데이터를 이용하여 - (Text Mining Driven Content Analysis of Ebola on News Media and Scientific Publications)

  • 안주영;안규빈;송민
    • 한국문헌정보학회지
    • /
    • 제50권2호
    • /
    • pp.289-307
    • /
    • 2016
  • 에볼라 바이러스(Ebola virus disease)와 같은 전염병들은 사회적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되기도 한다. 이에 따라 국내외로 전염병과 관련된 텍스트 마이닝 연구가 활발하게 진행되고 있으나, 텍스트 마이닝 기법을 사용하여 상이한 특성을 가진 매체 간 주제를 분석한 연구는 아직까지 진행되지 않고 있다. 따라서 본 연구에서는 전염병 중 하나인 에볼라를 키워드로 하여 사회적 특성을 지닌 뉴스 기사와 바이오 분야의 전문적 특성을 지닌 연구 논문 간의 주제 분석을 진행하였다. 텍스트 분석에는 매체별 문헌 데이터로부터 다양한 토픽들을 추출하기 위해 토픽모델링 기법을 적용하였고, 매체 간의 구체적인 내용 분석을 위해 중요 개체를 선정하고 이를 중심으로 동시출현 단어 네트워크 분석을 수행하였다. 또한 각 매체별로 등장하는 주제를 시각적으로 표현하기 위해 토픽맵을 구축하였다. 분석 결과, 두 매체에서 다루는 주제의 차이점과 공통점을 발견할 수 있었으며 동시 출현 주제의 시계열 분석을 통해 매체 간 특성의 차이를 찾을 수 있었다. 본 연구를 통해 상이한 특성을 지닌 매체들의 주제와 개체들을 함께 제시하고, 매체 간의 공통점과 차이점을 보여줌으로써 매체별 정보 생산자들이 연구 및 현상 분석을 진행하는 데 있어 관점의 다양성을 제공할 수 있을 것이다.