• 제목/요약/키워드: news sentiment analysis

검색결과 85건 처리시간 0.024초

주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법 (Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being)

  • 최석재;송영은;권오병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.83-105
    • /
    • 2016
  • 의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

텍스트마이닝을 이용한 미세먼지 관련 신문기사 분석 (An Analysis of Newspaper Articles on Fine Particle Matter Using Text Mining Techniques)

  • 양지연
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.1-13
    • /
    • 2022
  • 본 연구에서는 미세먼지에 대한 신문 기사의 시대별, 신문사별 특징을 살펴보고 있다. 이를 위하여 빅카인즈에서 1995년 이후 주요 신문사들의 관련 기사를 추출하였고 텍스트마이닝, 감성분석, 회귀분석을 활용하였다. 그 결과, 2010년 이전에는 대기오염도 측정 단어나 국내 오염원 관련 단어가 많이 등장했으나 2010년대에 들어서면서 "중국"이 큰 빈도로 나타났으며 정책적 대응, 미세먼지가 건강에 미치는 영향, 관련 제품에 대한 광고·홍보, 국내 오염원에 관한 기사까지 다양한 주제의 기사가 등장했다. 중앙일보, 한겨레, 경향신문은 상대적으로 정부의 정책이나 규제와 관련된 기사가 많은 반면, 대부분의 지역지에서는 지역 자체의 배출원 및 저감대책에 관한 기사가 많았다. 본 연구 결과는 미세먼지 관련 언론보도의 추이를 살필 수 있는 기초 자료로 활용될 수 있으리라 기대한다. 향후 포스트코로나 시대의 국내 미세먼지의 상황과 관련 기사의 트렌드를 추가적으로 비교, 검토할 수 있을 것이다.

인구절벽사회에서 노인과 일자리 감성분석 (Sentiment Analysis of Elderly and Job in the Demographic Cliff)

  • 김양우
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.110-118
    • /
    • 2020
  • 소셜미디어 데이터는 우리사회의 문제점과 여론의 향방을 알 수 있는 대리지표로서의 역할을 하고 있다. 이 연구는 2016년부터 2018년 까지 뉴스데이터 109,015건 건의 자료를 활용하여 우리사회 노인과 일자리 감성분석을 실시함으로써, 고령사회와 인구절벽에 직면한 한국 사회에서, 가용노동력 확대 가능성을 알아보았다. 노인 일자리 토픽키워드로 '노인*일자리', '노인*고용', '노인*임금' 등을 사용하였다. 감성분석결과, 대부분의 기간에서는 긍정적 감성이 우세하여 생산연령인구 확충가능성을 알 수 있었다. 노인 일자리확대관련 긍정 감성과 저임금관련 부정감성으로, 일은 하지만 여전히 빈곤한 노인의 실태가 나타났다. 본 연구에서는 소셜 빅데이터를 활용하여 계층적 군집분석과 연관 텍스트분석으로 노인과 일자리 관련 우리사회의 인식과 감성을 분석하였다.

비정형, 정형 데이터의 이미지 학습을 활용한 시장예측 (MPIL: Market prediction through image learning of unstructured and structured data)

  • 이윤선;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.16-21
    • /
    • 2021
  • 금융 시계열 분석은 현대 사회의 경제적, 사회적으로 매우 중요한 역할을 하며 세계 발전에 영향을 미치는 중요한 과제지만 많은 잡음(noise)과 불확실성 등의 어려움으로 인해 금융 시계열 분석 예측은 어려운 연구 주제이다. 본 논문에서는 비정형 데이터와 정형 데이터를 함께 이미지로 변환하여 시장을 예측 하는 방법(MPIL)을 제안한다. 시장 예측을 위해 n일 기간의 비정형 데이터인 SNS, 뉴스 데이터를 감정분석하고 정형 데이터인 시장 데이터를 GADF 알고리즘으로 이미지 변환하고 이미지 학습을 통해 n+1일의 가격을 예측하는 초단기 시장을 예측한다. MPIL은 평균 정확도 56%로 기존 시장예측에 사용되던 감정분석을 활용하여 LSTM으로 시장을 예측하는 모델 평균 정확도 50%보다 높은 정확도를 보였다.

뉴스 댓글의 감정 분류를 위한 자질 가중치 설정 (Feature Weighting for Opinion Classification of Comments on News Articles)

  • 이공주;김재훈;서형원;류길수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.871-879
    • /
    • 2010
  • 본 논문은 뉴스 기사의 댓글에 대한 사용자의 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 댓글의 문서 분류 시스템으로 기계학습에 기반을 두고 있다. 댓글은 일반적인 문서와 달리 본문을 가지고 있으며 본문의 내용이 독자의 감정에 영향을 줄 수 있다. 본 논문에서는 이와 같은 댓글의 특성과 여러 가지 자원을 이용하여 감정 분류를 위한 자질을 제안하고 이들의 가중치 설정 방법을 제안한다. 실험을 통해 이러한 가중치 설정 방법이 한글 뉴스의 댓글에 대한 감정을 분류하는데 효과적임을 알 수 있었다. 또한 댓글과 같이 많은 오류를 포함하는 문서에 대해서 문자 단위의 2음절과 3음절 자질도 충분히 이용 가치가 있음을 확인할 수 있었다. 향후에 뉴스 기사의 댓글뿐 아니라 상품 댓글 등 일반적인 감정 분석에 적용할 계획이다.

소셜미디어의 ESG 감성과 기업성과에 관한 연구 (A Study on the Relationship between Social Media ESG Sentiment and Firm Performance)

  • 박수진;이상용
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.317-340
    • /
    • 2023
  • 경영학적 관점에서 ESG는 환경, 사회, 지배구조 지표를 이용하여 기업이 얼마나 지속 가능한 발전을 이룰 수 있는지 평가하는 것이다. 소셜미디어를 통해, 기업의 선행과 악행을 대중이 적극적으로 공유할 수 있게 되면서 ESG 경영에 대한 대중의 관심 또한 높아졌다. 이를 바탕으로, 본 연구의 목적은 기업 성과가 소셜미디어의 환경, 사회, 지배구조의 감성을 모두 포함한 종합적 ESG 감성과 환경, 사회, 지배구조 각각의 감성과 어떠한 관계가 있는지 분석하는 것이다. 패널회귀모델을 사용하여, 코스피 200 기업 중 143개 기업의 소셜미디어의 ESG 감성과 총자산이익률(ROA), 자기자본이익률(ROE) 간의 관계를 분석했다. 데이터 수집 기간은 2018년부터 2021년까지이고, 온라인 커뮤니티, 인스타그램, 블로그, 트위터, 뉴스를 포함한 소셜미디어 채널의 감성 데이터를 바탕으로 분석하였다. 본 연구 결과에 따르면, 기업 성과는 종합적 ESG 감성과 각각 환경, 사회, 지배구조의 감성은 유의미한 관련이 있음을 파악했다. 따라서 본 연구의 시사점은 다음과 같다. 본 연구는 평가기관의 영향을 받을 수 있는 ESG 등급이 아닌 다양한 소셜미디어 채널들을 활용하여 편향되지 않는 대중의 ESG 감성 지표를 갖고자 하였다. 또한, 본 연구의 결과를 바탕으로, ESG 경영의 방향성을 잡는 데 기여할 수 있다. 이에 본 연구는 ESG 경영에 관심이 있는 연구자들과 기업에게 이론적, 실무적 시사점을 제공한다.

조현병과 정신분열병에 대한 뉴스 프레임 분석을 통해 본 사회적 인식의 변화 (Text Mining Driven Content Analysis of Social Perception on Schizophrenia Before and After the Revision of the Terminology)

  • 김현지;박서정;송채민;송민
    • 한국문헌정보학회지
    • /
    • 제53권4호
    • /
    • pp.285-307
    • /
    • 2019
  • 질환자에 대한 사회적 낙인을 제거하기 위해 2011년, 대한의사협회는 정신분열병을 '조현병'으로 개정하였다. 병명을 변경한 지 약 9년이 지났지만 실제로 사회적 인식이 어느 정도 변화하였는지 정량적으로 분석한 연구는 아직 없다. 이에 본 연구에서는 병명 개정에 따른 조현병에 대한 사회적 인식 변화를 확인하고자 네이버 뉴스 기사를 수집 분석하였다. 텍스트 분석에는 LDA 토픽 모델링, TF-IDF, 동시출현 단어, 감성분석 기법을 사용하였다. 분석 결과, 병명 개정 전보다 후에, 그리고 병명 개정 후 병용되는 정신분열병과 조현병 중 조현병에 대한 사회적 인식이 더 부정적인 것으로 나타났다. 즉, 병명 개정이 낙인을 해소하지 못했음을 알 수 있었다.

위험보도의 위기구축 기제 프레임 분석: 식품안전 보도를 중심으로 (Frame Analysis on Risk Reporting: Food Safety Reports from 1989 to 2005)

  • 박성희
    • 한국언론정보학보
    • /
    • 제35권
    • /
    • pp.181-210
    • /
    • 2006
  • 본 연구는 식품 안전을 둘러싼 위험 상황을 보도하는 언론의 보도 프레임을 추출, 언론이 위험 상황을 위기의 사회 현실로 구축해가는 양상을 분석하는 것을 목적으로 한다. 이를 위해 1989년 삼양라면 우지파동에서 2005년 김치 기생충 알 검출 사건에 이르는 11개 식품안전 사고를 보도한 언론보도 내용을 대상으로 미디어 프레임을 분석, 각 프레임을 이루는 장치를 통해 언론이 위기를 구축해가는 양상을 추적했다. 분석에 사용된 프레임은 책임소재, 갈등, 인간적측면의 부각, 경제적 결과, 도덕성 등 다섯 가지 프레임이었으며, 연구 결과 이들 프레임에는 위기 확산, 책임 소재, 갈등 부각 등의 현저성이 두드러졌다. 특히 각 프레임을 구성하는 행위자는 가해자와 피해자라는 이분법적 대비 구조를 나타냈다. 기사에 등장하는 행위의 주체인 식품업자, 정부 및 해당관청, 소비자, 전문가 등은 이러한 갈등, 혹은 대비 구조의 프레임 안에서 때론 가해자로, 때로는 피해자로 틀짓기 되며 위험의 상황을 확산, 증폭 시키면서 소비자들의 혼란을 야기하고 위기의 사회현실을 구축하는 것으로 나타났다.

  • PDF

트위터 게시물 분석을 통한 코로나바이러스감염증-19 백신에 대한 의견 탐색 (Exploring Opinions on COVID-19 Vaccines through Analyzing Twitter Posts)

  • 정우진;김규리;유승희;주영준
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.113-128
    • /
    • 2021
  • 본 연구는 코로나바이러스감염증-19(이하 코로나바이러스) 백신에 대한 사회적 의견을 파악하기 위해 트위터에서 작성된 백신 관련 게시물들을 분석하였다. 2020년 3월 16일부터 2021 3월 15일까지 1년간 트위터에서 작성된 코로나바이러스 백신 이름을 키워드로 포함한 45,413개의 게시물을 수집하여 분석하였다. 데이터 수집을 위해 활용된 코로나바이러스 백신 키워드는 총 12개이며, 수집된 게시물 수순으로 '화이자', '아스트라제네카', '모더나', '얀센', '노바백스', '시노팜', '시노백', '스푸트니크', '바라트', '캔시노', '추마코프', '벡토르'이다. 수집된 게시물들은 수기와 자동화된 방법을 동시 활용하여 키워드 분석, 감성 분석, 및 토픽모델링을 통하여 백신들에 대한 의견을 탐색하였다. 연구결과에 따르면 전반적으로 백신에 대한 부정적인 반응이 많았으며, 백신 접종 후유증에 대한 불안 및 백신의 효능에 대한 불신이 백신들에 대한 부정적인 주요 요소로 파악되었다. 이와는 반대로, 백신 접종에 따른 코로나바이러스 확산 억제에 대한 기대감이 백신에 대한 긍정적인 사회적 요소인 것을 확인할 수 있었다. 본 연구는 기존의 선행연구들이 뉴스 등 대중매체 데이터를 통해 코로나바이러스 백신에 대한 사회적 분위기를 파악하고자 했던 것과 달리, 소셜 미디어 데이터 수집 및 이를 활용한 키워드 분석, 감성 분석, 토픽 모델링 등의 여러 분석방법들을 사용하여 대중들의 의견을 파악하는 것으로 학술적 의의를 지닌다. 또한, 본 연구의 결과는 백신에 대한 사회적 분위기를 반영한 백신 접종 권장 정책 수립 기여라는 실질적 함의를 시사한다.