• 제목/요약/키워드: 뉴스댓글

검색결과 63건 처리시간 0.025초

뉴스 댓글의 감정 분류를 위한 자질 가중치 설정 (Feature Weighting for Opinion Classification of Comments on News Articles)

  • 이공주;김재훈;서형원;류길수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.871-879
    • /
    • 2010
  • 본 논문은 뉴스 기사의 댓글에 대한 사용자의 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 댓글의 문서 분류 시스템으로 기계학습에 기반을 두고 있다. 댓글은 일반적인 문서와 달리 본문을 가지고 있으며 본문의 내용이 독자의 감정에 영향을 줄 수 있다. 본 논문에서는 이와 같은 댓글의 특성과 여러 가지 자원을 이용하여 감정 분류를 위한 자질을 제안하고 이들의 가중치 설정 방법을 제안한다. 실험을 통해 이러한 가중치 설정 방법이 한글 뉴스의 댓글에 대한 감정을 분류하는데 효과적임을 알 수 있었다. 또한 댓글과 같이 많은 오류를 포함하는 문서에 대해서 문자 단위의 2음절과 3음절 자질도 충분히 이용 가치가 있음을 확인할 수 있었다. 향후에 뉴스 기사의 댓글뿐 아니라 상품 댓글 등 일반적인 감정 분석에 적용할 계획이다.

온라인 뉴스 댓글에 나타난 뉴스 이용자들의 이념적 성향에 관한 연구: 포털과 언론사닷컴의 20대 대선 관련 뉴스기사를 중심으로 (A Study of Users' Ideological Propensity in the Comments of Online News: Focusing upon the Stories of the Web Portal Sites and the Press Website News Related to the 20th presidential Election)

  • 박광순;안종묵
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.135-143
    • /
    • 2022
  • 본 연구는 포털뉴스와 언론사닷컴 뉴스댓글에 나타난 이용자들의 정치이데올로기 성향이 어떠한지를 살펴보기 위해 실시되었다. 이 같은 분석결과를 통해 포털뉴스와 언론사닷컴뉴스는 물론, 이들 뉴스를 이용하는 유권자들의 정치성향을 파악할 수 있었다. 본 연구에 필요한 자료 수집은 선거일 전 약 90일간 174개의 뉴스기사 댓글을 대상으로 이루어졌다. 분석은 네이버뉴스와 다음뉴스, 더불어민주당과 국민의힘, 언론사닷컴뉴스와 네이버뉴스 간 비교를 위해 t-test 기법으로 실시되었다. 분석결과 네이버뉴스 댓글은 보수정당 후보에 대한 긍정적인 내용의 비율이 더 높은 반면, 다음뉴스 댓글은 진보정당 후보에 대한 긍정적인 내용의 비율이 더 높았다. 따라서 네이버뉴스는 정치적으로 보수성향 이용자들이 더 많이 이용하는 반면, 다음뉴스는 진보성향 이용자들이 더 많이 이용하고 있다는 것을 알 수 있었다.

혐오성 댓글의 제3자 효과 댓글의 속성과 이용자의 성향을 중심으로 (The Third-Person Effects of Online Hate Comments)

  • 조윤용;임영호;허윤철
    • 한국언론정보학보
    • /
    • 제79권
    • /
    • pp.165-195
    • /
    • 2016
  • 이 연구는 온라인 포털 뉴스에 대한 혐오성 댓글의 제3자 효과를 분석하였으며, 특히 뉴스 이용자의 성향에 따라 제3자 효과가 어떻게 달라지는지 살펴보았다. 구체적으로 이주민의 불법체류에 관련된 뉴스 댓글을 혐오성 댓글과 이성적 논조의 댓글로 나누어 댓글 속성, 즉 표현방식에 따른 제3자 효과를 온라인 실험연구를 통해 비교하였다. 그리고 이용자의 이념적 성향과 이주민에 대한 차별적 성향에 따라 혐오성 댓글의 제3자 효과가 어떤 차이를 보이는지 분석하였다. 479명이 온라인 실험에 참가하였으며, 실험참가자는 혐오성 댓글(실험집단)과 이성적 댓글(통제집단)에 무작위로 할당되었다. 연구 결과, 진보적 성향의 뉴스 이용자는 혐오 표현 유무와 관계없이 전반적으로 제3자 효과가 높게 나타났지만, 보수적 성향의 이용자는 혐오성 댓글에서만 제3자 효과가 높게 나타나는 것을 확인하였다. 전통적으로 제3자 효과 연구는 주로 매스미디어를 대상으로 이루어졌는데, 이 연구는 이러한 효과 이론을 이용자의 댓글이라는 새로운 현상에 적용하고, 이 효과가 뉴스 이용자의 이념적 성향, 다문화에 대한 차별적 태도 등 이슈와 밀접하게 관련된 개인적 특성에 따라 어떻게 불균등하게 발생하는지를 살펴보았다는 점에서 의의가 있다.

  • PDF

온라인 댓글 인식과 댓글 활동의 관계에 관한 연구 -댓글의 신뢰도와 인터넷뉴스 수용자의 수용경향 중심으로- (A Study of the Relationship between Perception and Activities in the News Replies -Focused on News Perception and Credibilities-)

  • 권상희;김익현
    • 한국언론정보학보
    • /
    • 제42권
    • /
    • pp.44-78
    • /
    • 2008
  • 본 연구는 댓글 저널리즘의 인식차원과 이에 따른 댓글 활동의 상관 정도를 측정하기 위한 논문이다. 이를 위해 댓글 사용자들이 인식하는 댓글의 특성, 뉴스 장르별 댓글유형, 사용자의 인식정도와 이에 따른 댓글 활동의 상관관계 등을 연구했다. 총 215명을 대상으로 설문 조사를 실시해 1) 댓글에 대한 인식 2) 댓글 읽기와 댓글 쓰기 활동 정도 3) 댓글에 대한 인식이 댓글 활동에 미치는 영향 등을 알아봤다. 조사 결과 사용자 유형과 뉴스장르, 댓글의 신뢰도의 차이에 따라 댓글에 대한 인식이 다르게 나타났다. 또 댓글 인식 정도에 따라 댓글 활동에도 차이가 나타냈다. 더불어 세대별 댓글 인식과 선호도에도 차이가 나타났다. 즉 30대 이상 성인층들은 정치, 경제, 사회 같은 경성 기사들의 댓글을 주로 읽는 반면, 20대 이하 층은 연예, 스포츠, 생활 정보 같은 연성 기사들의 댓글을 주로 읽는 것으로 나타났다. 이는 연령에 따른 기사 구독 행태가 크게 다르지 않았다. 본 연구 결과 댓글의 기계적인 가능(상호작용, 신속성은 높은 반면, 내용의 품질이나 효용성은 전반적으로 낮다는 것을 알 수 있었다. 또 댓글에 관한 신뢰도나 활동정도는 유형별로 차이가 나는 댓글 커뮤니케이션의 초기현상으로 설명될 수 있다. 댓글 공간을 개선하기 위해서는 실명제 같은 강제 요인보다는 트랙백처럼 사용자에게 책임감을 부여하는 방식이 더 바람직하다는 정책적 제안이 가능하다.

  • PDF

베스트 댓글의 방향성이 일반댓글의 동조효과에 미치는 영향 (An Effect of the Valence of Best Reply on the Conformity of General Reply)

  • 문광수;김슬;오세진
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.201-211
    • /
    • 2013
  • 본 연구의 목적은 온라인 뉴스에 대한 베스트 댓글이 일반 댓글의 동조에 미치는 효과에 대해 검증하는 것이었다. 참가자는 총 194명이었으며, 참가자들은 통제집단(61명), 긍정적 베스트 댓글 집단(66명), 부정적 베스트 댓글 집단(67명) 중 한 집단에 무선할당 되었다. 참가자들은 온라인 뉴스 기사와 긍정적 또는 부정적인 베스트 댓글을 읽고 하단에 제시된 댓글 난에 자신의 의견을 댓글 형식으로 작성하였으며, 주제 관여도와 자기표현 정도를 묻는 설문지를 작성하였다. 참가자들이 직접 작성한 댓글은 4명의 연구자가 읽은 뒤 댓글 방향성을 긍정, 부정, 중립으로 분류하였으며, 평가자간 신뢰도는 평균 84.9%였다. 분석 결과, 실험 집단에 따른 주제 관여도와 자기표현 정도에는 유의미한 차이가 없어, 실험 집단 간 동질성이 확보되었다. 그리고 교차분석 결과, 실험 집단에 따라 긍정, 부정, 중립적 댓글 빈도가 유의미하게 차이가 있었다. 사후검증 결과, 통제집단과 긍정적 베스트 댓글 집단, 그리고 긍정적 베스트 댓글 집단과 부정적 베스트 댓글 집단 간 댓글 방향성에는 유의미하게 차이가 있었으나, 통제집단과 부정적 베스트 댓글 집단 간 댓글 경향에는 유의미한 차이가 없었다.

TRIB: 웹블로그 댓글분류 시각화 시스템 (TRIB: A Clustering and Visualization System for Responding comments on WebBlog)

  • 배민정;이윤정;지정훈;우균;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.226-229
    • /
    • 2009
  • 최근 들어 인터넷 게시판이나 개인 블로그 등은 온라인상에서 사람들의 정보 공유나 의견 교환의 중요한 매체가 되고 있다. 많은 수의 블로그들은 현재 사회적으로 이슈가 되는 여러 문제들을 반영하고 있다. 또한 최근 댓글을 통해 적극적으로 자신의 의사 표현하거나 다른 사람들의 의견을 살피는 인터넷 사용자의 증가로 인터넷 뉴스나 블로그 기사에 많은 수의 댓글이 달리고 있다. 그러나 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 자신이 원하는 내용의 댓글을 검색하거나 전체 댓글에 대한 전반적인 파악은 힘든 일이다. 따라서 본 논문에서는 기사에 달린 많은 수의 댓글들을 분류하고, 이를 시각화 하는 시스템인 TRIB(Telescope for Responding comments for Internet Blog)을 제안한다. TRIB은 미리 정의된 사용자 정의 사전을 이용하여 댓글을 내용에 따라 분류하여 시각화 하므로 사용자들은 자신의 관심과 흥미에 따라 개인화 된 뷰를 볼 수 있다. 1,000개 이상의 댓글을 가진 뉴스 기사들을 대상으로 한 실험을 통해 TRIB 시스템의 댓글 분류와 시각화 성능을 보인다.

악성 댓글의 특성: 한국어와 영어의 인터넷 뉴스 댓글 비교 (The Characteristics of Malicious Comments: Comparisons of the Internet News Comments in Korean and English)

  • 김영일;김영준;김영진;김경일
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.548-558
    • /
    • 2019
  • 인터넷 뉴스 댓글이 보편화 됨에 따라 악성 댓글이 확산되었고 이는 많은 사회 문제를 일으켜 왔다. 글은 심리 상태나 성격을 반영하기 때문에 악성 댓글을 분석하면 댓글을 작성할 때의 마음 상태를 추론할 수 있다. 본 연구에서는 영어권과 한국어권의 악성 댓글을 LIWC와 KLIWC를 사용하여 분석하였다. 그 결과, 영어와 한국어 공통으로 문장, 어절, 형태소, 문장 당 어절, 문장 당 형태소, 긍정적인 정서, 인지적 과정을 나타내는 단어가 악성 댓글이 일반 댓글보다 적게 사용되었으며, 3인칭 단수, 화, 정서적 과정을 나타내는 단어, 물리적 상태와 기능을 나타내는 단어, 속어가 악성 댓글이 일반 댓글보다 많이 사용되었다. 이는 악성 댓글을 작성할 때 사람들이 분노의 감정을 조절하지 못하고 충분히 생각하지 않은 상태에서 글을 작성하고 있음을 나타낸다. 따라서 댓글 작성 시, 작성 글을 모니터링 하도록 유도하거나 부정적 정서의 어휘가 많이 사용된 글을 다른 이용자에게 노출 시키지 않는 등의 방법을 인터넷 뉴스 서비스 제공자가 고려할 필요가 있다. 한편, 영어의 악성 댓글과 한글의 악성 댓글은 진정성 측면에서 차이가 발생했다. 좀 더 객관적 연구를 위해서 여러 시점의 댓글을 모집할 필요가 있다.

크라우드소싱 기반의 딥러닝 분류 알고리즘을 이용한 댓글 분류 시스템 (Comment Classification System using Deep Learning Classification Algorithm based on Crowdsourcing)

  • 박희지;하지민;박혜림;강정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.864-867
    • /
    • 2021
  • 뉴스, SNS 등의 인터넷 댓글은 익명으로 의견을 자유롭게 개진할 수 있는 반면 댓글의 익명성을 악용하여 비방이나 험담을 하는 악성 댓글이 여러 분야에서 사회적 문제가 되고 있다. 해당 문제를 해결하기 위해 AI를 활용한 댓글 분류 알고리즘을 개발하려는 많은 노력들이 이루어지고 있지만, 댓글 분류 모델에 사용되는 AI는 오버피팅의 문제로 인해 댓글 분류에 대한 정확도가 떨어지는 문제점을 가지고 있다. 이에 본 연구에서는 크라우드소싱을 활용하여 오버피팅으로 인한 악성 댓글 분류 및 판단 정확도 저하 문제를 개선한 크라우드소싱 기반 딥러닝 분류 알고리즘(Deep Learning Classification Algorithm Based on Crowdsourcing: DCAC)과 해당 알고리즘을 사용한 시스템을 제안한다. 또한, 실험을 통해 오버피팅으로 낮아진 판단 정확도를 증가시키는 데 제안된 방법이 도움이 되는 것을 확인하였다.

포털 이용자들의 포털 뉴스이용패턴 및 포털의 언론역할에 관한 인식 (The Pattern of Portal News Use among Portal Users and Their Recognition of Portal as a Press)

  • 이창호;이호영
    • 한국언론정보학보
    • /
    • 제46권
    • /
    • pp.177-211
    • /
    • 2009
  • 본 연구의 목적은 포털의 언론으로서의 역할에 대한 논란을 정리해보고 포털 이용자들이 언론으로서 포털의 역할과 기능에 어떻게 인식하고 있는지를 살펴보는 것이다. 아울러 이 연구는 포털 이용자들의 뉴스이용패턴과 뉴스 댓글에 관한 인식을 분석하고자 한다. 이를 위해 주 1회 이상 포털사이트를 이용하고 있는 15세부터 45세 사이의 이용자 1,036명 을 대상으로 온라인설문조사를 실시했다. 그 결과 대부분의 포털이용자들(70.8%)은 포털이 다른 언론사처럼 언론의 역할을 한다고 생각하는 것으로 나타났다. 또한 10명 가운데 6명 가량은 포털 뉴스가 사회의 주요 이슈를 제기한다는 데 동의하고 있었다. 이러한 결과는 포털 이용자들이 언론으로서의 포털의 사회적 영향력과 책임을 중요하게 생각하고 있다는 것을 보여주고 있다. 하지만 40% 가량의 응답자들이 뉴스 댓글로 제시된 정보를 신뢰하지 않는다고 답했고, 댓글은 대부분 아르바이트생들이 쓰는 것으로 여겼다. 또한 10명 중 6명 가량은 댓글이 의도적으로 작성되고 있다고 응답했다. 따라서 포털 뉴스의 신뢰성을 확보하기 위해서는 뉴스 댓글에 대한 품질 관리가 어느 정도 필요하다고 할 수 있다. 포털을 자주 이용하는 사람일수록 포털이 편리하고 사회적 영향력이 크다고 생각함과 동시에 선정적이고 상업적인 면도 있다고 생각했다. 반면, 인터넷 이용을 많이 할수록 포털이 신속하고 편리하며 사회적 영향력이 크다고 생각하는 경향이 나타났다. 하지만 가구소득은 포털의 뉴스역할인식과 통계적으로 유의미한 상관관계가 나타나지 않았다.

  • PDF

KcBERT: 한국어 댓글로 학습한 BERT (KcBERT: Korean comments BERT)

  • 이준범
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.437-440
    • /
    • 2020
  • 최근 자연어 처리에서는 사전 학습과 전이 학습을 통하여 다양한 과제에 높은 성능 향상을 성취하고 있다. 사전 학습의 대표적 모델로 구글의 BERT가 있으며, 구글에서 제공한 다국어 모델을 포함해 한국의 여러 연구기관과 기업에서 한국어 데이터셋으로 학습한 BERT 모델을 제공하고 있다. 하지만 이런 BERT 모델들은 사전 학습에 사용한 말뭉치의 특성에 따라 이후 전이 학습에서의 성능 차이가 발생한다. 본 연구에서는 소셜미디어에서 나타나는 구어체와 신조어, 특수문자, 이모지 등 일반 사용자들의 문장에 보다 유연하게 대응할 수 있는 한국어 뉴스 댓글 데이터를 통해 학습한 KcBERT를 소개한다. 본 모델은 최소한의 데이터 정제 이후 BERT WordPiece 토크나이저를 학습하고, BERT Base 모델과 BERT Large 모델을 모두 학습하였다. 또한, 학습된 모델을 HuggingFace Model Hub에 공개하였다. KcBERT를 기반으로 전이 학습을 통해 한국어 데이터셋에 적용한 성능을 비교한 결과, 한국어 영화 리뷰 코퍼스(NSMC)에서 최고 성능의 스코어를 얻을 수 있었으며, 여타 데이터셋에서는 기존 한국어 BERT 모델과 비슷한 수준의 성능을 보였다.

  • PDF