• 제목/요약/키워드: 뉴스댓글

검색결과 63건 처리시간 0.025초

딥러닝 기술을 활용한 차별 및 혐오 표현 탐지 : 어텐션 기반 다중 채널 CNN 모델링 (Bias & Hate Speech Detection Using Deep Learning: Multi-channel CNN Modeling with Attention)

  • 이원석;이현상
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1595-1603
    • /
    • 2020
  • 포털 사이트의 인터넷 뉴스 댓글, SNS, 커뮤니티 사이트 등의 온라인상에서 명예 훼손 사건이 최근 점점 증가하고 있다. 온라인상의 차별 및 혐오 표현은 명예 훼손 문제뿐만 아니라 사생활 침해, 인신 공격 등 다양한 형태로 온라인 서비스 이용자들을 위협하고 있다. 지난 몇 년간 산업계와 학계는 이러한 문제를 해결하고자 다양한 방법으로 연구해왔다. 하지만 한국어 대상으로 수행된 딥러닝 기반 혐오 표현 탐지 연구는 아직까지 부족한 상황이다. 본 연구의 목적은 혐오 표현뿐만 아니라 다양한 차별적 표현에 대한 탐지를 위해 데이터셋을 구축하고 이를 분류하기 위한 딥러닝 모델링을 실험하는 것이다. 데이터셋 구축은 10명의 인원이 교차적으로 검토를 하면서 7개 항목에 대한 라벨링 기준을 확립했다. 본 연구는 약 137,111개에 해당하는 한국어 인터넷 뉴스 댓글 데이터셋에 대해 7개의 항목을 각각 이진 분류하고, 이를 딥러닝 기법을 통해 분석한다. 본 연구에서 제안하는 기법은 어텐션 기반 다중 채널 CNN 모델링 기법이다. 실험 결과 7개 항목에 대해 가중 평균 f1 점수를 평가했을 때, 70.32%의 성능을 달성했다.

촛불 집회와 태극기 집회를 둘러싼 정국 인식: 온라인 뉴스 댓글에 대한 빅데이터 분석 (The Political Recognition Surrounding Candlelight Rally and Taegeukgi Rally: A Big Data Analytics on Online News Comments)

  • 김찬우;정병기
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권6호
    • /
    • pp.875-885
    • /
    • 2018
  • 본 연구는 2016년 10월 24일부터 2017년 3월 19일까지 촛불 집회 기간 포털사이트 정치 섹션에 등록된 촛불 집회와 태극기 집회 관련 뉴스의 댓글을 대상으로 주요 이슈를 개체명 인식기를 이용해 분석하여 두 집회에 대한 정국 인식을 살펴보았다. 주요 분석 항목은 탄핵의 책임 소재, 정국 해결의 주체와 방법, 그 외 주요 이슈를 중심으로 분석하였다. 분석 결과, 촛불 집회 기사의 댓글에서는 탄핵지지와 정권 부역자의 법적 처벌에 대해 집중하고 있었으며, 탄핵 후 차기 대선을 통한 정국 해결을 주장했다. 태극기 집회 기사의 댓글에서는 정권 유지를 위한 탄핵 기각에 대해 집중하고 있었고, 헌법재판소의 탄핵 기각을 주장하였다. 이를 통해 볼 때, 촛불 집회나 태극기 집회의 각 입장을 지지했던 집단들 간의 갈등은 대선 이후 적어도 당분간(박근혜 재판 기간) 지속할 것으로 보인다. 이 갈등은 탄핵과 정권 교체 후 청산과 새 정치를 추구하는 입장과 박근혜 대통령 재판에 영향을 미치려는 입장의 대립으로 전개될 것이다. 따라서 이후 정국에서는 사회 통합을 위한 노력이 필요하다.

어텐션임베딩과 다채널 CNN 기반 반시민성 검출 알고리즘 (Detection of Incivility based on Attention-embedding and multi-channel CNN)

  • 박윤정;이세영;금희조
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1880-1889
    • /
    • 2022
  • 온라인 포털 플랫폼은 뉴스 기사와 온라인 댓글을 제공하고 있으나, 온라인 댓글의 익명성은 반시민적 표현을 증가시켜 사회적 문제점으로 간주되고 있다. 댓글의 반시민성 검출 연구가 많이 이루어진 국외와 달리, 국내에서는 비시민성을 세분화한 한국어 데이터셋이 구현되지 않아 심도있는 연구가 이루어지지 못하였다. 본 연구에서는 댓글의 반시민성에 대한 라벨링을 총 13가지 항목으로 시행하였으며 반시민적 표현으로 요약하였다. 또한 어텐션 알고리즘을 이중으로 적용하여 임베딩 벡터를 추출하였고 이후 2-d CNN으로 반시민성 항목을 분류하였다. 그 결과, 제안한 알고리즘이 무례한 호칭 및 공격적 어조 등의 반시민성 검출에 유용하다는 것을 보여주었다. 본 연구는 민주적 담론을 저해하는 반시민적 댓글들을 탐지함으로써 건전한 온라인 댓글 문화 형성에 기여할 것으로 기대된다.

네이버 뉴스 댓글을 이용한 산업 분야별 담론의 감성에 기반한 주제 트렌드 및 여론의 변화와 주가 흐름의 연관성 분석 (Analyzing Topic Trends and the Relationship between Changes in Public Opinion and Stock Price based on Sentiment of Discourse in Different Industry Fields using Comments of Naver News)

  • 오찬희;김규리;주영준
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.257-280
    • /
    • 2022
  • 본 연구에서는 대한민국 정부가 지정한 국가전략기술 사업인 반도체, 이차전지, 바이오 산업에 대한 여론을 파악하고 여론의 변화와 주가 흐름의 연관성을 분석하기 위해 각 산업별 대표 기업에 대한 기사의 댓글을 분석하였다. 반도체 산업에서 '삼성전자', 'SK하이닉스', 이차전지 산업에서 '삼성SDI', 'LG화학', 바이오 산업에서 '삼성바이오로직스', '셀트리온'을 선정하여 이를 제목에 포함하고 있는 2020년 1월 1일부터 2020년 12월 31일까지 발행된 네이버 뉴스 기사의 댓글 47,452개를 수집하고 분석하였다. 먼저, 해당 댓글을 긍정, 중립, 부정의 감성으로 나누고 각 감성 그룹에서의 시간의 흐름에 따른 댓글의 동적인 주제를 분석하여 각 산업별 여론의 트렌드를 파악하였다. 분석 결과 반도체 산업 분야의 경우 투자, 코로나19관련 이슈, 삼성전자라는 대기업에 대한 신뢰, 정부 정책 변화로 인한 타격에 대한 언급이 주제 토픽으로 나타났다. 이차전지 산업체의 경우 투자, 배터리, 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 바이오 산업체의 경우 투자, 코로나19 관련 이슈 및 기업 이슈에 대한 언급이 주제 토픽으로 나타났다. 다음으로, 댓글의 감성이 실제 주가와 연관성이 있는지를 알아보고자 각 대표 기업 별 주가의 변화와 댓글의 감성 점수 변화를 시각적 분석기법을 이용하여 비교 분석하였다. 분석 결과, 댓글의 감성 점수와 주가의 변화 흐름이 매우 유사하게 나타남을 통해 여론의 감성 점수 변화와 주가의 흐름에는 연관성이 있음을 확인하였다. 본 연구는 주가와의 연관성이 높은 뉴스 기사 댓글을 분석했다는 점, 수집 시기를 코로나19로 선정하여 코로나19라는 특수한 상황에서의 여론 트렌드 변화를 파악했다는 점, 국가전략기술제도에 속하는 산업 기업에 대한 여론을 분석하여 정부기관의 관련 정책 제정에 객관적인 근거를 제공하였다는 점에서 의의를 지닌다.

유튜브 이용자의 제20대 대통령선거 이슈 이용: '대장동 개발 사업' 사례를 중심으로 (Use of the 20th Presidential Election Issues on YouTube: A Case Study of 'Daejang-dong Development Project')

  • 김춘식;홍주현
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.435-444
    • /
    • 2022
  • 이 논문의 주요 관심사는 세 가지이다. 첫째, 유튜브 이용자가 제20대 대통령선거의 주요 의제이자 후보자 선택의 기준인 '대장동 개발 사업' 콘텐츠를 어떤 채널을 통해 시청했는지 확인했다. 둘째, 연이어 '대장동 개발 사업' 동영상을 시청했을 때 후속 동영상의 정치적 논조가 최초 시청 동영상의 정치적 논조와 일치하는지 비교했다. 셋째, 최초 동영상과 후속 시청 동영상에 달린 댓글에 담긴 정서 유인가를 살폈다. 네트워크 분석과 내용분석 결과에 따르면 '김어준의 뉴스공장'과 'TV조선 뉴스'가 진보와 보수를 대표하는 채널이었다. 그리고 연이어 시청한 후속 채널의 정치적 성향은 진보와 보수 채널 이용자 모두 중립의 비율이 가장 높았다. 둘째, 보수 채널 이용자의 75.9%, 그리고 진보 채널 이용자의 18.5%가 동일한 논조의 후속 동영상에 댓글을 남겼다. 셋째, 진보와 보수 채널 이용자의 약 80%가 최초 시청 동영상에 남긴 댓글의 정서는 이용 채널의 정치적 성향과 일치했고, 동일한 논조의 후속 동영상을 연이어 시청했을 때도 남겨진 댓글의 90% 이상이 이용 채널의 정치적 성향과 일치했다. 연구자들은 유튜브 정치 정보 이용의 부정적 영향을 최소화하는 방안으로 뉴스 채널의 고품질 저널리즘 실천을 제안한다.

웨이보 인기뉴스에 관한 감정표현에 영향을 미치는 요인 - '중국 산시성 린펀시 반점 붕괴 사건'을 중심으로 - (Influencing Factors on the Emotional Expression in Weibo Hot News - Focusing on 'Restaurant Collapse in Linfen City, Shanxi Province' -)

  • 륙치금;남인용
    • 한국콘텐츠학회논문지
    • /
    • 제21권5호
    • /
    • pp.105-117
    • /
    • 2021
  • 본 연구는 시나 웨이보(Sina Weibo)에 게재된 '산시성 린펀시 반점 붕괴 사건'이라는 인기뉴스(hot news)에 대한 댓글에 나타난 감정표현에 영향을 미치는 요인들을 살펴보았다. 연구결과, 첫째, 성별에 따라 감정표현에 차이가 나타났다. 여성은 남성보다 더 강한 분노, 실망, 슬픔, 비난 감정을 표현하였다. 둘째, 동부지역 이용자들의 감정표현 강도가 중부지역과 서부지역에 비하여 유의하게 높았다. 셋째, 이용자가 댓글에 참여하고 감정표현을 게시한 블로그의 총수량인 웨이보 수가 많을수록 감정표현이 더욱 강하게 나타났다. 넷째, 미인증 이용자는 인증된 이용자보다 실망, 슬픔의 감정표현이 더욱 강하였다. 본 연구는 중국의 온라인 여론형성 과정에서 감정표현의 영향 요인을 살펴봄으로써 서양의 트위터나 페이스북과 같은 소셜네트워크와 비교할 수 있다는 점에서 의의가 있으며, 온라인 뉴스분석에서 빅데이터 분석방법을 사용했다는 점에서도 의의가 있다.

소셜미디어 분석을 통한 삭카린나트륨 소비자 인식 조사 (Consumers Perceptions on Sodium Saccharin in Social Media)

  • 이수연;이원성;문일철;권훈정
    • 한국식품위생안전성학회지
    • /
    • 제30권4호
    • /
    • pp.329-342
    • /
    • 2015
  • 본 연구에서는 소셜미디어 콘텐츠를 소프트웨어 시스템을 이용하거나 정성적으로 분석함으로써 삭카린나트륨에 대한 소비자 인식도를 조사하고자 하였다. 첫 번째로, 1년(2013.7~2014.6)의 기간 동안 네이버와 카페에서 작성된 글들을 수집하였으며, 수집된 글들은 무료 텍스트 분석 소프트웨어인 TONK를 사용하여 분석되었다. 블로그와 카페에서 작성된 글들은 주로 삭카린나트륨을 사용하지 않은 제품에 대한 것으로 파악되었으며, 기타 높은 단맛과 낮은 열량을 보이는 삭카린나트륨의 특성, 식품첨가물 제거법에 대한 내용이 있는 것으로 파악되었다. 두 번째로, 네이버 트렌드 검색 서비스를 이용하여 삭카린나트륨에 대한 검색량 증가 구간에 발생한 언론보도 사건을 조사하였다. PC 검색량의 경우 총 11개 증가 구간 중 6개의 구간에서, 모바일 검색량의 총 12개 증가 구간 중 8개의 구간에서 뉴스에서 삭카린나트륨 사용허용 품목 확대에 대해 보도한 것으로 나타났다. 세 번째로 식품의약품안전처의 삭카린나트륨 사용 허용품목 확대 발표를 보도한 연합뉴스의 댓글을 분석하였다. 공감수 100개 이상인 댓글의 내용을 분석 결과 정부 불신을 비판하는 댓글들이 가장 많았으며, 그 외 관련 제품의 가격 비판 댓글과 기업 불신을 드러내는 댓글들이 파악되었다. 시판 제품들의 표시사항 분석 결과, 삭카린나트륨을 첨가하지 않은 제품들은 삭카린나트륨 무첨가라는 표시를 강조하고 있는 것으로 조사되었다. 본 연구 결과 소비자들은 삭카린나트륨의 사용 확대에 관심이 있으며, 사용 확대 보도시에 검색량이 증가하였다. 따라서, 매체들은 삭카린나트륨 사용 확대에 관하여 보도를 할 때에 과학적인 근거에 바탕하여 확대배경이나 적정 섭취량 등을 함께 알리는 것이 소비자의 올바른 인식에 도움을 줄 것이다.

텍스트 마이닝을 활용한 2017년 한국 대선 분석 (An Analysis of the 2017 Korean Presidential Election Using Text Mining)

  • 안은희;안정국
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.199-207
    • /
    • 2020
  • 최근 빅데이터 분석은 대량의 데이터로부터 미래를 예측하여 가치를 창출할 수 있어 다양한 분야에서 주목받고 있으며, 정치 캠페인 운영이나 결과 예측에도 활용되고 있다. 하지만 기존의 연구는 특정 SNS 데이터만을 분석하여 후보자들에 대한 정보를 취합하는데 한계가 있었다. 이에 본 연구는 2017년 한국 대선 후보별 뉴스와 댓글을 수집하여 뉴스 생성 추이, 토픽 추출, 감성 분석, 키워드 분석, 키워드 감성 분석을 하였다. 분석 결과, 대선 후보 간 다양한 토픽들이 생성되는 것을 확인하였으며, 후보별 이슈가 되는 중점 키워드와 이에 대한 유권자들의 호응도가 추출되었다. 본 연구는 포털 뉴스에서 생성되는 대선 캠페인에 대한 동향을 마이닝 할 수 있게 했다는 점과 감성 분석을 통해 대권주자들에 대한 유권자들의 관심과 의견들을 정량화하여 수치화한 것에 의의가 있다. 본 연구가 여론 수렴의 도구적 방법을 제시함으로써 이를 바탕으로 전략적인 행동 방안을 도출할 수 있을 것을 기대한다.

온라인 저널리즘의 추천기사가 뉴스 이용자의 뉴스기사 선택에 미치는 영향 (Effect of the Recommendation Story in Online Journalism on the User's News Selection)

  • 박광순;안종묵
    • 한국산학기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.1795-1805
    • /
    • 2015
  • 본 연구는 온라인 저널리즘의 추천기사가 대학생들의 뉴스기사 선택에 미치는 영향을 두 차원에서 분석하였다. 하나는 추천기사이고, 다른 하나는 이들 뉴스기사의 배치순위와 이용지수이다. 분석결과 11개의 추천기사 유형 중 7개 유형은 뉴스기사 선택에 긍정적인 영향을 미치는 것으로 나타난 반면, 4개 유형은 유의미하지 않은 것으로 나타났다. 뉴스기사 선택에 영향을 미치지 않은 것으로 나타난 추천기사 유형의 대부분은 댓글이나 SNS의 트윗과 관련된 것들이다. 또한 뉴스기사 및 검색어 배치순위는 뉴스기사 선택에 영향을 미치는 것으로 나타났으나 이용지수는 영향을 미치지 않은 것으로 나타났다. 한편, 뉴스기사 이용시간과 추천기사 유형 간 그리고 추천기사 유형 간 상관관계는 대부분 유의미한 것으로 나타났다. 분석결과를 종합하면, 뉴스기사 게재위치와 온라인 저널리즘의 추천기사와 같은 형식적 요인은 뉴스기사 헤드라인과 검색어 등의 내용과 더불어 뉴스 이용자들의 뉴스기사 선택에 긍정적인 영향을 미치는 것으로 결론지을 수 있다.

온라인 뉴스에 대한 한국 대중의 감정 예측 (Inference of Korean Public Sentiment from Online News)

  • ;최순영;임희석
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.25-31
    • /
    • 2018
  • 온라인 뉴스는 기존의 신문을 대체하였고, 우리가 정보에 접근하고 공유하는 방법에 큰 변화를 가져왔다. 뉴스 웹사이트들은 사용자가 댓글을 남길 수 있는 기능을 오랜 시간동안 제공하였고, 그 중 몇몇 뉴스 웹사이트에서는 뉴스 기사들에 대한 사용자의 반응들을 크라우드소싱(crowdsource)하기 시작했다. 감정분석 분야에서는 텍스트에 반영된 감정과 반응들을 컴퓨팅적으로 모델링하기 위한 시도를 하고 있다. 본 연구에서는 뉴스 기사에 대한 반응들이 뉴스 본문과 수학적인 상관관계를 갖는지 밝히기 위해, 사용자로부터 생성된 다섯 가지의 감정 라벨(label)을 사용하여 10가지 카테고리(category)에 해당하는 100,000개 이상의 뉴스 기사들을 분석한다. 본 연구에서는 전처리과정이 최소한으로 필요하고 기계학습이 적용하지 않아도 되는 간단한 감정 분석 알고리즘(algorithm)을 제안한다. 우리는 이 모델이 한국어와 같은 형태론적으로 복잡한 언어에도 효과적이라는 것을 증명한다.