• 제목/요약/키워드: 뉴스기사 분석

검색결과 366건 처리시간 0.124초

순환 신경망과 합성곱 신경망을 이용한 뉴스 기사 편향도 분석 (Analyzing Media Bias in News Articles Using RNN and CNN)

  • 오승빈;김현민;김승재
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.999-1005
    • /
    • 2020
  • 오늘날의 검색 포털은 뉴스의 창구로서는 가장 큰 비율을 차지하지만, 중립성에 대해서는 의문이 제기되고 있다. 이는 포털 뉴스가 편향된 정보의 소비를 유도할 수 있기 때문이다. 본 논문은 뉴스 기사의 정치적 편향도를 딥러닝을 이용하여 측정하는 방법에 대하여 소개한다. 이는 기사를 비판적으로 바라보는 시각을 뉴스 독자에게 제공할 것이다. 구체적으로, 국회 회의록에서 추출한 키워드에 편향도를 부여하고, 이를 기반으로 기사의 편향도를 분석하여 머신러닝용 데이터를 구축하였다. 최종적으로 순환 신경망과 합성곱 신경망을 융합한 딥러닝을 통해 기사의 편향도를 계산하는 것을 목표로 하였다. 학습한 모델의 정확도를 분석한 결과 문장별 편향의 좌/우편향 판정은 95.6%의 정확도를 보였으나, 신문기사 전체에서는 46.0%의 정확도를 보였다. 이는 기존의 여러 편향성 연구와 다르게 특정 주제에 한정되지 않고 기사의 보수-진보 편향성을 분석할 수 있도록 한다.

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

생성 AI 기반 뉴스 기사 심리지수를 활용한 부동산 가격 예측 모델 (Predictive Model for Real Estate Prices Using Sentiment Index of news articles based on Generative AI )

  • 김수아;권미주;조수빈;김은수;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1198-1199
    • /
    • 2023
  • 부동산 시장은 다양한 요인에 의해 가격이 결정되며 거시경제 변수뿐 만 아니라 뉴스 기사, SNS 등 다양한 비정형 데이터의 영향을 받는다. 특히 뉴스 기사는 국민들이 느끼는 경제 심리를 반영하고 있어 부동산 가격에 영향을 크게 미치는 변수라고 판단된다. 본 연구에서는 뉴스 기사의 세분화된 감정 분석을 통해 전통적인 분석 방법보다 더 의미 있는 결과를 얻을 수 있는 부동산 가격 예측 모델을 생성하였으며 뉴스 기사로부터 심리 지수를 산출하기 위해 생성 AI 를 활용하였다. 제안하는 매매가격지수 예측 모델을 통해 부동산 시장과 뉴스 기사와의 관계성에 대해 파악할 수 있으며, 사회/경제적 동향을 반영한 부동산 가격 변동을 예측할 수 있을 것으로 보인다.

트위터와 뉴스기사 분석을 통해 본 계모에 대한 사회적 인식 (Stepmother Images through Analyses of Twitter and News Articles)

  • 정수정;김소은;정익중
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.665-678
    • /
    • 2018
  • 본 연구의 목적은 소셜미디어와 언론매체에서 나타나고 있는 계모에 대한 사회적 인식을 조사하기 위해, 트위터와 뉴스기사에 나타난 내용을 분석해보았다. 이를 위해 트위터와 뉴스기사에서 '계모'로 검색된 텍스트를 분석하였고, 주된 연구결과는 다음과 같다. 'R'을 이용한 분석 결과 계모에 대한 부정적인 이미지는 어린 시절 접하게 되는 동화의 키워드와 연관되어 있음을 확인할 수 있었다. 트위터와 뉴스 기사를 분석한 결과 대중의 인식은 '계모'에 대한 부정적인 고정적 이미지 강화, 대안적 메시지 제공의 두 유형으로 구분되었다. 부정적 이미지는 동화처럼 계자녀를 구박하는 부정적 계모의 이미지와 함께 재혼가정에 대한 부정적 인식이 고정관념으로 강조되어 드러난 것을 확인할 수 있었다. 긍정적인 대안적 메시지로는 재결합 가족에 대한 부정적 인식이 생겨나는 것에 대해 우려가 형성되고 있었다. 이러한 연구결과를 바탕으로 계모에 대한 고정관념에서 벗어나기 위한 대안 등을 논의하였다.

온라인신문의 시각화에 대한 분석: 종속형 온라인신문과 네이버 뉴스를 중심으로 (An Analysis on the Visualization of the Online Newspaper : Focusing on the dependent Online Newspaper and Naver News)

  • 박광순
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.321-329
    • /
    • 2016
  • 본 연구는 온라인신문의 시각화에 대한 분석을 통해 지면변화의 정도를 파악하기 위해 실시되었다. 분석은 종속형 온라인신문인 조선, 동아, 중앙, 한겨레, 경향, 한국일보 등 6개 언론사닷컴 홈페이지와 네이버의 뉴스섹션에서 이들 신문의 홈페이지를 비교분석 하였다. 신문지면의 시각화에 대한 분석은 이미지에 한정하였다. 각 신문 간 시각화의 차이를 파악하기 위해 모든 이미지가 지면에서 차지하는 면적의 크기를 산출하여 비교하였다. 분석결과 현재 온라인신문은 초기 단계의 문자 텍스트 일색이었던 것에 비해 점진적으로 이미지 사용 증가에 따라 시각화가 크게 향상되었음을 파악할 수 있었다. 또한 한정된 지면에서 이와 같은 이미지 사용의 증가로 제목 중심의 뉴스기사 수가 크게 감소된 사실도 알 수 있었다. 특히 일부 온라인신문의 경우 다른 신문들에 비해 이미지를 매우 크게 활용하면서 뉴스기사의 수를 적게 게재하고 있었다. 또 다른 특정 신문의 경우 1차 자료수집 시기에는 지면의 모든 뉴스기사가 사진기사로 구성되었으나 2차 시기에는 소수의 제목기사와 함께 구성되고 있었다. 결론적으로 온라인신문은 종이신문이 오랜 기간에 걸쳐 시각화를 통해 '읽는 신문'에서 '보는 신문'으로 전환된 것처럼 시각화 수준이 더욱 향상될 것이다.

연관규칙 마이닝을 활용한 뉴스기사 키워드의 연관성 탐사 (Discovering News Keyword Associations Using Association Rule Mining)

  • 김한준;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.63-71
    • /
    • 2011
  • 현재 대부분의 웹포털 사이트는 인기도 또는 중요도가 높은 키워드를 제공하는 서비스가 제공되고 있는데, 구체적으로 태그 클라우드 형태와 연관 검색 서비스와 같은 사용자 친화형 서비스를 지원하고 있다. 하지만 일반적으로 뉴스기사는 날짜와 분야별로 기사들이 분류되어 있기에, 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사를 쉽게 찾아보지는 못한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력내용을 기반으로 연관성 정도를 분석하기에 충분한 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 방식을 제안한다. 제안 기법은 기본적으로 연관규칙 마이닝을 이용하여 키워드 연관성을 추출하게 되며, 뉴스기사 특성을 반영하여 문장 내부에 존재하는 키워드에 한정하여 연관성을 추출한다. 연관된 키워드 집합을 이용하여 키워드와 가장 밀접한 기사를 검색할 뿐만 아니라, 연관 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

포털 뉴스 기사 분석을 통한 국가 간 관계 변화 추이 연구 - 체코를 중심으로 - (A Study on the Change of Relation between Countries through Analysis of Portal News Articles: Focusing on the Czech Republic)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.159-178
    • /
    • 2019
  • 본 연구의 목적은 포털 뉴스를 통해 보도된 특정 국가(체코)에 대한 기사 내용을 기간별로 분석해봄으로써 우리나라와 체코와의 분야별 관계 변화 추이를 고찰해 보기 위함이다. 이를 위해, 국내 포털 사이트 중 하나인 네이버 뉴스 검색을 통해 1990년부터 2019년 3월 31일 현재까지 체코에 관하여 보도된 뉴스 기사를 분석하였다. 1990년부터 5년 단위로 6개의 기간을 설정하여 각 기간별로 200개씩의 체코에 관한 뉴스 기사 총 1,200건을 4개 분야(정치, 경제, 사회 및 문화, 교육)로 나누어 분석하였다. 분석결과, 사회 및 문화 분야 기사 건수의 비중이 가장 큰 것으로 나타났으며 세부 주제의 변화 범위 또한 가장 광범위하게 이루어 졌음을 알 수 있었다. 결론에서는 양국 간의 보다 긴밀한 관계 구축을 위한 분야별 협력 증진 방안을 제시하였다.

효과적인 브라우징을 위한 뉴스 기사 요약에 관한 연구 (A Study on Skimming of News Article for an Efficient Browsing)

  • 이주호;정승도;조정원;최병욱
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.219-222
    • /
    • 2000
  • 수많은 종류의 비디오 데이터를 효율적으로 검색하기 위해서는 데이터를 분석하여 사용자에게 먼저 전체 비디오의 요약을 제시하는 것이 효과적이다. 본 논문에서는 기사 단위로 분할된 뉴스 기사 전체를 보여주지 않으면서도 기사의 내용을 왜곡됨이 없이 요약하여 효과적으로 사용자에게 보여주기 위한 방법을 제안한다. 본 논문에서는 사용자에게 시각적인 요약 정보를 앵커 프레임 추출 및 대표 프레임 추출을 통해 필름 스트림(film trip)의 형태로 제시하고, 기사를 소개하는 앵커의 첫 대사를 폐쇄 자막(closed-caption)을 이용하여 추출하여, 이를 기사의 내용에 대한 요약으로 필름 스트립과 같이 제시하도록 하였다. 앵커 프레임을 추출하기 위해 본 논문에서는 폐쇄 자막에서의 "앵커:" 태그가 존재하는 시간 구간과 동기된 프레임을 선정한다. 또한 대표 프레임은 공개형 자막(open-cpation)이 존재하는 프레임과 빈도에 기반한 가중치가 높은 .폐쇄 자막에서의 키워드와 동기된 프레임을 선정하도록 하였다. 본 논문의 뉴스 기사 요약 시스템은 시각적인 프레임제시와 함께 기사의 내용을 바탕으로 하는 기사 요약문을 같이 사용자에게 제공함으로써 기존의 필름 스트립형태만 제공하던 시스템에 비하여 사용자 중심의 지능형 요약 서비스가 가능함을 실험을 통해 보인다.

  • PDF

온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법 (A Morphological Analysis Method of Predicting Place-Event Performance by Online News Titles)

  • 최석재;이재웅;권오병
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.15-32
    • /
    • 2016
  • 공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다.

'통합교육' 관련 중앙일간지 뉴스 기사의 변화과정 분석 -2000~2009년(10년간) vs 2010~2019년(10년간) 비교 중심으로- (Analysis of the Change Process of News Articles related to 'Inclusive Education' -2000~2009(10 years) vs. 2010~2019(10 years))

  • 박상희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.171-172
    • /
    • 2020
  • 본 연구는 오늘날 특수교육의 가장 핵심적인 방법론인 '통합교육'을 다룬 중앙일간지 뉴스 기사의 변화과정을 분석하였다. 신문자료는 오늘날 빅데이터 시대의 하나의 가치 있는 분석대상으로 부각되고 있다. 또 언론사 뉴스 분석방법론은 관련 학문 연구자의 언어가 아닌 일반 시민들의 인식수준을 확인하는 데 도움을 준다. 본 연구의 결과는 2000년 이후 20년간의 시간대를 10년 단위로 분할하여, '통합교육'의 모습이 어떻게 전파되었는 지를 확인하였다. 본 연구는 분석대상 자료를 기초로 하여, 객관적인 연구방법론을 추가하여 보완해 나갈 것이다.

  • PDF