• 제목/요약/키워드: 뉴스기사 본문

검색결과 20건 처리시간 0.021초

인터넷 미디어 뉴스기사 본문의 하이퍼링크에 대한 분석 -네이버, 다음, 야후를 중심으로- (Analysis on the Hyperlink of News Articles on the Internet Media : Focusing upon the Naver, Daum, Yahoo Site)

  • 박광순
    • 한국콘텐츠학회논문지
    • /
    • 제10권11호
    • /
    • pp.329-340
    • /
    • 2010
  • 본 연구는 포털사이트와 언론사닷컴 뉴스기사 본문의 하이퍼링크에 대한 분석을 통해 온라인 저널리즘의 뉴스서비스에 대한 특징을 파악하기 위해 실시되었다. 분석결과 뉴스기사 본문에 하이퍼링크 서비스가 제공된 뉴스기사 수는 언론사닷컴에 비해 포털사이트가 더 많았다. 그러나 하이퍼링크 서비스가 제공된 뉴스기사에서의 하이퍼링크 수는 포털사이트에 비해 언론사닷컴이 더 많았다. 포털사이트인 다음과 야후의 비교에서는 다음이 야후에 비해 하이퍼링크 서비스가 제공된 뉴스기사의 수와 1건의 기사에 제공된 하이퍼링크 수도 더 많았다. 하지만 하이퍼링크 서비스가 제공된 뉴스기사에서의 하이퍼링크 수는 야후가 더 많았다. 온라인 저널리즘의 뉴스기사 본문에 하이퍼링크 된 콘텐츠는 정보유형과 광고유형으로 구성되었다. 포털사이트 뉴스기사 본문에 하이퍼링크 된 모든 콘텐츠는 정보유형이었다. 반변 언론사닷컴 뉴스기사 본문에 하이퍼링크 된 콘텐츠는 약 92%가 광고유형이었다. 정보유형 콘텐츠는 뉴스기사에 사용된 용어의 의미와 관련된 것이지만, 광고유형의 콘텐츠는 뉴스기사의 내용과 관련이 없는 것들로 구성되었다.

인터넷신문의 뉴스기사 페이지 구성과 콘텐츠에 대한 분석 -네이버, 다음, 네이트, 야후를 중심으로- (An Analysis of the Contents and Make-up of the Page in a News Story of the Internet Newspaper -focusing on Naver, Daum, Nate, Yahoo-)

  • 박광순
    • 한국산학기술학회논문지
    • /
    • 제15권3호
    • /
    • pp.1345-1354
    • /
    • 2014
  • 본 연구는 인터넷신문의 뉴스기사 본문 페이지 구성과 뉴스기사 본문 주변 공간의 콘텐츠 유형을 비교 분석하였다. 분석결과 네이버 뉴스기사 본문 페이지의 포맷은 다음, 네이트, 야후의 뉴스기사 본문 페이지보다 더 복잡하게 구성되었다. 또한 네이버는 다른 세 포털에 비해 광고 수, 광고 유형, 오락 콘텐츠, 다양한 유형의 콘텐츠가 더 높게 게재되었다. 특히 연예인 관련 뉴스기사의 게재 비율이 다른 포털사이트에 비해 높았다. 뉴스기사 본문 페이지에 뉴스기사를 가장 많이 게재한 포털사이트는 다음이었으며, 광고를 가장 적게 게재한 포털사이트는 야후였다. 그러나 전체적으로 볼 때, 이들 세 포털사이트의 뉴스기사 페이지의 포맷과 콘텐츠는 매우 유사하게 구성되었다. 결론적으로 독자들의 광고회피와 뉴스기사의 다양성 측면에서의 뉴스기사 이용의 편리성은 포털사이트의 뉴스서비스가 언론사닷컴의 뉴스서비스 보다 더 높은 것으로 평가할 수 있다.

인터넷신문 섹션별 뉴스기사 본문의 하이퍼링크에 대한 분석: 조선닷컴과 워싱턴포스트를 중심으로 (An Analysis of the Hyperlinks of Internet Newspaper Sites: Focused on Chosun.com and the Washington Post)

  • 김성희;노윤주
    • 정보관리연구
    • /
    • 제43권4호
    • /
    • pp.119-142
    • /
    • 2012
  • 본 연구는 조선닷컴과 워싱턴포스트의 섹션별 뉴스기사 본문의 하이퍼링크 서비스와 링크된 단어의 콘텐츠 유형을 분석하였다. 그 결과를 살펴보면 첫째, 국내 외 인터넷신문의 섹션별 뉴스 분포에서 조선닷컴은 라이프 섹션이 32.4%로 가장 많은 비중을 차지하였으며, 워싱턴포스트는 대체적으로 골고루 분포되어 있는 것으로 나타났다. 둘째, 섹션별 하이퍼링크 서비스를 살펴본 결과 조선닷컴은 정치섹션이 가장 많은 하이퍼링크 서비스를 제공하고 있었으며, 이어서 라이프섹션, 국제섹션 등의 순이었다. 워싱턴포스트는 Politics 섹션, Sports 섹션, Opinions 섹션 등의 순으로 하이퍼링크 서비스를 제공하고 있는 것으로 나타났다. 마지막으로 섹션별 뉴스기사 본문 단어에 하이퍼링크 된 콘텐츠 유형을 분석한 결과 조선닷컴과 워싱턴포스트 모두 정보획득형이 가장 많고, 이어서 탐색형, 트랜잭션형 순으로 나타났다. 이러한 연구결과는 인터넷신문의 특성을 이해하고, 다양한 이용자 요구에 적합한 하이퍼링크 서비스를 제공하기 위한 기초 자료로 활용될 수 있을 것이다.

합성곱신경망과 감성분석 기반의 가짜뉴스 탐지 (Fake News Detection based on Convolutional Neural Network and Sentiment Analysis)

  • 이태원;양영욱;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.64-67
    • /
    • 2021
  • 가짜뉴스는 뉴스 기사 형식을 갖는 날조된 정보를 의미하며, 최근 모바일 인터넷 장치의 보급과 소셜 네트워크 서비스의 대중화로 온라인 확산이 가속화되고 있다. 기존 연구는 가짜뉴스의 탐지를 위해 뉴스의 주제목, 부제목, 리드, 본문 등 뉴스 기사를 이루는 구성요소를 비롯하여 언론사, 기자, 날짜, 확산 경로 등의 메타 데이터를 대상으로 분석하였다. 그러나 뉴스의 제목과 본문 및 메타 데이터 등은 내용 수정이 쉬워, 다량의 데이터를 학습한 모델이라 하더라도 높은 정확도를 장기간 유지하기 어려울 수 있다. 이러한 문제점을 해결하기 위하여 본 논문은 합성곱 신경망을 이용해 문맥 정보를 분석하고 장단기 메모리 기반의 감성분석을 추가로 수행한다. 문맥 정보와 가짜뉴스 유포자가 쉽게 수정할 수 없는 감성 변화 패턴을 활용하여 성능이 개선된 가짜뉴스 탐지 모델을 제안한다.

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

사용자 그래프 기반 한국어 가짜뉴스 판별 방법 (Korean Fake News Detection with User Graph)

  • 강명훈;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-102
    • /
    • 2021
  • 최근 급격한 정보기술의 발달로 가짜뉴스가 사회문제로 대두되고 있다. 한국어 가짜뉴스 문제를 딥러닝으로 해결하기 위해서 기존의 연구들은 본문 기반의 가짜뉴스 탐지를 진행하였으며 최근에는 기사 본문 외의 보조적 정보를 활용하는 방법으로 연구가 진행되고 있다. 그러나 기존의 방식과 개선된 방식들 모두 적절한 가짜뉴스 탐지 방법을 제시하지 못하여 모델이 산출한 가짜뉴스 표현 벡터의 품질을 보장할 수 없었다. 또한 한국어 가짜뉴스 문제를 해결함에 있어서 적절한 공개 데이터셋 또한 제공되지 않았다. 따라서 본 논문은 한국어 가짜뉴스 탐지 문제에서 독자 반응정보를 추가하여 효과적인 학습을 할 수 있는 '사용자 그래프 기반 한국어 가짜뉴스 판별 방법'과 해당 모델이 적절히 학습할 수 있는 간이 데이터셋 구축 방법을 제안한다.

  • PDF

온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법 (A Morphological Analysis Method of Predicting Place-Event Performance by Online News Titles)

  • 최석재;이재웅;권오병
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.15-32
    • /
    • 2016
  • 공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다.

텍스트 마이닝을 이용한 기사 내 부적합 문단 검출 시스템 (Detecting Improper Sentences in a News Article Using Text Mining)

  • 김규완;신현주;김선진;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-297
    • /
    • 2017
  • SNS와 스마트기기의 발전으로 온라인을 통한 뉴스 배포가 용이해지면서 악의적으로 조작된 뉴스가 급속도로 생성되어 확산되고 있다. 뉴스 조작은 다양한 형태로 이루어지는데, 이 중에서 정상적인 기사 내에 광고나 낚시성 내용을 포함시켜 독자가 의도하지 않은 정보에 노출되게 하는 형태는 독자가 해당 내용을 진짜 뉴스로 받아들이기 쉽다. 본 논문에서는 뉴스 기사 내에 포함된 문단 중에서 부적합한 문단이 포함되었는지를 판정하기 위한 방법을 제안한다. 제안하는 방식에서는 자연어 처리에 유용한 Convolutional Neural Network(CNN)모델 중 Word2Vec과 tf-idf 알고리즘, 로지스틱 회귀를 함께 이용하여 뉴스 부적합 문단을 검출한다. 본 시스템에서는 로지스틱 회귀를 이용하여 문단의 카테고리를 분류하여 본문의 카테고리 분포도를 계산하고 Word2Vec을 이용하여 문단간의 유사도를 계산한 결과에 가중치를 부여하여 부적합 문단을 검출한다.

  • PDF

텍스트 마이닝을 이용한 기사 내 부적합 문단 검출 시스템 (Detecting Improper Sentences in a News Article Using Text Mining)

  • 김규완;신현주;김선진;이현아
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.294-297
    • /
    • 2017
  • SNS와 스마트기기의 발전으로 온라인을 통한 뉴스 배포가 용이해지면서 악의적으로 조작된 뉴스가 급속도로 생성되어 확산되고 있다. 뉴스 조작은 다양한 형태로 이루어지는데, 이 중에서 정상적인 기사 내에 광고나 낚시성 내용을 포함시켜 독자가 의도하지 않은 정보에 노출되게 하는 형태는 독자가 해당 내용을 진짜 뉴스로 받아들이기 쉽다. 본 논문에서는 뉴스 기사 내에 포함된 문단 중에서 부적합한 문단이 포함 되었는지를 판정하기 위한 방법을 제안한다. 제안하는 방식에서는 자연어 처리에 유용한 Convolutional Neural Network(CNN)모델 중 Word2Vec과 tf-idf 알고리즘, 로지스틱 회귀를 함께 이용하여 뉴스 부적합 문단을 검출한다. 본 시스템에서는 로지스틱 회귀를 이용하여 문단의 카테고리를 분류하여 본문의 카테고리 분포도를 계산하고 Word2Vec을 이용하여 문단간의 유사도를 계산한 결과에 가중치를 부여하여 부적합 문단을 검출한다.

  • PDF

뉴스 웹 페이지에서 기사 본문 추출에 관한 연구 (A Study on Extracting News Contents from News Web Pages)

  • 이용구
    • 정보관리학회지
    • /
    • 제26권1호
    • /
    • pp.305-320
    • /
    • 2009
  • 웹을 통해 제공되는 뉴스 페이지의 경우 필요한 정보 뿐 아니라 많은 불필요한 정보를 담고 있다. 이러한 불필요한 정보는 뉴스를 처리하는 시스템의 성능 저하와 비효율성을 가져온다. 이 연구에서는 웹 페이지로부터 뉴스 콘텐츠를 추출하기 위해 문장과 블록에 기반한 뉴스 기사 추출 방법을 제시하였다. 또한 이들을 결합하여 최적의 성능을 가져올 수 있는 방안을 모색하였다. 실험 결과, 웹 페이지에 대해 하이퍼링크 텍스트를 제거한 후 문장을 이용한 추출 방법을 적용하였을 때 효과적이었으며, 여기에 블록을 이용한 추출 방법과 결합하였을 때 더 좋은 결과를 가져왔다. 문장을 이용한 추출 방법은 추출 재현율을 높여주는 효과가 있는 것으로 나타났다.