• 제목/요약/키워드: 뉴스기사

검색결과 505건 처리시간 0.034초

사건중심 뉴스기사 자동요약을 위한 사건탐지 기법에 관한 연구 (A Study on an Effective Event Detection Method for Event-Focused News Summarization)

  • 정영미;김용광
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.227-243
    • /
    • 2008
  • 이 연구에서는 사건중심 뉴스기사 요약문을 자동생성하기 위해 뉴스기사들을 SVM 분류기를 이용하여 사건 주제범주로 먼저 분류한 후, 각 주제범주 내에서 싱글패스 클러스터링 알고리즘을 통해 특정한 사건 관련 기사들을 탐지하는 기법을 제안하였다. 사건탐지 성능을 높이기 위해 고유명사에 가중치를 부여하고, 뉴스의 발생시간을 고려한 시간벌점함수를 제안하였다. 또한 일정 규모 이상의 클러스터를 분할하여 적절한 크기의 사건 클러스터를 생성하도록 수정된 싱글패스 알고리즘을 사용하였다. 이 연구에서 제안한 사건탐지 기법의 성능은 단순 싱글패스 클러스터링 기법에 비해 정확률, 재현율, F-척도에서 각각 37.1%, 0.1%, 35.4%의 성능 향상률을 보였고, 오보율과 탐지비용에서는 각각 74.7%, 11.3%의 향상률을 나타냈다.

온라인신문의 시각화에 대한 분석: 종속형 온라인신문과 네이버 뉴스를 중심으로 (An Analysis on the Visualization of the Online Newspaper : Focusing on the dependent Online Newspaper and Naver News)

  • 박광순
    • 디지털융복합연구
    • /
    • 제14권7호
    • /
    • pp.321-329
    • /
    • 2016
  • 본 연구는 온라인신문의 시각화에 대한 분석을 통해 지면변화의 정도를 파악하기 위해 실시되었다. 분석은 종속형 온라인신문인 조선, 동아, 중앙, 한겨레, 경향, 한국일보 등 6개 언론사닷컴 홈페이지와 네이버의 뉴스섹션에서 이들 신문의 홈페이지를 비교분석 하였다. 신문지면의 시각화에 대한 분석은 이미지에 한정하였다. 각 신문 간 시각화의 차이를 파악하기 위해 모든 이미지가 지면에서 차지하는 면적의 크기를 산출하여 비교하였다. 분석결과 현재 온라인신문은 초기 단계의 문자 텍스트 일색이었던 것에 비해 점진적으로 이미지 사용 증가에 따라 시각화가 크게 향상되었음을 파악할 수 있었다. 또한 한정된 지면에서 이와 같은 이미지 사용의 증가로 제목 중심의 뉴스기사 수가 크게 감소된 사실도 알 수 있었다. 특히 일부 온라인신문의 경우 다른 신문들에 비해 이미지를 매우 크게 활용하면서 뉴스기사의 수를 적게 게재하고 있었다. 또 다른 특정 신문의 경우 1차 자료수집 시기에는 지면의 모든 뉴스기사가 사진기사로 구성되었으나 2차 시기에는 소수의 제목기사와 함께 구성되고 있었다. 결론적으로 온라인신문은 종이신문이 오랜 기간에 걸쳐 시각화를 통해 '읽는 신문'에서 '보는 신문'으로 전환된 것처럼 시각화 수준이 더욱 향상될 것이다.

사행산업 관련 뉴스의 빅데이터 분석을 통한 정책 연구 (Study of Policy through Big data Analysis about Gambling News)

  • 문혜정;김성경
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.190-193
    • /
    • 2016
  • 본 연구는 사행산업의 분야인 복권, 체육진흥투표권, 경마, 카지노에 대해 언론에서는 어떻게 다루어지고 있는지를 1990년부터 2015년까지의 뉴스데이터를 빅데이터 분석 방법 중 테스트의 의미연결망 분석을 통해 밝혀보고자 하는 연구이다. 이 논문은 의미망 분석을 통해 기사의 빈도와 연결성을 프레이밍과 시민관심 정도로 재조명 하여 기사에 대한 언론보도자의 의도와 시민의 인식차이를 밝혔고, 이를 통해 정책적 특성과 개혁과제를 탐색하였다. 분석결과 복권의 경우 당첨번호, 당첨금, 조작의혹 등 당첨에 대한 부분이 주제인 '사회문제' 형태였으며, 체육진흥투표권의 경우에는 사업입찰, 불법사이트, 발매대상 등 주로 사업추진과 불법사이트에 대한 '의무정보' 종류였고, 경마의 경우 사업장, 홍보, 기사 등으로 사업홍보나 광고 관련 뉴스이었고, 마지막으로 카지노의 경우에는 불법, 도박장, 외국인 등 '주요정보'에 해당하는 논문이었다. 시대에 따라 1990년대에는 카지노, 2000년대에는 복권, 2010년대에는 경마에 대한 기사보도가 많아졌으며, 이에 대한 시민의 반응도 사업비리, 당첨, 시민운동 등의 차이가 있었다. 마지막으로 기사의 빈도와 연결성이 나타내는 프레이밍 정도와 시민의 관심은 '1. 홍보광고, 2. 의무정보, 3. 사회이슈, 4. 주요정보' 네 가지로 구분되었으며 이 중 사고, 비리 등 주요기사로 구분되는 사회문제가 주요 공공의제로 형성되는 것을 확인할 수 있었다.

  • PDF

정치인의 지지율과 인터넷 뉴스 기사량의 상관관계 분석 (An Analysis of the Correlation Between Politicians Approval Rating and the Amount of Internet News Articles)

  • 이필수;이윤정;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1770-1772
    • /
    • 2012
  • 현재 인터넷 공간은 사람들의 관심사나 사회적인 이슈들을 반영하고 있다. 사회적으로 어떤 사건이 발생하면 그 사건에 관한 뉴스 기사나 관련된 다양한 콘텐츠들이 생성되어 여러 사람들에게 소비되고 공유된다. 뿐만 아니라 이와는 반대로 인터넷 공간에서 사람들에게 많은 관심을 받거나 이슈가 된 사건이 사회적인 관심거리가 되기도 한다. 최근에는 인터넷 공간에서 발생하는 정보 검색이나 콘텐츠 생성 패턴을 분석하여 실제 사회에서의 이슈나 트렌드를 예측하려는 연구가 활발히 진행되고 있다. 이 논문에서는 인터넷을 기반으로 분석한 자료와 전문 기관에서 분석한 자료의 상관관계를 분석하고자 한다. 그 중 최근 뉴스나 콘텐츠가 많이 생산되는 2012년 대통령 선거 후보에 관한 인터넷 뉴스 기사량과 전문조사 기관에서 발표한 각 후보의 지지율을 보이고 두 자료 간의 상관관계를 분석한다. 그리고 실험 결과로 대선 후보들의 기사 점유율과 발표된 지지율에 높은 상관관계가 있음을 보인다.

KoBERT 모델 기반 한국어 뉴스 기사 제목 선정성 및 폭력성 검출 (Detection of sexuality and violence in Korean news article title based on KoBERT mode)

  • 김민지;김환도;봉지민;김대환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.570-571
    • /
    • 2023
  • 최근 선정적이고 폭력적인 뉴스 기사 제목의 여과 없는 노출로 인하여 유해한 언어 접촉이 빈번히 이루어지고 있다. 자극적인 단어에 지속적으로 노출되는 것은 인지 능력에 부정적 영향을 주는 것으로 알려져 있다. 따라서 이를 사전에 판별하여 정보를 수용하는 것이 필요하다. 본 논문에서는 KoBERT를 기반으로 한국어 뉴스 기사 제목에서 선정성과 폭력성을 검출하고자 한다. 학습을 위한 뉴스 기사 제목들은 인터넷에서 무작위로 총 9,500개의 데이터를 크롤링 하여 수집하였고, 모델의 말단에 NLNet을 추가하여 문장 전체의 관계를 학습했다. 그 결과 선정성 및 폭력성을 약 89%의 정확도로 검출하였다.

포털 뉴스 기사 분석을 통한 국가 간 관계 변화 추이 연구 - 체코를 중심으로 - (A Study on the Change of Relation between Countries through Analysis of Portal News Articles: Focusing on the Czech Republic)

  • 김진묵
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.159-178
    • /
    • 2019
  • 본 연구의 목적은 포털 뉴스를 통해 보도된 특정 국가(체코)에 대한 기사 내용을 기간별로 분석해봄으로써 우리나라와 체코와의 분야별 관계 변화 추이를 고찰해 보기 위함이다. 이를 위해, 국내 포털 사이트 중 하나인 네이버 뉴스 검색을 통해 1990년부터 2019년 3월 31일 현재까지 체코에 관하여 보도된 뉴스 기사를 분석하였다. 1990년부터 5년 단위로 6개의 기간을 설정하여 각 기간별로 200개씩의 체코에 관한 뉴스 기사 총 1,200건을 4개 분야(정치, 경제, 사회 및 문화, 교육)로 나누어 분석하였다. 분석결과, 사회 및 문화 분야 기사 건수의 비중이 가장 큰 것으로 나타났으며 세부 주제의 변화 범위 또한 가장 광범위하게 이루어 졌음을 알 수 있었다. 결론에서는 양국 간의 보다 긴밀한 관계 구축을 위한 분야별 협력 증진 방안을 제시하였다.

빅데이터 처리를 통한 연예 뉴스에서의 키워드 추출에 관한 연구 (A Study on Keywords Extraction from Entertainment News using Bigdata Processing)

  • 유상현;이상준
    • 한국IT정책경영학회 논문지
    • /
    • 제11권6호
    • /
    • pp.1503-1507
    • /
    • 2019
  • 온라인 연예 뉴스 기사의 연성화와 속보성 기사가 증가함에 따라 많은 사람들이 연예면 기사를 접하며, 연예인에 대한 평가를 내릴 수 있게 됐다. 연예인에 대한 평판은 소속된 연예인 자원을 최대한 활용해야 하는 연예기획사의 사업전략에 핵심적인 요소이나, 실시간적으로 대규모 기사가 올라오는 환경에서 어떤 뉴스 기사가 어떤 연예인에 관한 것인지 체계적으로 분석하는 것은 용이하지 않다. 본 논문은 연예 뉴스 데이터에서 언급되는 연예인의 언급량을 기준으로 해당 기사의 주제가 되는 연예인을 추출하고, 해당 연예인의 연예기획사로 연관짓는 연예 뉴스 키워드 분석 시스템을 제안한다. 본 논문에서 제안된 시스템을 통해 광고사 혹은 연예기획사 측에서 사업을 위한 참고 자료로 해당 연예인의 가치 판단을 할 수 있다. 이와 더불어 증권사나 투자자들에게 연예기획사의 전망을 예측하여, 투자 전략의 토대를 마련해줄 수 있다.

LDA 및 BERTopic 기반 해외건설시장 뉴스 기사 토픽모델링 성능평가 (Evaluation of Topic Modeling Performance for Overseas Construction Market Analysis Using LDA and BERTopic on News Articles)

  • 백준우;정세환;지석호
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.811-819
    • /
    • 2023
  • 해외건설사업 시, 현지 상황을 정확하고 빠르게 파악하는 것은 프로젝트 성공을 위해 매우 중요한 요소이다. 이는 토픽모델링을 활용한 뉴스 기사 분석을 통해 실현될 수 있다. 본 연구는 Latent Dirichlet Allocation(LDA)과 BERTopic 두 토픽모델링 기법을 활용하여 뉴스 기사를 분석하고, 최적의 기법을 찾고자 하였다. 모델링 결과로 자동생성된 토픽과 실제 문서 주제와의 일치 여부를 확인하기 위해 BBC 뉴스 기사 6,273건 을 수집하여 ground truth를 생성하고, 이를 모델링된 토픽과 비교하였다. 그 결과 LDA의 F1 score는 0.011, BERTopic은 0.244로 나타났다. 이를 통해 BERTopic이 실제 뉴스 기사의 주제를 잘 파악하며, 해외건설시장의 주요 이슈를 자동으로 이해하는 데 더욱 용이하다는 것을 확인할 수 있었다

온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법 (A Morphological Analysis Method of Predicting Place-Event Performance by Online News Titles)

  • 최석재;이재웅;권오병
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.15-32
    • /
    • 2016
  • 공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다.

VIP: 다양한 기능을 제공하는 뉴스 리더 어플리케이션 (VIP: A News Reader Application Supporting Various Functions)

  • 박한솔;진재환;문호성;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(D)
    • /
    • pp.450-452
    • /
    • 2012
  • 본 논문에서는 뉴스 기사의 효과적인 구독을 위한 뉴스리더의 개발에 대하여 기술한다. 뉴스리더는 RSS 형식의 뉴스 기사를 사용자의 기호에 따라 미리 지정한 시간대에 수신하며 저장하여 둠으로써 빠르게 사용자에게 보여줄 수 있다. 또한, 기사에 코스피 200 상장 기업에 해당하는 기업명이 나올 경우, 한국 거래소와 연동하여 해당 기업의 종합적인 주식 정보를 보여줌으로써 효용성을 높였다.