• 제목/요약/키워드: 뉴스기사

검색결과 505건 처리시간 0.026초

지능형 에이전트를 이용한 유.무선 뉴스 검색 시스템 (Wire and Wireless News Retrieval System using Intelligent Agent)

  • 한선미;우진운
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.628-630
    • /
    • 2001
  • 오늘날 인터넷이 보편화되면서 정보 검색 및 뉴스 검색들이 일반화되고 있지만 엄청난 정보의 양과 다양성 등으로 인해 사용자들은 오히려 정보 검색의 어려움을 호소하고 있다 이에 본 논문에서는 사용자 편의의 뉴스 검색과 사용자의 요구와 취향이 반영될 수 있도록 BPN(Back Propagation Neural Network)의 학습 기능을 가진 지능형 에이전트를 이용하여 뉴스 기사를 필터링하는 뉴스 검색 시스템을 제안한다. 이 시스템은 여러 신문사의 기사를 수집 및 통합하여 그 날의 주요 기사들을 데이터베이스에 저장하는 수집 에이전트, 사용자가 입력만 키워드를 이용하여 BPN 기법으로 학습시키는 훈련 에이전트 등으로 구성되어 있다. 또한 정보 통신 기술의 눈부신 발달로 투선 인터넷이 급속히 보급되는 현실을 감안하여 무선으로도 이러한 서비스를 제공할 수 있도록 시스템을 구성하였다.

  • PDF

구간별 사용자 요구 패턴을 이용한 NOD에서의 캐싱 방법 (NOD Caching Strategy using User-Preference Pattern for Time-Window)

  • 최태욱;박용운;김영주;정기동
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.71.1-75
    • /
    • 1998
  • NOD 데이터는 VOD 데이터에 비해서 life cycle이 짧다. 그리고 사용자의 접근성이 높으며, 접근패턴도 시간에 따라 달라질 수 있다. VOD 데이터와 같이 NOD 뉴스기사의 경우 특정 기사들에 집중적으로 접근된다. 그리고 이러한 인기 있는 기사들은 시간대에 따라 변할 수 있다. 본 논문에서는 이러한 인기도의 변화를 예측하기 위해서 시계열분석방법중의 하나인 지수평활법(exponenital smoothing method)을 사용한다. 시간대별 타임윈도우로 나누고 이전의 윈도우들의 접근패턴을 분석하여 다음 접근을 예측한다. 그리고 이 예측값을 이용해서 캐시정책을 새운다. 즉 예측값이 높은 기사순으로 캐시에 배치하는 것이다. 실시간 멀티미디어데이터의 경우 데이터의 방대함으로 연산의 오버헤드가 크다. 따라서 정적인 캐싱전략을 사용하는데, 하나의 윈도우동안 재배치하는 한번으로 한다는 것이다. 전통적인 block 단위 캐싱은 멀티미디어데이터에 적합하지 않다. 따라서 기사단위의 캐시구조를 제안한다. 사용자는 기사단위로 요청을 하기 때문에 재사용을 위해서는 기사단위로 캐시되야 한다.

  • PDF

인터넷신문 섹션별 뉴스기사 본문의 하이퍼링크에 대한 분석: 조선닷컴과 워싱턴포스트를 중심으로 (An Analysis of the Hyperlinks of Internet Newspaper Sites: Focused on Chosun.com and the Washington Post)

  • 김성희;노윤주
    • 정보관리연구
    • /
    • 제43권4호
    • /
    • pp.119-142
    • /
    • 2012
  • 본 연구는 조선닷컴과 워싱턴포스트의 섹션별 뉴스기사 본문의 하이퍼링크 서비스와 링크된 단어의 콘텐츠 유형을 분석하였다. 그 결과를 살펴보면 첫째, 국내 외 인터넷신문의 섹션별 뉴스 분포에서 조선닷컴은 라이프 섹션이 32.4%로 가장 많은 비중을 차지하였으며, 워싱턴포스트는 대체적으로 골고루 분포되어 있는 것으로 나타났다. 둘째, 섹션별 하이퍼링크 서비스를 살펴본 결과 조선닷컴은 정치섹션이 가장 많은 하이퍼링크 서비스를 제공하고 있었으며, 이어서 라이프섹션, 국제섹션 등의 순이었다. 워싱턴포스트는 Politics 섹션, Sports 섹션, Opinions 섹션 등의 순으로 하이퍼링크 서비스를 제공하고 있는 것으로 나타났다. 마지막으로 섹션별 뉴스기사 본문 단어에 하이퍼링크 된 콘텐츠 유형을 분석한 결과 조선닷컴과 워싱턴포스트 모두 정보획득형이 가장 많고, 이어서 탐색형, 트랜잭션형 순으로 나타났다. 이러한 연구결과는 인터넷신문의 특성을 이해하고, 다양한 이용자 요구에 적합한 하이퍼링크 서비스를 제공하기 위한 기초 자료로 활용될 수 있을 것이다.

웹크롤링을 활용한 뉴스 어뷰징 추론 모델 (News Abusing Inference Model Using Web Crawling)

  • 정경록;박구락;정영석;남기복
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.175-176
    • /
    • 2018
  • 기존 신문이나 티브이가 아닌 온라인과 모바일로 뉴스를 보는 사람이 더 많아지면서, 포털 사이트 뉴스난에 다른 언론사의 기사보다 더 많이 노출되기 위한 경쟁의 심화로 뉴스 어뷰징은 심각한 사회 문제로까지 대두되었다. 본 논문은 온라인상에서 생성, 유통되는 많은 뉴스 중에서 이용자의 시간을 낭비하고 양질의 정보를 찾기 힘들게 하는 뉴스 어뷰징을 판단하는 모델을 제안한다. 제안된 모델은 크롤링 기술을 사용하여 뉴스의 제목과 내용을 가져온 후 인공지능 기술을 이용한 유사도 검사로 기사의 어뷰징 여부를 판단하여 양질의 뉴스 정보를 사용자에게 제공될 수 있다.

  • PDF

합성곱신경망과 감성분석 기반의 가짜뉴스 탐지 (Fake News Detection based on Convolutional Neural Network and Sentiment Analysis)

  • 이태원;양영욱;박지수;손진곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.64-67
    • /
    • 2021
  • 가짜뉴스는 뉴스 기사 형식을 갖는 날조된 정보를 의미하며, 최근 모바일 인터넷 장치의 보급과 소셜 네트워크 서비스의 대중화로 온라인 확산이 가속화되고 있다. 기존 연구는 가짜뉴스의 탐지를 위해 뉴스의 주제목, 부제목, 리드, 본문 등 뉴스 기사를 이루는 구성요소를 비롯하여 언론사, 기자, 날짜, 확산 경로 등의 메타 데이터를 대상으로 분석하였다. 그러나 뉴스의 제목과 본문 및 메타 데이터 등은 내용 수정이 쉬워, 다량의 데이터를 학습한 모델이라 하더라도 높은 정확도를 장기간 유지하기 어려울 수 있다. 이러한 문제점을 해결하기 위하여 본 논문은 합성곱 신경망을 이용해 문맥 정보를 분석하고 장단기 메모리 기반의 감성분석을 추가로 수행한다. 문맥 정보와 가짜뉴스 유포자가 쉽게 수정할 수 없는 감성 변화 패턴을 활용하여 성능이 개선된 가짜뉴스 탐지 모델을 제안한다.

웹 검색과 문서 유사도를 활용한 2 단계 신문 기사 표절 탐지 시스템 (A Two Phases Plagiarism Detection System for the Newspaper Articles by using a Web Search and a Document Similarity Estimation)

  • 조정현;정현기;김유섭
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.181-194
    • /
    • 2009
  • 최근 문서 저작권에 대한 관심과 중요도가 높아지고 있어 문서 표절에 관한 연구가 지속적으로 이루어지고 있다. 이러한 표절 문제는 신문기사의 경우에서도 큰 관심을 끌고 있는데, 이는 상업적 가치가 큰 기사의 표절 또는 무단도용 문제가 적지 않게 발생하고 있기 때문이다. 현재까지의 문서 표절 관련 연구는 실시간 특성이 매우 강한 신문 기사의 표절 문제에 적용하기 어려웠다. 따라서 현재는 이러한 표절 기사를 가려내기 위해 수백 개의 신문사에서 하루 수천 건씩 올라오는 기사들을 눈으로 일일이 가려내는 상황이다. 본 논문에서는 이러한 시간과 비용의 문제를 줄이기 위해 네이버와 다음에서 제공하는 웹 검색 OpenAPI를 활용해 표절 가능성이 있는 기사들을 1차적으로 선별한 다음, 선별된 기사들과 원본 기사와의 문서 유사도를 측정하여 선별된 기사들의 표절 여부를 자동으로 판정할 수 있도록 하였다. 본 연구에서는 실험을 위하여 연합뉴스에서 제공되는 기사를 원본 기사로 활용하였고, 표절 가능성이 있는 기사는 네이버 및 다음의 뉴스 서비스에서 제공되는 모든 기사 중에서 선별하도록 하였다.

태권도 뉴스기사의 연도별 주제어 비교분석: 토픽모델링 적용 (Comparative Analysis of the Keywords in Taekwondo News Articles by Year: Applying Topic Modeling Method)

  • 전민수;임효성
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.575-583
    • /
    • 2021
  • 이 연구는 토픽모델링을 적용하여 뉴스기사에 따른 태권도 동향을 연도별로 분석하는 것에 목적이 있다. 언론보도를 통한 태권도 동향을 살펴보기 위해 한국언론재단의 빅카인즈를 통해 뉴스기사와 태권도 전문 언론에 대한 기사를 수집하였다. 검색기간은 2000년 이전, 2001년~2010년, 2011년~2020년 3개의 구간으로 구분하여 검색하여 총 12,124개를 연구자료로 선정하였다. 토픽분석을 위해 전처리 과정을 거쳤으며, LDA 알고리즘을 활용하여 토픽분석을 수행하였다. 이때 모든분석은 python 3을 적용하였다. 그 결과 첫째, 연도별에 따른 언론기사 주제를 분석한 결과 2000년이전 1위는 '세계'. 2위는 '남북', 3위는 '올림픽'으로 나타났으며, 2001년~2010년 1위는 '세계', 2위는 '협회', 3위는 '세계태권도연맹'으로 조사되었다. 2011년~2020년 1위는 '세계', 2위는 '시범', 3위는 '국기원'으로 나타났다. 둘째, 2000년이전 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 2가지로 구분되었다. 구체적으로 Topic 1은 '남·북 체육교류', Topic 2는 '올림픽 시범종목 채택'으로 선정되었다. 셋째, 2001년~2010년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '태권도 시범공연 및 비리', Topic 2는 '무주태권도공원 조성', Topic 3은 '세계태권도축제'로 선정되었다. 넷째, 2011년~2020년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '2018 평창동계올림픽 성공 개최', Topic 2는 '남북 태권도 합동시범공연 ', Topic 3은 '2017 무주세계태권도선수권대회'로 선정되었다.

'통합교육' 관련 중앙일간지 뉴스 기사의 변화과정 분석 -2000~2009년(10년간) vs 2010~2019년(10년간) 비교 중심으로- (Analysis of the Change Process of News Articles related to 'Inclusive Education' -2000~2009(10 years) vs. 2010~2019(10 years))

  • 박상희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.171-172
    • /
    • 2020
  • 본 연구는 오늘날 특수교육의 가장 핵심적인 방법론인 '통합교육'을 다룬 중앙일간지 뉴스 기사의 변화과정을 분석하였다. 신문자료는 오늘날 빅데이터 시대의 하나의 가치 있는 분석대상으로 부각되고 있다. 또 언론사 뉴스 분석방법론은 관련 학문 연구자의 언어가 아닌 일반 시민들의 인식수준을 확인하는 데 도움을 준다. 본 연구의 결과는 2000년 이후 20년간의 시간대를 10년 단위로 분할하여, '통합교육'의 모습이 어떻게 전파되었는 지를 확인하였다. 본 연구는 분석대상 자료를 기초로 하여, 객관적인 연구방법론을 추가하여 보완해 나갈 것이다.

  • PDF

뉴스 기사의 정치적 성향 판단을 위한 지식 그래프 임베딩 기법의 효과 분석 (Knowledge Graph Embedding Methods for Political Stance Prediction: Performance Evaluation)

  • 류성은;고윤용;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.519-521
    • /
    • 2023
  • 온라인 뉴스 플랫폼의 발전은 에코 챔버(echo chamber) 효과와 정치적 양극화를 심화시키며, 이를 완화하기 위한 선행 연구로 뉴스 기사의 정치적 성향을 판단하는 연구가 필요하다. 기존 연구는 외부 지식 그래프를 활용하여 뉴스 기사의 텍스트 정보를 더욱 풍부하게 표현한다. 그러나, 외부 지식을 임베딩하는 지식 그래프 임베딩(knowledge graph embedding, KGE) 방법은 다양하며, 각 KGE 방법이 정치적 성향 예측 정확도에 미치는 효과에 대해서 충분히 연구되지 않았다. 본 논문에서는 정치적 성향 예측에 외부 지식의 활용을 최대화하기 위한 다양한 KGE 방법들의 효과를 분석한다. 실험 결과, 외부 지식 그래프 내의 개체들 간 복잡한 관계를 간단하고 정확하게 표현 가능한 ModE 방법을 활용하는 것이 정치적 성향 예측에 가장 효과적이라는 것을 확인하였다.