• 제목/요약/키워드: 뉴스의 속성

검색결과 43건 처리시간 0.024초

뉴스 속성의 정부소스 의존 정도: 행정수도 이전을 둘러싼 언론보도와 정부 제공 이슈속성의 관련성 중심 (The Dependency of News Attributes on the Government Source: A Case of the New Administrative Capital)

  • 김영욱
    • 한국언론정보학보
    • /
    • 제32권
    • /
    • pp.75-111
    • /
    • 2006
  • 이 연구의 목적은 우리나라 언론 보도에서 정부 소스의 의제 속성에 의존하는 현상이 일어나고 있는가를 살펴본 다음, 정부의 중요정의자 기능과 관련하여 영향요인으로 거론되는 보도부정성, 보도이데올로기, 보도시기 등의 변수들이 가지는 영향력에 대해서 조사해 보는 것이다. 이러한 연구목적에 답하기 위해서 사회적인 논란을 불러왔던 행정수도 이전 관련 논의를 분석 케이스로 선택했으며, 이슈를 둘러싼 정부브리핑과 언론보도를 연구 텍스트로 선정하였다. 연구결과, 정부는 언론보도의 중요정의자 역할을 수행하는 것으로 나타났으며, 언론보도가 정부가 설정하는 이슈 속성의 테두리를 벗어나기 힘들다는 것을 보여주었다. 또한 언론의 부정성에도 불구하고 정부는 사안의 속성을 제한하는 중요정의자의 역할을 담당하고 있지만, 보도이데올로기나 사안의 갈등 시기 등의 영향권에서 자유롭지는 못하다는 것을 보여주고 있다.

  • PDF

Rule-based Normalization of Relative Temporal Information

  • Jeong, Young-Seob;Lim, Chaegyun;Lee, SeungDong;Mswahili, Medard Edmund;Ndomba, Goodwill Erasmo;Choi, Ho-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.41-49
    • /
    • 2022
  • 문서에는 상대적인 시간표현이 포함되어있으며, 이를 다루기 위한 시간표현 체계를 구축하고 상대시간정보를 추출하는 모델을 개발하는 것은 중요하다. 본 연구에서는 timex3 태그에서 상대적인 시간표현의 정규값을 담을 수 있도록 하기 위해 연, 월, 일, 주, 시, 분, 초 단위에 대하여 총 7가지의 새로운 속성을 새롭게 제시하였으며, 이전, 이후, 번째 등에 대한 정규값의 기술방법도 함께 제시하였다. 또한, 새롭게 추가된 속성들의 정규값을 추출하는 규칙 모음을 설계하였다. 추가된 속성들을 바탕으로 구축한 데이터셋은 일상대화, 뉴스, 역사와 관련된 총 1,041개의 문서를 포함하고 있으며, 본 연구에서 설계한 규칙 모음을 전체 데이터셋에 대하여 적용하여 전반적으로 70% 이상의 정확도를 보이는 것을 확인하였다. 특히, 데이터셋에 자주 등장한 상대시간표현인 year, day, week 속성에 대한 성능이 비교적 높은 것을 확인할 수 있었다. 본 연구의 결과물인 추가적인 timex3 속성과 규칙기반 모델은 질의응답시스템, 챗봇 등의 서비스 개발에 유용하게 활용될 수 있을 것이다.

뉴스미디어, 캠페인 미디어, 그리고 정치 대화가 후보자 이미지와 정치적 의사결정에 미치는 영향 -제17대 대통령 선거를 중심으로- (The Effects of the News Media, Campaign Media, and Political Talk on Voters' Candidate Images and Political Decision Making -A Study of the 17th Presidential Election in Korea-)

  • 민영
    • 한국언론정보학보
    • /
    • 제44권
    • /
    • pp.108-143
    • /
    • 2008
  • 후보자 이미지는 다양한 차원의 속성들로 구성되는 후보자에 대한 총체적 인상이다. 본 연구는 온 오프라인 뉴스미디어, 정치광고, 텔레비전 토론회, 후보자 웹사이트 등의 캠페인 미디어, 그리고 대인 간 정치 대화가 후보자의 개인적 품성과 직무수행 및 정책능력에 대한 이미지에 어떠한 영향력을 행사하는지를 분석하고, 더 나아가 정치적 의사결정 과정에서 이미지가 담당하는 역할을 탐색했다. 분석은 2007년 12월 실시된 17대 대통령 선거에서 50% 가까운 득표를 통해 당선된 이명박 후보를 중심으로 수행되었다. 주요 분석 결과는 다음과 같다. 첫째, 신문 뉴스 열독은 개인 품성 이미지에 긍정적 효과를 보였으나, 인터넷신문 이용은 직무수행과 정책능력 이미지에 부정적 영향력을 행사했다. 둘째, 캠페인 미디어 중 특히 텔레비전 정치광고와 후보자 웹사이트는 다양한 차원에서 긍정적인 이미지 형성에 매우 높은 효과를 나타냈지만 투표 행위에 대해서는 직접적인 효과를 보이지 않음으로써, 주로 간접적 경로로 정치적 선택에 영향력을 행사했음을 알 수 있었다. 텔레비전 후보 토론회의 경우, 1, 2, 3차 토론회가 각각 상이한 방식으로 이미지 형성과 정치적 행위에 영향을 미친 것으로 관찰되었다. 셋째, 정치 대화의 빈도와 규모는 각각 개인적 품성과 경제정책능력에 대한 평가에 부정적인 효과를 보였으나, 대화 규모는 이명박 투표에 긍정적인 효과를 나타났다. 넷째, 다양한 차원의 후보자 이미지는 투표 행위에 매우 높은 설명력을 보였는데, 특히 이명박 후보의 도덕성, 정직성, 신뢰성, 서민성 등 개인적 품성에 대한 이미지가 그에 대한 투표 행위에 가장 중요한 예측 요인이었던 것으로 나타났다.

  • PDF

ONASys: 온라인 뉴스기사의 재구성 (ONASys: Online News Adaptation System)

  • 최주원;나종열;최동현;여명숙;신지애;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.216-221
    • /
    • 2007
  • 웹에는 방대한 양의 정보가 있지만 현재 그 활용은 제한적이다. 본 연구는 기존에 PC를 통해서만 접근 가능했던 웹 정보를 TV나 모바일 기기를 통해서 볼 수 있게 함으로써, 사용자로 하여금 시공간의 제약으로부터 자유로운 정보 환경을 제공하려는 취지에서 수행되었다. 현재의 웹 정보를 TV나 모바일 기기와 같은 일상적인 매체를 통해서도 활용할 수 있기 위해서는 각 디바이스의 화면에 적합하게 필터링과 요약을 통해 재구성하는 기술이 요구된다. 본 논문에서는 자연어처리 기술에 기반하여 온라인 뉴스 페이지를 개인 디바이스에 적합한 형태로 내용과 레이아웃을 재구성하는 시스템인 ONASys(Online News Adaptation System) 에 대해 소개한다. ONASys는 공간적, 내용적 속성을 이용하여 웹페이지 상의 중요 정보를 선별하는 #컨텐츠 필터링 모듈#, 패턴의 분석과 공기 정보를 통한 문법적 주 요소 인식을 통해 문장을 하는 #문장 요약 모듈#, 제목과 문장의 연관성을 통하여 문장의 중요도를 판단하는 #중요도 결정 모듈#로 구성된다.

  • PDF

소셜미디어 기반 의사결정 지원을 위한 이벤트 템플릿 추출 (Event Template Extraction for the Decision Support based on Social Media)

  • 허정;류법모;최윤재;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-57
    • /
    • 2012
  • 본 논문은 소셜 미디어 기반 의사결정 지원 시스템인 '소셜위즈덤'에 포함된 이벤트 템플릿 추출에 대해서 소개한다. 의사결정 지원 시스템은 경제적, 사회적 중요사항을 결정할 수 있도록 관련 정보와 인사이트(Insight)를 제공하는 정보시스템을 이른다. 기존 시스템은 단지 특정 키워드 빈도나 공기하는 키워드들의 관계만을 제공하였다. 그러나, 소셜위즈덤은 이벤트로 정의되는 주체(Subject), 이벤트 속성(Event-Property), 객체(Object)의 트리플(Triple) 집합인 템플릿을 추출하여 이를 기반으로 이벤트 정보를 함께 제공한다. 템플릿 추출은 고정밀 언어분석의 관계추출 기술과 온톨로지에 기반한 템플릿 제약 및 필터링 규칙을 이용하였다. 수작업으로 구축한 평가데이터로 평가한 결과, 템플릿 추출 성능(F-Score)은 뉴스 0.544, 블로그 0.3386, 트위터 0.3251이고 전체 통합 성능은 0.4648이었다. 필터링 성능(Accuracy)은 뉴스 0.7257, 블로그 0.6122, 트위터 0.6207이고 전체 통합 성능은 0.722이었다.

  • PDF

Semantic Hypernetwork 학습에 의한 자연언어 텍스트의 의미 구분 (Scaling Documents' Semantic Transparency Spectrum with Semantic Hypernetwork)

  • 이은석;김준식;신원진;박찬훈;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.289-294
    • /
    • 2008
  • 어떤 자연언어 문서가 전달하려는 의미는 그 텍스트의 성격에 따라 아주 명확할 수도(예: 뉴스 문서), 아주 불분명할 수도 있다(예: 시). 이 연구는 이러한 '의미의 명확성(semantic transparency)'을 정량적으로 측정할 수 있다고 가정하고, 이 의미의 명확성을 판단하는 데에 단어들의 연쇄(word association)의 확률통계적 성질들이 어떻게 기능하는지에 대해 논한다. 이를 위해 특정 단어가 연쇄체를 형성하면서 발생하는 neighboring frequency와 degeneracy를 중심으로 Markov chain Monte Carlo scheme을 적용하여 의미망('Semantic Hypernetwork')으로 학습시킨 후 문서의 구성 단어들과 그 집합들 간의 연결 상태를 파악하였다. 우리는 의미적으로 그 표상이 분명하게 나뉘는 문서들(뉴스와 시)을 대상으로 이 모델이 어떻게 이들의 의미적 명확성을 분류하는지 분석하였다. Neighboring frequency와 degeneracy, 이 두 속성이 언어구조에서의 의미망 기억과 학습 탐색 기제에 유의한 기질로서 제안될 수 있다. 본 연구의 주요 결과로 1) 텍스트의 의미론적 투명성을 구별하는 통계적 증거와, 2) 문서의 의미구조에 대한 새로운 기질 발견, 3) 기존의 문서의 카테고리 별 분류와는 다른 방식의 분류 방식 제안을 들 수 있다.

  • PDF

자동 트렌드 탐지를 위한 속성의 정의 및 트렌드 순위 결정 방법 (Trend Properties and a Ranking Method for Automatic Trend Analysis)

  • 오흥선;최윤정;신욱현;정윤재;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.236-243
    • /
    • 2009
  • 특허, 뉴스, 블로그와 같이 시간 정보가 있는 문서들로부터의 자동적인 트렌드 분석(trend analysis)은 토픽탐지 및 추적 기술(TDT: Topic Detection and Tracking)과 더불어 중요한 연구 분야로 대두되고 있다. 과거 연구들은 대부분 트렌드과 관련된 단어의 출현 빈도 정보를 이용하여 주어진 개념의 중요도를 측정하고 이 개념의 시간에 따른 트렌드 라인을 보여주는 것에 초점을 맞췄다. 신출 트렌드 (emerging trend)를 탐지하기 위해서는 주어진 개념의 출현 빈도수 변화와 같은 간단한 방법이나 학습 데이타와 비교하여 차이를 탐지하여 제시하는 방법이 사용되었다. 그러나 여러 트렌드 중에서 특징적인 트렌드를 찾아서 사용자에게 제공하기 위해서는 트렌드 순위 결정 함수가 필요하다. 본 논문은 트렌드의 다양한 측면을 정량화하기 위하여 출현 빈도로 구성된 트렌드 곡선으로부터 네 가지 속성 (변동성, 지속성, 안정성, 누적량) 을 정의하고 이를 활용한 트렌드 순위 결정 방법을 제안한다. 일련의 실험을 통하여 각 속성의 유용성을 검증하고 속성들의 조합이 순위 결정에 어떤 영향을 미치는지 분석하였다. 실험결과로부터 네 가지 속성을 모두 조합할 경우 특징적인 트렌드 탐지에 더욱 기여하는 것을 알 수 있다.

TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법 (Keyword Extraction from News Corpus using Modified TF-IDF)

  • 이성직;김한준
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.59-73
    • /
    • 2009
  • 키워드 추출은 정보검색, 문서 분류, 요약, 주제탐지 등의 텍스트 마이닝 분야에서 기반이 되는 기술이다. 대용량 전자문서로부터 추출된 키워드들은 텍스트 마이닝을 위한 중요 속성으로 활용되어 문서 브라우징, 주제탐지, 자동분류, 정보검색 시스템 등의 성능을 높이는데 기여한다. 본 논문에서는 인터넷 포털 사이트에 게재되는 대용량 뉴스문서집합을 대상으로 키워드 추출을 수행하여 분야별 주제를 제시할 수 있는 키워드를 추출하는 새로운 기법을 제안한다. 기본적으로 키워드 추출을 위해 기존 TF-IDF 모델을 고찰, 이것의 6가지 변형식을고안하여 이를 기반으로 각 분야별 후보 키워드를 추출한다. 또한 분야별로 추출된 단어들의 분야간 교차비교분석을 통해 불용어 수준의 의미 없는 단어를 제거함으로써 그 성능을 높인다. 제안 기법의 효용성을 입증하기 위해 한글 뉴스 기사 문서에서 추출한 키워드의 질을 비교하였으며, 또한 주제 변화를 탐지하기 위해 시간에 따른 키워드 집합의 변화를 보인다.

  • PDF

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

텍스트 문서 분류를 위한 베이지안망 학습 (Learning Bayesian Networks for Text Documents Classification)

  • 황규백;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.262-264
    • /
    • 2000
  • 텍스트 문서 분류는 텍스트 형태로 주어진 문서를 종류별로 구분하는 작업으로 웹페이지 검색, 뉴스 그룹 검색, 메일 필터링 등이 분야에 응용될 수 있는 기반 작업이다. 지금까지 문서를 분류하는데는 k-NN, 신경망 등 여러 가지 기계학습 기법이 이용되어 왔다. 이 논문에서는 베이지안망을 이용해서 텍스트 문서 분류를 행한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 DAG 형태인 망 구조와 각 노드에 연관된 지역확률분포로 구성된다. 그래프 모델을 사용할 경우 학습에 이용되는 각 속성들간의 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 실험 데이터로는 Reuters-21578 문서분류데이터를 이용했으며 베이안망의 성능은 나이브 베이즈 분류기와 비슷했다.

  • PDF