• 제목/요약/키워드: news paper articles

검색결과 148건 처리시간 0.023초

문서 클러스터링을 이용한 문맥 광고 시스템 (Contextual Advertisement System based on Document Clustering)

  • 이동광;강인호;안동언
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.73-80
    • /
    • 2008
  • 본 연구에서는 문서 클러스터링을 이용하여 동음 이의어와 핵심단어 선정 실패로 인해 발생하는 자동 광고 시스템의 오류를 해결하는 광고 키워드 추출방식을 제안한다. 먼저 대규모 뉴스기사를 대상으로 유사한 내용을 가지며 동일한 광고 키워드와 연관이 있는 기사들을 자동으로 분류하여 광고 키워드에 대한 문맥 정보를 구축한다. 또한 광고 대상물에 대한 광고주의 요약 정보나 광고 대상 웹페이지를 분석하여 광고 키워드에 대한 문맥 정보를 추출하는 방식을 보인다. 이렇게 구축된 문서 분류와 광고 키워드용 문맥 정보를 이용하여 광고 대상 문서가 속한 문서 분류를 추정하여 단어들의 의미적인 애매성을 해결하고, 추정한 문서 분류와 관련 있으면서 문맥적으로 중요성을 가지는 핵심 단어들을 선정하여 광고 키워드를 추출한다. 상용 광고 시스템과의 비교 분석 결과 신문 기사나 일반 블로그를 대상으로 최소 21%의 성능 향상을 얻었다.

유즈넷 서비스 인증에 관한 연구 (On the study of Usenet service authentication)

  • 이달원;조인준;황일선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.481-484
    • /
    • 2002
  • 인터넷 서비스 중 다른 곳으로부터 구할 수 없는 전문 지식을 취득할 수 있는 중요한 정보 획득 수단으로서 최신 전문가 그룹과 보조를 맞출 수 있는 유일한 방법은 뉴스 서비스이다. 이러한 목적 때문에 많은 국가에서 뉴스 서비스를 제공하고 있으며 국내에서는 3대 주요 뉴스서버가 해외의 뉴스서버들과 연동하여 대량의 뉴스 기사를 입수하여 국내에 배포하고 있으며 기업, 연구소, 대학교 등 많은 기관에서 국내외의 뉴스 기사를 서비스하고 있는 현실이다[1]. 그러나 그 중요성에 비해 뉴스 서비스의 사용자수는 감소하고 있어 현재는 비영리 목적으로 국가 차원에서의 지원과 운영이 요구되고 있으며 기술적 차원의 지원도 미비하여, 특히 보안 기능의 적용은 부분적으로 이루어지고 있어 매우 취약한 상태이며, 서비스 제공자가 필요로 하는 다양한 요구사항을 만족시키지 못하고 있는 상태이다. 본 논문에서는 기존 뉴스 서비스에서 제공해야 될 다양한 보안기능 중 인증에 대한 문제점을 기술하고 뉴스 서비스에서의 안전한 인증방법을 제시하고자 한다.

  • PDF

국내 언론 보도 연구: 북-러 정상회담을 중심으로 (Analysis of Korean News Report: Focusing on N. Korea-Russia Summit)

  • 반현
    • 문화기술의 융합
    • /
    • 제5권2호
    • /
    • pp.117-122
    • /
    • 2019
  • 본 논문은 북한과 러시아의 정상회담이 열렸던 4월 25일을 중심으로 동아일보와 한겨레신문의 기사 제목과 사설 내용을 분석하였다. 북러 정상회담은 향후 한반도의 평화와 국제 평화에 대한 향후 방향성을 제시할 수 있다는 점에서 한국, 미국, 중국, 일본의 관심을 받았다. 이러한 상황에서 본 논문은 이념적으로 차이를 보이는 한국의 대표 언론지인 동아일보와 한겨레신문을 대상으로 신문 사설과 기사 제목을 분석하였다. 객관성과 공정성을 기하기 위해, 마틴과 화이트(2005)의 평가어 체계를 근간으로 회담 기간 동안 동일한 사안에 대한 평가어들을 비교 분석하였다. 분석결과 사설에서 동아일보는 북한과 러시아의 정상회담에 대해 부정적 견해를 감정 평가에 의존하여 기술하고 있고, 특히 한국에 대해서도 부정적 입장을 유지한 반면, 한겨레는 북한과 러시아의 정상회담에 대한 긍정적 견해를 감정 평가를 통해 전달하고 있음을 알 수 있다. 이 같은 평가는 기사 제목에서도 일관적으로 유지되고 있음을 알 수 있다. 즉, 각 언론사는 사설과 일반기사 제목에서도 동일한 입장을 대변하고 있다는 점에서 각 언론사를 뉴스소비자들에게 각각이 지향하는 이념적 성향을 분명하게 보여준다 하겠다.

샷의 타입을 이용한 뉴스 아카이브 시스템의 설계 및 구현 (Design and Implementation of a news Archive System using Shot Types)

  • 한근주;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.416-428
    • /
    • 2001
  • 뉴스 아카이브 시스템을 구축하기 위하여서는 먼저 뉴스 비디오 스트림을 기사 단위로 인덱싱하고, 사용자가 기사 비디오를 모두 시청하지 않아도 그 내용을 이해할 수 있도록 하는 추상화 방법이 필요하다. 본 논문에서는 뉴스 비디오 스트림에 대하여 샷 타입을 이용하여 기사 단위로 인덱싱할 수 있는 새로운 기사 경계 검출 방법 및 기사 추상화 방법을 제안하다. 제안한 인덱싱 방법에서는 뉴스 비디오의 샷들을 앵커 샷, 인터뷰 샷, 연설 샷, 보도 샷, 그래픽 자료 샷 등으로 나눈다. 모든 기사는 앵커 샷으로 시작하고, 앵커 샷은 다른 샷에 비하여 길이가 길고 특별한 화면 구조를 가지고 있기 때문에 이를 이용하여 기사 단위의 인덱싱을 수행한다. 또한 각 기사에 대한 효과적인 추상화를 위하여 앵커 샷의 오른쪽 위에 있는 그래픽 데이타와 기사를 이루는 다른 샷들의 키 프레임들을 이용한 기사 포스터를 구성하는 방법을 제안하였다. 여러 종류의 뉴스 비디오 스트림에 대한 실험 결과에 의하면 본 논문에서 제안한 기사 경계 검출 알고리즘의 검출율(recall) 및 정확도 (precision)값이 각각 0.92 및 0.96 이상 됨을 알 수 있다. 또한 본 논문에서는 WWW상에서 수행되는 뉴스 아카이브 시스템의 프로토타입 시스템의 설계 및 구현에 대하여서도 설명한다.

  • PDF

ETRI 방송뉴스음성인식시스템 소개 (Introduction of ETRI Broadcast News Speech Recognition System)

  • 박준
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.89-93
    • /
    • 2006
  • This paper presents ETRI broadcast news speech recognition system. There are two major issues on the broadcast news speech recognition: 1) real-time processing and 2) out-of-vocabulary handling. For real-time processing, we devised the dual decoder architecture. The input speech signal is segmented based on the long-pause between utterances, and each decoder processes the speech segment alternatively. One decoder can start to recognize the current speech segment without waiting for the other decoder to recognize the previous speech segment completely. Thus, the processing delay is not accumulated. For out-of-vocabulary handling, we updated both the vocabulary and the language model, based on the recent news articles on the internet. By updating the language model as well as the vocabulary, we can improve the performance up to 17.2% ERR.

  • PDF

고독사와 건강불평등에 대한 탐색적 연구 (A Study on Examination of Health Inequality among Dying Alone Cases)

  • 김혜성
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.311-318
    • /
    • 2019
  • 고독사는 최근 우리 사회에서 주목하는 사회문제 중의 하나이다. 고독사의 대부분의 사례가 사회취약계층으로 건강문제를 경험한 것으로 보고되고 있다. 이처럼 건강문제를 가지고 있음에도, 임종을 홀로 맞는 등 이들의 건강불평등 문제의 심각성을 보여주고 있다. 본 연구에서는 신문기사를 활용하여 고독사 사례의 건강불평등 문제를 조명해 보고자 하였다. 분석방법은 질적 접근인 내용분석을 수행하였다. 최근 3년간 신문에 보도된 89사례를 최종 선정하여 분석하였다. 고독사 사례의 특성, 질환이나 건강문제의 유형, 그리고 의료서비스 미충족 등의 영역으로 분석을 수행하였다. 연구의 결과를 바탕으로 향후 고독사 예방에서 보건의료 영역과 지역사회의 복지서비스 제공 체계 간의 협력과 역할에 대한 논의를 제시하였다.

단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로 (A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables)

  • 최가람;최성필
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.231-250
    • /
    • 2018
  • 본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

빅데이터 분석기법을 활용한 아파트 가격 관련 뉴스 기사의 극성 분석 (A Study on the Polarity of Apartment Price News Using Big Data Analysis Method)

  • 조상연;홍은표
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.47-54
    • /
    • 2019
  • 본 연구는 빅데이터 분석 방법인 오피니언 마이닝을 사용하여 아파트 가격 관련 뉴스 기사의 극성을 확인하는 연구로 자료는 2012년, 2018년 2년간 네이버에 게시된 인터넷 뉴스 기사를 사용하였다. 감성분석 모형을 모델링하고 주제 지향형 감성사전 구축 방법을 제안하였다. 제안한 감성분석 모형을 통해 분석한 결과, 아파트 가격이 상승하는 시기에는 사회적 이슈 선정에 있어서 언론사의 성향에 따라 차이가 있는 것을 확인하였고 정부와 동일한 성향의 언론사에서 긍정 기사가 많은 것을 확인하였다. 부동산 분야에서 사용할 수 있는 감성분석 모형을 제시하고 부동산 관련 비정형 데이터의 극성을 분석하였다는 것에 의의가 있다. 향후 다양한 분야에 접목하기 위해서는 주제별 감성사전을 구축해야 하며 다양한 비정형 데이터를 수집하고 수집 기간을 확장하는 것이 필요하다.

Observable Behavior for Implicit User Modeling -A Framework and User Studies-

  • Kim, Jin-Mook;Oard, Douglas W.
    • 한국문헌정보학회지
    • /
    • 제35권3호
    • /
    • pp.173-189
    • /
    • 2001
  • This paper presents a framework for observable behavior that can be used as a basis for user modeling, and it reports the results of a pair of user studies that examine the joint utility of two specific behaviors. User models can be constructed by hand, or they can be teamed automatically based on feedback provided by the user about the relevance of documents that they have examined. By observing user behavior, it is possible to obtain implicit feedback without requiring explicit relevance judgments. Four broad categories of potentially observable behavior are identified : examine, retain, reference, and annotate, and examples of specific behaviors within a category are further subdivided based on the natural scope of information objects being manipulated . segment object, or class. Previous studies using Internet discussion groups (USENET news) have shown reading time to be a useful source of implicit feedback for predicting a user's preferences. The experiments reported in this paper extend that work to academic and professional journal articles and abstracts, and explore the relationship between printing behavior and reading time. Two user studies were conducted in which undergraduate students examined articles or abstracts from the telecommunications or pharmaceutical literature. The results showed that reading time can be used to predict the user's assessment of relevance, that the mean reading time for journal articles and technical abstracts is longer than has been reported for USENET news documents, and that printing events provide additional useful evidence about relevance beyond that which can be inferred from reading time. The paper concludes with a brief discussion of the implications of the reported results.

  • PDF

신문의 FRBR 모형 적용에 관한 연구 (A Study on the Application of the FRBR Model to Newspaper)

  • 장인호
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.333-349
    • /
    • 2015
  • 본 연구는 신문과 그 기사에 대한 FRBR 모형의 적용 방안을 검토하였다. 이를 위해 신문매체 수준과 신문기사 수준으로 나누어 데이터 요소를 분석하고 FRBR 모형을 어떻게 적용할 수 있는지에 대해 논하였다. 신문매체 수준의 경우, 신문, 조석간 구분, 호, 판을 각각의 저작으로 처리하였으며, 그들 간의 관계는 전체-부분 관계로 설정하였다. 신문기사 수준의 각각 기사도 저작이며, 이들은 신문매체 수준의 판과 전체-부분 관계를 가지고 있다. 신문기사는 텍스트, 사진, 그래픽, 표 등으로 표현되며, 각각 별도의 저작이다. 각각의 저작은 신문기사의 부분이 될 수도 있고, 독립하여 하나의 신문기사가 될 수도 있다. 또한, 고정물과 연재물의 통일 제목은 각각 저작으로 하였으며, 각각의 신문기사와 전체-부분 관계가 있다. 신문제호의 변경에 의해 하나의 묶음으로 하는 통일 제호는 슈퍼저작으로서 그들 간에도 전체-부분 관계가 있다.