• 제목/요약/키워드: 뉴스기사

검색결과 505건 처리시간 0.033초

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

식민지 신문 '사회면'의 감정정치 -사회적 사실들의 정치적 서사화 (The Society Page of Newspaper of the colonized Korea, its politics of sentiment and modulation of social facts)

  • 유선영
    • 한국언론정보학보
    • /
    • 제67권
    • /
    • pp.177-208
    • /
    • 2014
  • 이 연구는 1920~1930년대 식민지 시기 신문의 사회면-사회적 보도가 정치적으로 부호화되고 해독되는 양식화의 메커니즘을 분석하고 있다. 민족국가와 정치부재, 그리고 주밀한 검열체제 하에서 신문은 비정치적 장르를 정치화하는 담론전략을 시도하며 사회면은 이 식민지적 맥락 안에서 정치적 언설로 구성되고 해독되었다. 이를 규명하기 위해 첫째 민간지의 사회면의 위상 및 편집방향, 둘째 사회면의 사회적 사실을 생산하기 위한 취재, 조직, 기자, 기사작법, 셋째 사회면을 둘러싼 신문과 기자의 부호화 전략 및 이에 공조하는 독자의 해독 규약을 분석했다. 사회면 또는 사회적 사실의 정치적 양식화는 객관적 사실보다 이면의 심리적 사실을 중시하고, 식민지 현실의 부정적 현상(現狀)에 주목하면서 운명공동체로서 민족적 비참을 형상화하며 뉴스를 극적 구조의 감정적 현실 서사(實事敍辭)로 구성하였다. 사회면은 민족공동체적 감각을 공유하고 유지하는 데 의미를 부여하며 이를 위해 민족적 감정을 동요하는 취재보도와 기사의 양식화를 이룬 것이다. 식민지에서는 모든 사회적 사실들이 정치적 문제로 환원된다는 점을 전제하면 사회면에 배치되는 사회적 사실들에 정치적 함의를 덧씌우기 위한 식민지 지식인/기자들의 전략과 전술, 의도는 식민지 저널리즘의 한 특수한 양상을 드러낸다.

  • PDF

텍스트 마이닝을 통한 우리나라의 벼 도열병 발생 개황 분석 (Analysis of Rice Blast Outbreaks in Korea through Text Mining)

  • 송성민;정현정;김광형;김기태
    • 식물병연구
    • /
    • 제28권3호
    • /
    • pp.113-121
    • /
    • 2022
  • 벼 도열병은 전 세계적으로 발병하여 쌀 수확량을 크게 감소시키는 주요 식물병이다. 벼 도열병은 한국에서도 주기적으로 대발생하여 사회경제적으로 큰 피해를 입힌다. 이를 예방하기 위해서는 병 발생 예찰 시스템이 필요하다. 또한 병 발생에 대한 역학 조사는 식물병 관리를 위한 의사결정을 내릴 때 도움을 줄 수 있다. 현재 도열병 예찰 및 역학 조사는 주로 작물의 생육량, 기상 환경 요인 등 정량적으로 측정 가능한 정형 데이터를 기반으로 수행되고 있다. 정형 데이터와 함께 도열병 발생과 관련한 텍스트 자료들도 많이 축적되고 있다. 그러나 이러한 비정형 데이터를 이용한 역학 조사는 이루어지지 않고 있다. 비정형 데이터를 활용하여 유용한 정보를 추출한다면 도열병을 포함한 앞으로의 식물병 관리에 사용할 수 있을 것이다. 이 연구는 텍스트 마이닝을 통해 도열병 관련 뉴스 기사를 분석하여 우리나라에서 벼 도열병이 다발생한 연도와 지역을 조사하였고, 해당 지역의 평균 기온, 합계 강수량, 일조시간, 공급된 벼 품종을 분석하였다. 이를 통해 2020년 평년에 비해 낮은 기온과 일조시간 및 높은 강수량이 전국적인 도열병 다발생의 원인에 기여했고, 2021년 전라북도와 경상북도 일부 지역의 다발생은 비슷한 기상학적 요인에 의한 것으로 추측할 수 있었다. 더하여 같은 벼 품종의 연작에 의한 도열병 다발생 가능성과 질소 비료의 시비량이 병 발생에 미치는 영향에 대한 추후 연구가 필요하다. 결론적으로, 쏟아지는 정보의 홍수속에서 관련 기사를 종합적으로 보기 어렵다. 따라서, 텍스트 마이닝을 통해 얻은 결과로 특정 키워드들이 많이 관찰될 때 적극적 방제에 대한 의사결정을 할 수 있는 시스템이 구축될 필요가 있다. 이는 추후 딥러닝 기술과 접목되어 벼 도열병 역학 조사 도구로 사용될 수도 있을 것이다. 텍스트 마이닝을 통해 얻은 유의미한 정보를 기존의 정형 데이터 기반의 모델과 결합한다면 농업현장에서 병발생 예측 또는 방제기술 개선에 필요한 고품질 정보를 제공해줄 수 있을 것이라고 예상한다.

Sequence-to-sequence 학습을 이용한 한국어 약어 생성 (Korean Abbreviation Generation using Sequence to Sequence Learning)

  • 최수정;박성배;김권양
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권3호
    • /
    • pp.183-187
    • /
    • 2017
  • 스마트폰 사용자들은 텍스트를 쉽게 읽고 빠르게 입력하기를 원한다. 이런 흐름에 따라 사용자들은 채팅 용어에서부터 전문 분야, 뉴스 기사에 이르기까지 여러 단어로 이루어진 어휘를 축약한 약어를 많이 사용한다. 그러므로 약어를 모아 데이터를 구축한다면 정보 검색과 추천 시스템 등에 유용하게 사용될 수 있다. 하지만 약어는 새로운 콘텐츠가 등장할 때마다 계속해서 생겨나기 때문에 수동으로 모으는 일은 쉽지 않으므로, 약어를 자동으로 생성하는 방법이 필요하다. 기존 연구들은 약어를 자동으로 생성하기 위해 규칙 기반 방법을 사용하였으나, 불규칙한 약어들은 생성할 수 없다는 한계점이 있다. 또한 규칙에 의해 생성된 후보 약어들 중에서 올바른 약어를 결정해야하는 문제도 발생한다. 따라서 본 논문에서는 이런 한계점을 극복하기 위해 시퀀스 투 시퀀스 학습 방법을 사용하여 약어를 자동으로 생성한다. 시퀀스투 시퀀스 학습 방법은 심층 신경망으로 기존의 규칙 기반 방법으로 생성할 수 없던 불규칙한 약어들을 생성할 수 있다. 게다가 후보 약어들 중 올바른 약어를 결정할 문제가 발생하지 않기 때문에 자동으로 약어를 생성하는 문제에 적합하다. 본 논문에서는 제안한 방법을 평가한 결과, 기존의 연구에서 생성할 수 없던 불규칙적인 약어를 생성하여 제안한 모델이 효과적임을 증명하였다.

사건 어휘의 특성을 반영한 다국어 사건 연결 탐색 (Multilingual Story Link Detection based on Properties of Event Terms)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.81-90
    • /
    • 2005
  • 본 논문에서는 다국어 뉴스에 대해서 '시간' 요소와 '언어 공간' 요소를 사건 어휘의 가중치 계산에 반영하는 다국어 사건 연결 탐색하는 방법을 제안한다. 시간의 흐름과 다국어 공간상에서 어휘의 분포 특성을 어휘의 가중치로 반영하여 사건 중심 어휘에 변별력을 줌으로써 같은 사건을 다루는 문서를 탐색하도록 한다. 시간상에서 어휘가중치는 전체 시간의 모든 문서집합에서의 어휘 분포와 특정 시간의 문서집합에서의 어휘 분포를 비교함으로써 계산하고, 그 특정 시간의 어휘의 가중치로 표현한다. 두 개의 언어는 하나의 언어에서보다 더 많은 정보를 줄 수 있기 때문에, 각 언어공간에서 어휘의 중요도를 측정하고, 다국어 처리에서 다른 언어 공간에서의 정보를 참조함으로써 언어 공간에서의 참조 역할을 하도록 한다. 본 논문의 실험에서는 같은 기간의 한국어와 일본어 신문기사에 대해서 사건 연결 탐색 성능을 평가하였다. 일반적인 가중치 기법인 tfidf 가중치 기법과의 비교 평가에서, 제안 방법이 단일언어 문서쌍에 대한 사건 연결 탐색은 $14.3{\%}$, 다국어 문서쌍에 대한 사건 연결 탐색에서는 $16.7{\%}$의 성능 향상을 보였다. 제안한 가중치 요소에 대한 유효성을 검증하기 위해, 공간 밀집도를 측정하였는데, 같은 사건을 나타내는 문서들의 그룹에서는 높은 밀집도를 나타냈고, 서로 다른 사건을 나타내는 문서들의 그룹에서는 낮은 밀집도를 나타냈다. 이 결과를 통해서 시간과 공간 요소를 반영한 사건 어휘 가중치 방법이 단일언어 사건 연결 탐색뿐만 아니라 다국어 사건 연결 탐색에 효과적이라고 볼 수 있다.

시민기자 제도 도입에 따른 인터넷 신문의 시민 저널리즘 실천 가능성에 관한 연구 (A Study on Citizen Reporter Systems and Civic Journalism Practices in Korean Internet Newspapers)

  • 김병철;최영
    • 한국언론정보학보
    • /
    • 제26권
    • /
    • pp.45-82
    • /
    • 2004
  • 본 연구는 인터넷 신문이 시민기자 제도의 도입을 통해 시민 저널리즘을 보다 적극적으로 구현할 수 있을 것이라는 전제하에 시민기자 제도를 도입하고 있는 인터넷 신문과 그렇지 않은 인터넷 신문간에 시민 저널리즘 실천 정도에 있어 유의미한 차이가 있는지를 분석했다. 또 시민기자 제도를 도입하고 있는 인터넷 신문을 시민 저널리즘 유형에 따라 기자 주도형 시인 저널리즘, 기자 시민 공동 주도형 시민 저널리즘, 시민 주도형 시민 저널리즘 등 3개 모델로 유형화한 뒤 각각의 시민 저널리즘 모델간에 시인 저널리즘 실천 정도에 있어 유의미한 차이가 있는지를 분석했다. 이를 위해 10개 항목으로 구성된 시민 저널리즘 척도를 사용해 시민 저널리즘 실천 정도를 분석한 결과 시인기자 제도를 도입한 인터넷 신문의 시민 저널리즘 지수가 시인기자 제도를 도입하지 않은 인터넷 신문보다 높게 나타났다. 또 기자 시민 공동 주도형 시민 저널리즘 모델이 시민 주도형 시민 저널리즘 모델보다 시민 저널리즘 지수가 높은 것으로 분석됐다. 그러나 시민기자 제도를 도입하고 있는 인터넷 신문 기사의 평균 시민 저널리즘 지수는 <오마이뉴스> 2.55, <시민의신문> 2.47, <넷피니언> 1.59 등으로 세 신문모두 시민 저널리즘 실천 정도가 다소 낮은 것으로 나타났다. 요컨대 시민 기자 계도를 도입한 인터넷 신문이 그렇지 않은 신문에 비해 시민 저널리즘 지수가 높게 나타나고 또 시민 저널리즘 유형에 따라 시민 저널리즘 실천 정도에 있어 차이가 있기는 하지만 전반적으로 시민기지 제도를 도입하고 있는 한국 인터넷 신문의 일상적인 시민 저널리즘 실천 정도는 그다지 높지 않은 것으로 분석됐다.

  • PDF

효율적인 문서 분류를 위한 혼합 특징 집합과 하이브리드 특징 선택 기법 (Combined Feature Set and Hybrid Feature Selection Method for Effective Document Classification)

  • 인주호;김정호;채수환
    • 인터넷정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.49-57
    • /
    • 2013
  • 본 연구에서는 효율적인 온 라인 문서 자동 분류를 위해 매우 중요한 분류 작업의 전처리 단계인 특징선택을 위한 새로운 방법이 제안된다. 대부분의 기존 특징선택 방법 연구에서는 특징 집합의 모집단이 단일 모집단으로써 한 모집단이 가지는 정보만으로 분류에 적합한 특징들을 선택하여 특징 집합을 구성하였다. 본 연구에서는 단일 모집단에 한하여 수행되는 특징선택 뿐 만 아니라, 다중 모집단을 가지는 혼합 특징 집합에 대해서 특징선택을 함으로써 다양한 정보를 바탕으로 한 특징 집합을 구성하였다. 혼합 특징 집합은 두 종류의 특징 집합으로 구성된다. 즉 각각 문서로부터 추출한 단어로 구성된 원본 특징 집합과 원본 특징 집합으로부터 LSA를 이용하여 새로 생성한 변형 특징 집합이다. 혼합 특징 집합으로부터 필터 방법과 래퍼 방법을 이용한 하이브리드 방식의 특징 선택을 통해 최적의 특징 집합을 찾고, 이를 이용하여 문서 분류 실험을 수행하였다. 다양한 모집단의 특징들의 정보를 모두 고려함으로써 보다 향상된 분류 성능을 보일 것이라고 기대하였고, 인터넷 뉴스 기사를 대상으로 분류 실험한 결과 90% 이상의 향상된 분류성능을 확인하였다. 특히, 재현율과 정밀도 모두 90%이상의 성능을 보였으며, 둘 사이의 편차가 낮은 것을 확인하였다.

자연재난 보도의 특성 분석: 태풍 루사의 사례 연구 (Media Reporting of Natural Disaster: the Case of Typhoon Rusa)

  • 김만재
    • 한국방재학회 논문집
    • /
    • 제5권3호
    • /
    • pp.1-9
    • /
    • 2005
  • 매스 미디어는 재난 발생시 이재민 뿐 아니라 일반인들의 행동과 의사결정에 영향을 미칠 수 있는 강력한 수단이기 때문에 매스 미디어의 역할은 재난 연구자들의 관심의 대상이 되어 왔다. 하지만 우리나라에서는 재난보도에 관한 현황 분석조차 미비한 실정이다. 따라서 본 논문에서 카인즈를 이용하여 2002년 8월 29일 부터 10월 1일까지 태풍 루사에 관하여 신문과 텔레비전 뉴스에서 보도된 기사를 분석하였다. 그 결과에 의하면, 한국의 재난 보도에서는 일기예보를 활용한 사전 경보 기능이 상당히 취약한 것으로 밝혀졌다. 또한 재난 피해자들의 무기력한 모습을 지나치게 강조함으로써 의존이미지라는 재난신화를 만드는데 기여하는 것으로 분석되었다. 이재민들에 대한 이와 같은 묘사는 성금을 모집하는 데에는 지대한 공헌을 하였을지 모르지만, 사실을 왜곡함으로써 효율적인 방재계획을 수립하는 데에는 역기능적 역할을 수행하였을 가능성을 제기한다. 따라서 미디어를 활용한 효율적인 경보체계를 확립하기 위해서는 재난경보가 복잡한 사회 과정임을 인식하여, 신뢰할만한 공식적인 기관이, 명확하고 구체적인 메시지를 매스 미디어에 제공할 필요가 있다. 또한 매스 미디어의 성금 모금은 필요 경비의 조달과 공동체 의식의 공고라는 순기능적 측면이 있지만 이재민의 의존적인 태도를 영속화시킬 수도 있기 때문에, 매스 미디어를 통하여 정부가 수행해야 할 업무와 자산 소유주가 담당해야 할 책임간의 차이를 명확하게 부각시킬 필요가 있다.

보편적 학습설계 측면에서의 고등학교 국어과 교수 실태: 소셜 빅데이터 및 설문조사 분석 (An Analysis of High School Korean Language Instruction Regarding Universal Design for Learning: Social Big Data Analysis and Survey Analysis)

  • 신미경;이옥인
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.326-337
    • /
    • 2020
  • 본 연구의 목적은 뉴스 기사에 나타난 고등학교 국어과 교수 및 보편적 학습설계에 대한 사회의 관심도를 소셜 빅데이터 분석 방법으로 살펴보는 것이었다. 또한 고등학교 국어 수업에서 교사들이 어떻게 보편적 학습설계를 수업에 적용하고 있는지를 살펴보기 위하여 총 330명의 고등학생들을 대상으로 설문조사를 실시하였다. 소셜 빅데이터 분석 결과, 총 10,339건의 검색 건수 중, 고등학교 국어 교수에 대한 관심과 비교하여 보편적 학습설계에 대한 관심은 현저하게 낮았다. 빅데이터 연관어 분석 결과, 고등학교 국어 교수와 연관되어 검색되어진 용어는 '교육과정'(17.22%)이 가장 높았다. 고등학생들은 국어 교사들이 수업 중 매일 활용하는 빈도가 가장 높은 테크놀로지 관련 수업도구를 컴퓨터(38.79%)라고 인식하였다. 그리고 고등학생들은 국어 교사들이 '교사 주도의 설명식 수업'(52.12%)을 위하여 테크놀로지를 활용하는 빈도가 가장 높다고 응답하였다. 1학년 학생들은 2-3학년 학생들보다 테크놀로지 관련 수업 도구 및 다양한 수업 목적으로 테크놀로지를 활용하는 경우가 더 높은 것으로 나타났다(ps<.05). 마지막으로, 5점 평점 척도 설문조사 결과, 고등학생들은 국어 교사들이 다양한 방식의 학습 참여 제공 및 다양한 방식의 행동과 표현 수단 제공과 관련된 보편적 학습설계 지침을 위해서는 '중간' 정도로 적용한다고 여겼다. 반면 다양한 방식의 표상 제공을 위한 실천 부분에서는 수업 내용을 이해하기 쉽도록 다양한 방식으로 학습자료를 제공하거나 학생들이 새로운 정보를 충분히 이해할 수 있도록 다양한 자료를 제공하는 사항들에서는 상대적으로 더욱 긍정적으로 인식하였다. 1학년 학생들의 경우 교사들의 UDL 적용 실태에 관하여 더욱 긍정적으로 인식하고 있었다.

네이티브 광고의 전략적 관리방안에 관한 연구 (A Study on Strategic Management of Native Advertisement)

  • 손제영;강인원
    • 경영과정보연구
    • /
    • 제38권1호
    • /
    • pp.63-81
    • /
    • 2019
  • 기업들은 기존의 웹광고 기법인 베너 광고, 팝업 광고, 삽입 광고 등의 단점들을 극복하기 위해, 이용자들의 거부감을 줄이는 네이티브 광고(native ad)를 적극적으로 활용하고 있다. 네이티브 광고는 이용자들의 거부감을 줄이고 동시에 이목을 이끌어 낼 수 있다는 점에서 유용한 광고기법으로 여겨지고 있으나, 최근에는 전문적인 기사나 동영상 콘텐츠가 광고로 둔갑을 하는 이른바 가짜뉴스, 가짜콘텐츠가 생성되어 그 폐해가 많아 보인다. 이에 본 연구는 웹상에서 기업들이 네이티브 광고를 어떻게 조율하고 통제하는 것이 합리적인 방향으로 기업들의 성과에 기여할 수 있는지에 대하여 파악하고자 하였다. 연구의 검증결과, 광고에 대한 평가가 부정적으로 지각될수록 해당 광고게시물에 대한 설득수준을 저해함과 동시에 해당 광고가 노출되는 웹사이트에도 부정적인 영향을 미칠 수 있다는 것을 파악하였다. 또한, 본 연구는 네이티브 광고기법의 부정적 자극요인들을 중심으로 기업의 질적 성과에 미치는 영향력을 검증한 결과, 정보원의 비전문성이 광고에 대한 의구심에 가장 높은 영향을 미친다는 것을 알 수 있었다. 뿐만 아니라 플랫폼의 정보과잉은 광고에 대한 부정적 평가와 더불어 웹사이트의 평가에도 직접적인 영향을 가진다는 것을 확인할 수 있었다. 아울러 본 연구는 이용자의 웹사이트 관여수준에 따라 경로 간의 차이를 검증함으로써, 세분시장에서 적용될만한 구체적인 시사점들을 제시하였다.