• 제목/요약/키워드: 신문 기사 분석

검색결과 362건 처리시간 0.029초

텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)

  • 감미아;송민
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.53-77
    • /
    • 2012
  • 본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.

교정사전과 신문기사 말뭉치를 이용한 한국어 철자 오류 교정 모델 (A Spelling Error Correction Model in Korean Using a Correction Dictionary and a Newspaper Corpus)

  • 이세희;김학수
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.427-434
    • /
    • 2009
  • 인터넷 및 모바일 환경의 빠른 발전과 함께 신조어나 줄임말과 같은 철자 오류들을 포함하는 텍스트들이 활발히 통용되고 있다. 이러한 철자 오류들은 텍스트의 가독성을 떨어뜨림으로써 자연어처리 응용들을 개발하는데 걸림돌이 된다. 이러한 문제를 해결하기 위해서 본 논문에서는 철자오류 교정사전과 신문기사 말뭉치를 이용한 철자 오류 교정 모델을 제안한다. 제안 모델은 구하기 쉬운 신문기사 말뭉치를 학습 말뭉치로 사용하기 때문에 데이터 구축비용이 크지 않다는 장점이 있다. 또한 교정사전 기반의 단순 매칭 방법을 사용하기 때문에 띄어쓰기 교정 시스템이나 형태소 분석기와 같은 별도의 외부 모듈이 필요 없다는 장점이 있다. 신문기사 말뭉치와 실제 휴대폰에서 수집한 문자 메시지 말뭉치를 이용한 실험 결과, 제안 모델은 다양한 평가 척도에서 비교적 높은 성능(오교정률 7.3%, F1-척도 97.3%, 위양성율 1.1%)을 보였다.

뉴스와 광고의 은밀한 동거: 광고주에 대한 언론의 뉴스구성 (Covert Cohabitation of News and Advertisement: News Frame Towards Advertisers of the Media)

  • 임봉수;이완수;이민규
    • 한국언론정보학보
    • /
    • 제66권
    • /
    • pp.133-158
    • /
    • 2014
  • 이 연구는 중앙일보, 조선일보, 한겨레, 경향신문 등 국내 주요 일간지들이 광고주 기업의 뉴스를 얼마나, 어떤 관점에서, 어떻게 보도하는지를 계량적으로 살펴보았다. 특히 이 연구는 광고주 순위와 기사빈도 간에 관계가 있는지, 광고주 관련 보도가 긍정적으로 다뤄지는지, 이런 경향이 신문의 기업관과 이념성향에 따라 차이가 있는지에 대해 내용분석을 실시했다. 또한 같은 방법으로 '삼성그룹 X파일 사건'이라는 특정사건 기간 중 4개 신문의 삼성관련 보도태도를 분석했다. 분석결과는 다음과 같다. 먼저, 전반적으로 광고수주액이 많은 기업일수록 관련기사 수가 많았다. 또한 광고주 관련 기사는 해당기업에 대해 부정적이기보다는 긍정적인 경우가 많았다. 특히, 광고주 관련 기사의 우호적인 성향(친기업성향)은 기사의 제목보다는 본문의 논조에서, 본문 논조보다는 보도 프레임에서 더욱 두드러지게 나타나는 구조적인 특징을 보였다. 이러한 보도태도는 기업에 우호적인 신문을 외부로 표방하는 중앙일보는 물론, 기업에 비교적 중립적인 입장을 취하는 것으로 알려진 조선일보, 그리고 기업에 비판적 태도를 보이는 한겨레, 경향신문 등 진보신문들도 비슷한 성향을 보였다. 광고주에 우호적인 4개 신문의 이런 보도성향은 삼성X파일 사건기간 중에서도 유사하게 나타났다.

  • PDF

인터넷신문의 뉴스기사 페이지 구성과 콘텐츠에 대한 분석 -네이버, 다음, 네이트, 야후를 중심으로- (An Analysis of the Contents and Make-up of the Page in a News Story of the Internet Newspaper -focusing on Naver, Daum, Nate, Yahoo-)

  • 박광순
    • 한국산학기술학회논문지
    • /
    • 제15권3호
    • /
    • pp.1345-1354
    • /
    • 2014
  • 본 연구는 인터넷신문의 뉴스기사 본문 페이지 구성과 뉴스기사 본문 주변 공간의 콘텐츠 유형을 비교 분석하였다. 분석결과 네이버 뉴스기사 본문 페이지의 포맷은 다음, 네이트, 야후의 뉴스기사 본문 페이지보다 더 복잡하게 구성되었다. 또한 네이버는 다른 세 포털에 비해 광고 수, 광고 유형, 오락 콘텐츠, 다양한 유형의 콘텐츠가 더 높게 게재되었다. 특히 연예인 관련 뉴스기사의 게재 비율이 다른 포털사이트에 비해 높았다. 뉴스기사 본문 페이지에 뉴스기사를 가장 많이 게재한 포털사이트는 다음이었으며, 광고를 가장 적게 게재한 포털사이트는 야후였다. 그러나 전체적으로 볼 때, 이들 세 포털사이트의 뉴스기사 페이지의 포맷과 콘텐츠는 매우 유사하게 구성되었다. 결론적으로 독자들의 광고회피와 뉴스기사의 다양성 측면에서의 뉴스기사 이용의 편리성은 포털사이트의 뉴스서비스가 언론사닷컴의 뉴스서비스 보다 더 높은 것으로 평가할 수 있다.

과학관련 신문기사 분석을 통한 과학적 소양인의 과학적 소양 발현 메커니즘 (Examination of the Development Mechanism of Scientific Literate Person through Analysis of Science-Related Newspaper Articles)

  • 구민아;박다혜;박종석
    • 과학교육연구지
    • /
    • 제45권1호
    • /
    • pp.42-54
    • /
    • 2021
  • 이 연구는 과학적 소양인 양성의 체계적 전략 마련을 위해 과학적 소양이 어떻게 발현되는가를 확인하고 앞으로의 과학적 소양인 양성 교육 프로그램 구성에 필요한 기반을 마련하는 것이 목적이다. 이를 위해 과학교육 전문가 워크숍에서 신문기사를 분석하고 과학적 소양인의 참모습을 논의하여 과학적 소양 발현 메커니즘을 도출하였다. 도출된 메커니즘은 이해, 공감, 실행, 교감 순으로 위계적으로 나타났다. 제시된 각 단계와 단계 이행의 매개를 활용하여 교육 프로그램을 구성하고 이를 학교 현장에 적용한다면 과학교육을 통해 실제적인 과학적 소양인을 양성할 수 있을 것이다.

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

트위터와 신문의 이슈 속성 비교 연구: MBC 파업을 중심으로 (Analysis on Issue Attributions between Twitter and Newspapers)

  • 이미나;박천일;문지영
    • 인터넷정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.43-55
    • /
    • 2014
  • 본 연구는 트위터의 정보전달과 여론형성 기능에 주목해 트위터에서 사회적 이슈가 어떻게 해석 전달되고 있는지를 신문과 비교했다. 분석에 사용된 이슈는 MBC 파업으로 이에 관한 트위터의 맨션과 신문 기사를 분석함으로 해당 미디어에서 MBC파업 이슈가 어떻게 차별적으로 다뤄졌는지를 살펴보았다. 분석방법은 내용분석을 사용했으며 분석 항목은 트위터(신문기사) 형식, 정보원의 사용, 의견표출 방식, 인간적 흥미 프레임과 귀인 프레임의 사용 등이었다. 연구결과, 트위터와 신문의 차이를 분석항목에서 관찰할 수 있었다. 연구결과를 트위터와 신문 간의 이슈 속성의 차이 측면에서 논의하였으며 트위터와 신문의 미디어로써의 본질적 기능과 연관시켜 논의했다.

뉴스 빅데이터를 통해 검토한 대학교육의 토픽 분석 (A Topic Analysis of College Education Using Big Data of News Articles)

  • 양지연;구정호
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.11-20
    • /
    • 2021
  • 본 연구는 신문기사 빅데이터를 통해 대학교육 관련 보도의 토픽을 추출하고, 토픽별 특징 및 신문사별 보도양상을 분석한다. 2016년-2021년 상반기 주요 중앙지와 지역지의 기사를 빅카인즈를 통해 추출하였고, 잠재디리슐레할당을 이용하여 총 9개의 토픽을 발견하였다. 토픽1과 토픽3은 교육에 대한 대학지원사업에 관련된 것이나 토픽3은 지역대학에 초점이 맞추어져 있다. 토픽2는 코로나19 이후 대학교육, 토픽4는 교수-학습법, 토픽5는 정부정책, 토픽6은 고교교육기여대학 지원사업, 토픽7은 대학교육 비전, 토픽8은 국제화, 토픽9는 입시 등을 논하고 있다. 조선일보, 경향신문, 한겨레는 코로나19 이후 강의, 정부정책 관련, 대학교육에 대한 기사와 논평을 많이 보도한 반면 동아일보, 중앙일보, 한라일보, 부산일보, 대전일보, 경인일보는 대학지원사업, 고교교육기여대학 지원사업 등 광고·홍보성 기사가 상대적으로 많았다. 2016년부터의 관련기사를 신문사별 뿐 아니라, COVID-19 발생 전후로도 분석하여 관련 보도의 토픽 차이를 살펴볼 수 있었다. 사회적으로 주요 관심 사항인 대학교육이 언론에 어떻게 보도되고 있는지 확인함으로써 미래의 대학교육 정책 방향과 미디어의 순기능과 역기능 등 언론의 역할에 대해 고찰할 필요가 있음을 시사한다.

신문기사 읽기를 활용한 소집단 의사결정 과정 양상 -기후변화 관련 사회적 논쟁 활동을 중심으로- (The Aspects of Small Group Decision-making Process based on Reading News Reports: Focused on Climate Change related Socio-scientific Issues Activity)

  • 김종욱;곽제연;권지연;하윤희;이정아;김찬종;최승언
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.203-217
    • /
    • 2018
  • 본 연구의 목적은 기후변화 관련 사회적 논쟁 활동에서 신문기사 읽기에 따른 고등학생들의 소집단 의사결정 과정의 양상을 분석하는 것이다. 과학과 관련된 사회적 논쟁(SSI) 관련 수업 맥락에서 학생들이 접하는 정보는 절대적으로 신문이나 TV 등의 미디어 텍스트라는 점에서 텍스트와 의사결정 과정간의 관계를 밝히는 것은 중요한 문제라 할 수 있다. 연구에는 경기도 소재 고등학교에 재학 중인 1, 2학년 학생 22명이 참여하였다. 학생들에게는 유엔 기후변화협약 당사국 총회에 대해 보도한 두 편의 신문기사가 제공되었으며, 파리기후변화 협정에 우리나라가 가입하는 것에 동의하는지에 대한 개인 및 소집단 의사결정을 요구하였다. 신문기사는 비판적 담화분석에 근거해 분석하였으며, 소집단 의사결정 과정은 문제인식과 대안 평가 및 선택에서 드러나는 특징에 주목했다. 신문기사 분석을 통해 기후변화협정은 각국의 경제적 이권과 패권의 추구라는 복잡한 이데올로기가 자리잡고 있음을 확인할 수 있었다. 한편 소집단의 문제인식 단계에서 기후변화협정에 대해 학생들이 지니는 상이한 프레임과 신문기사가 전경화한 주요 담론은 소집단이 논쟁점을 인식하는 데 주요한 변인이 됨을 알 수 있었다. 대안평가 및 선택 단계에서는 공정성과 공평성이 소집단 토의의 주요한 준거로 작용했는데, 이 역시 신문기사에서 강조된 담론과 일치하는 것이었다. 본 연구는 SSI 맥락에서 타당하고 합리적인 판단을 위해 텍스트를 비판적으로 읽을 수 있는 능력을 길러 줄 과학적 소양 교육의 필요성을 함의한다.

모바일 시대의 기사 길이에 관한 탐색적 연구 (An Exploratory Study on the Proper Length of Article in Mobile Era)

  • 정연구;정예현;곽아기;이푸름
    • 한국언론정보학보
    • /
    • 제79권
    • /
    • pp.140-164
    • /
    • 2016
  • 컴퓨팅과 이동통신이 결합되면서 완전히 새로운 취향의 콘텐츠가 만들어지고 있는 모바일 시대에 맞는 기사 길이는 어느 정도일까? 지금까지 고급 저널리즘의 기준으로 인식되기도 한 긴 기사가 여전히 모바일 시대에도 적절할까? 인터랙티브와 검색 기능을 이용한 짧은 기사의 조합이 가독성과 정보량이라는 가치를 만족시켜줄 수 있지 않을까? 이런 문제에 대한 해답을 찾고자 하는 것이 이 연구의 목표다. 연구 방법으로는 현장 실험(field experiment)을 채택했다. 사전 조사를 통해 모바일 기기에서 '손을 쓰지 않고 한 눈에 볼 수 있는' 346자의 기사부터 신문과 방송 뉴스에서 자주 쓰이는 633자, 1033자, 1368자의 기사를 만들었다. 자극물은 길이만 다를 뿐 주요취지는 똑같아지도록 처치했다. 이를 성별, 계열, 학년을 동수로 할당한 대학생 샘플 384명을 대상으로 조사했다. 신문대판 혹은 모바일 페이지를 통해 자신에게 주어진 네 종류 중 하나의 기사를 접촉하고 선호도, 기사질 평가, 기억회상에 관련한 답을 하도록 했다. 분석결과 신문에서는 1033자와 346자의 기사가 고르게 좋은 평가를 받았다. 모바일에서는 손을 거의 움직이지 않고 볼 수 있는 346자와 633자가 고르게 좋은 평가를 받았다. 앞으로 점차 모바일 기계에 의존해 뉴스를 읽는 수용자가 늘어날 경우를 대비한다면 신문 지면의 기사도 346~633자를 기본으로 하는 다양한 전략을 고려해볼 필요가 있을 것으로 보인다.

  • PDF