• 제목/요약/키워드: 언론 빅데이터

검색결과 93건 처리시간 0.025초

빅데이터 LDA 토픽 모델링을 활용한 국내 코로나19 대유행 기간 마스크 관련 언론 보도 및 태도 변화 분석 (An analysis of the change in media's reports and attitudes about face masks during the COVID-19 pandemic in South Korea: a study using Big Data latent dirichlet allocation (LDA) topic modelling)

  • 서예령;고금석;이재우
    • 한국정보통신학회논문지
    • /
    • 제25권5호
    • /
    • pp.731-740
    • /
    • 2021
  • 본 연구는 LDA 토픽모델링 분석을 적용하여 한국 내 세 번의 코로나19 대유행 시기를 기준으로 마스크와 관련된 뉴스 빅데이터를 수집, 분석하였다. 분석 결과 각 시기별 마스크라는 단어를 중심으로 언론보도가 마스크 정책과 관련된 주제에서 사건사고 위주로 바뀌어가는 것을 실증적으로 살펴볼 수 있었다. 즉 제1차 시기의 경우 마스크 생산과 공급이, 제2차 시기에서는 마스크 착용 의무화 및 관련 사건사고가, 마지막인 제 3차 시기에는 주로 사건사고 위주로 토픽이 다뤄진 것을 확인 할 수 있었다. 해당 연구를 통해 마스크 공급, 확보, 착용 외 다른 보건정보에는 상대적으로 소홀했을 가능성을 확인할 수 있었으며, 제2,3차 시기 보도가 사건사고에 치우친 부분은 향후 언론보도의 접근성 및 태도에 대한 개선점이 있음을 시사한다. 따라서 코로나19에 보다 효과적으로 대응하기 위해서는 보다 거시적이고 사회 전체적인 논의가 진행될 수 있도록 언론보도가 변화해야 할 것이다.

신문 빅데이터를 바탕으로 본 국내 정보화의 경향과 도서관의 역할 (Trends of South Korea's Informatization and Libraries' Role Based on Newspaper Big Data)

  • 나경식;이지수
    • 한국콘텐츠학회논문지
    • /
    • 제18권9호
    • /
    • pp.14-33
    • /
    • 2018
  • 본 연구는 경향신문, 국민일보, 한겨레, 한국일보 총 4개의 신문기사에서 정보화 및 도서관과 관련해서 1998년부터 2017년까지 20년간의 객관적인 신문 데이터를 통해 한국의 정보화 트렌드를 분석해 보고자 수행되었다. 이에 본 연구는 뉴스 빅데이터 시스템인 빅카인즈(BigKinds)를 활용하여 메타데이터 및 연관어(공기어) 분석 결과를 바탕으로, 키워드 '정보', '정보화'와 '도서관'의 시대별, 분야별로 단순빈도 분석과 군집 및 분류 등의 결과를 분석하여 제시하였고, 이를 바탕으로 정부기관의 발행물인 '정보화백서'와 문헌정보학 분야의 '학술지'의 연구 주제와 비교를 통해 언론과 연구에서 나타나는 정보화의 경향을 비교, 분석해 보았다. 본 연구는 언론을 바탕으로 형성된 국내 정보화의 트렌드를 해석하고자 시도했으며, 장기시계열적 데이터인 신문기사의 빅데이터를 활용하여 분석하였다는데 그 의의가 있다. 연구결과를 바탕으로 국내의 정보화와 함께한 도서관의 성장과 발전의 함의와 시사점을 제시하였다. 또한 향후 지속적인 연구를 통해 정보화와 도서관정보화정책 발전방향의 기본적인 틀을 만들 수 있을 것이라 기대한다.

코로나19 가짜뉴스와 진짜뉴스 판별 시스템 (COVID_19 fake news and real news discrimination system)

  • 이지민;이지선;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.411-412
    • /
    • 2022
  • 본 논문에서는 코로나19 뉴스와 코로나19 가짜뉴스의 데이터셋을 활용하여 입력 받은 뉴스가 가짜뉴스일 확률을 예측한다. 가짜 뉴스 본문에는 코로나19, 대통령, 정부, 가짜, 언론 등의 키워드의 빈도가 높았다. 위의 키워드를 토대로 나이브 베이즈 모델링을 하여 이를 적용해 가짜 뉴스를 가려내는 웹페이지를 개발하였다.

  • PDF

텍스트 마이닝을 이용한 SNS와 언론의 이슈에 대한 반응 비교 -"한일군사정보보호협정(GSOMIA) 종료"를 중심으로- (Comparison of responses to issues in SNS and Traditional Media using Text Mining -Focusing on the Termination of Korea-Japan General Security of Military Information Agreement(GSOMIA)-)

  • 이수련;최은정
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.277-284
    • /
    • 2020
  • 텍스트마이닝은 비정형, 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석의 대표적인 방법이다. 트위터와 같은 SNS는 1초에서 수십만건의 데이터를 생성해내며 대중들의 의견이나 생각 등을 즉각적이며 직접적으로 보여주는 1인 미디어로의 역할을 하고 있다. 기성 미디어인 언론은 정보전달, 사회비판, 여론형성의 기능을 수행하고 있다. 본 논문에서는 미디어로의 SNS와 언론을 비교해 보고자 한다. 이를 위해 2019년 하반기 국내의 이슈 중의 하나인 "한일군사정보보호협정(GSOMIA) 종료"에 대한 SNS의 반응과 언론의 반응을 비교 분석한다. 수집된 데이터는 총 201,728개의 트윗과 20,698개의 신문 기사를 대상으로 감성분석, 연관분석, 군집분석을 수행하였다. 그 결과로 SNS의 경우 이슈에 대해 긍정적 반응이 높았고 언론의 경우는 부정적 반응이 높았다. 연관검색의 경우는 SNS의 경우 "파기, 결정, 우리" 등 국내적 이슈에 대한 지지가 높았고 언론의 경우 "실망, 유감, 우려" 등으로 대외적 이슈에 대한 부정적 견해를 보여주는 차이를 보여주었다. SNS는 정보전달의 기능보다는 사회 비판 및 여론의 추이를 살피거나 형성하는데 언론보다 빠르고 강하게 나타내고 있어 언론이 대중의 인식을 반영해주는 역할을 보완할 수 있다.

장애인 평생교육 관련 언론사 뉴스 빅데이터 분석 (News Big Data Analysis of Media Companies related to Lifelong Education for the Disabled)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.183-184
    • /
    • 2022
  • 본 연구는 장애인 평생교육 관련 언론사 뉴스 빅데이터를 한국언론재단의 빅카인즈(BIGKinds) 시스템을 이용하여 분석하였다. 본 연구에서는 2000년 1월 1일부터 2020년 12월 31일까지 20년간, 총 54개 언론사에서 보도한 '장애인 평생교육' 관련 뉴스 기사들을 추출하였다. 그 분석대상 뉴스 빅데이터를 대상으로 키워드 트렌드 분석, 언어 네트워크 지도 구현, 연관어 분석(워드클라우드 제시) 등을 진행하였다. 본 연구 결과는 장애인 평생교육 관련 정책 입안 연구 및 실증적인 연구(평생교육 참여 요인 및 효과 등)의 기초자료로 활용될 수 있을 것으로 기대된다.

  • PDF

Media big data analysis on technology trends to prevent wandering and missing of dementia patients in the community

  • Jung Won Kong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.257-266
    • /
    • 2023
  • 본 연구의 목적은 언론빅데이터를 활용하여 1990년 이후 최근까지 치매환자의 배회와 실종에 관련된 기술특성과 변화를 이해하는데 있다. 언론빅데이터인 빅카인즈를 활용하여 두 단계로 분석하였다. 1단계는 기술변화의 일반적 특성을 분석하였고 2단계는 1단계에서 추출된 가중치가 높은 연관키워드의 상세분석을 하였다. 연구결과, 첫째, 언론보도는 2000년 초반부터 보도되기 시작하였고 2014년 이후에야 점차 보도가 증가되는 추세를 나타냈다. 둘째, 기술 및 기기활용의 변화특성으로 GPS를 중심으로 AI, IoT등의 기술과 융합되는 특성을 보였다. '드론'은 고도의 기술로 최근에 보도가 증가하였지만 실제 적용을 위한 윤리적 문제해결이 요구되었다. 마지막으로, 경찰과 보호자를 중심으로 위치확인 기술에 집중된 특성이 나타났다. 본 연구결과를 토대로 지역사회에서 치매환자의 배회와 실종을 예방하고 안전보행을 지원할 수 있는 기술개발 및 지역사회 협력에 대해 논의하였다.

QR코드에 대한 언론 보도 경향: 2008-2023년 뉴스 빅데이터 분석 (An Analysis of News Media Coverage of the QRcode: Based on 2008-2023 News Big Data)

  • 김선정;이지수
    • 정보관리학회지
    • /
    • 제41권2호
    • /
    • pp.269-294
    • /
    • 2024
  • 본 연구는 QR코드 주제 관련 뉴스의 보도 경향 분석을 위해 한국언론진흥재단의 빅카인즈에서 2008년부터 2023년까지 16년간의 뉴스 기사 데이터 13,335건을 수집하였다. 연간 및 주제별 보도량을 통해 양적 변화 추이를 살펴보고, 단어 빈도 분석을 실시하였으며, 동시 출현 단어를 활용한 네트워크 분석을 통해 시기별 주요 보도 내용을 분석하였다. 분석 결과는 다음과 같다. QR코드 관련 언론에서의 보도는 지속적으로 증가하였으며, 2020년에 보도량이 가장 많은 것으로 나타났다. 'IT·과학' 주제에서 가장 많이 보도되었으며, '스마트폰', '서비스', '애플리케이션', '결제' 등이 QR코드와 함께 주요 단어로 다뤄졌다. 연구 결과, 언론을 통해 QR코드의 정보 제공 및 전달, 정보의 인식 및 식별 기능이 부각 되었다. QR코드는 정보통신기술의 발달과 모바일 기기의 보편화에 따라 그 사용이 확대되었으며, 사회의 전반에서 대중적인 정보 매체로 활용되고 있는 것으로 나타났다.

코로나 19 뉴스데이터 분석 및 시각화 (Covid 19 news data analysis)

  • 허태성;황인용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.241-242
    • /
    • 2021
  • 본 논문에서는 2020년 1월부터 2020년 8월까지 8개월간의 유통되었던 코로나 19와 관련된 뉴스 데이터를 이용하여 기간 및 지역별 단어의 빈도수를 구하고, 그 결과를 활용해 코로나 19와의 상관관계를 분석하고, 시각화하였다. 뉴스데이터는 한국언론진흥재단에서 운영하는 뉴스 빅데이터 시스템인 '빅카인즈'에서 수집된 데이터를 이용하였다. 본 논문에서 웹서비스를 활용해 시각화하였으며 지역과 기간을 선택하면 분석한 결과를 불러와 전체 지역대비 선택한 지역의 뉴스 빈도수, 선택한 지역의 주요 키워드, 주요 키워드의 지역별 일자별 변화 등을 보여주고 있다. 이러한 시각화를 통해 이전에 발생되었던 사건에 대해 주요 키워드와 코로나 19의 상관관계를 쉽게 파악을 할 수 있다.

  • PDF

기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구 (Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy)

  • 백지수;이승언;한지영;차미영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

Analysis Of News Articles On 'Elderly Living Alone' Based On Big Data: Comparison Before and After COVID-19

  • Jee-Eun, Paik
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.111-119
    • /
    • 2023
  • 본 연구는 COVID-19 발생 이전과 이후 보도된 빅데이터 기반의 '독거노인' 관련 언론 기사를 비교함으로써 '독거노인' 관련 언론 기사에 있어 어떠한 변화가 나타나는지 분석하고자 하였다. 이를 위해 COVID-19 발생 이전은 2018~2019년, 발생 이후는 2020~2021년으로 선정하였으며, 빅카인즈를 이용하여 '독거노인' 관련 언론 기사를 수집, 분석하였다. 주요 결과는 다음과 같다. 첫째, COVID-19 발생 이전에 비해 이후에 관련 기사 건수가 감소하였다. 둘째, 연관어 분석에서 큰 차이가 나타나지 않았다. 셋째, 관계도 분석에서 COVID-19 발생 이전에는 '임직원'이, 이후에는 '코로나 19'가 가장 가중치가 크게 나타났다. 본 연구는 '독거노인'과 관련하여 감염병 확산 상황에서 국가 정책 및 제도의 개선안을 마련하는 데 있어 기초 자료로 활용될 것으로 기대한다.