• 제목/요약/키워드: news bigdata

검색결과 33건 처리시간 0.027초

빅데이터 처리를 통한 연예 뉴스에서의 키워드 추출에 관한 연구 (A Study on Keywords Extraction from Entertainment News using Bigdata Processing)

  • 유상현;이상준
    • 한국IT정책경영학회 논문지
    • /
    • 제11권6호
    • /
    • pp.1503-1507
    • /
    • 2019
  • 온라인 연예 뉴스 기사의 연성화와 속보성 기사가 증가함에 따라 많은 사람들이 연예면 기사를 접하며, 연예인에 대한 평가를 내릴 수 있게 됐다. 연예인에 대한 평판은 소속된 연예인 자원을 최대한 활용해야 하는 연예기획사의 사업전략에 핵심적인 요소이나, 실시간적으로 대규모 기사가 올라오는 환경에서 어떤 뉴스 기사가 어떤 연예인에 관한 것인지 체계적으로 분석하는 것은 용이하지 않다. 본 논문은 연예 뉴스 데이터에서 언급되는 연예인의 언급량을 기준으로 해당 기사의 주제가 되는 연예인을 추출하고, 해당 연예인의 연예기획사로 연관짓는 연예 뉴스 키워드 분석 시스템을 제안한다. 본 논문에서 제안된 시스템을 통해 광고사 혹은 연예기획사 측에서 사업을 위한 참고 자료로 해당 연예인의 가치 판단을 할 수 있다. 이와 더불어 증권사나 투자자들에게 연예기획사의 전망을 예측하여, 투자 전략의 토대를 마련해줄 수 있다.

소셜 빅데이터 분석과 기계학습을 이용한 영화흥행예측 기법의 실험적 평가 (An Experimental Evaluation of Box office Revenue Prediction through Social Bigdata Analysis and Machine Learning)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.167-173
    • /
    • 2017
  • 인공지능으로 대표되는 4차 산업혁명에 대한 관심이 증가함에 따라 사회 전반에 빅데이터 및 머신러닝 활용하려는 움직임이 활발해지고 있다. 이러한 움직임은 다양한 분야에서의 예측 시스템 개발로 현실화되고 있다. 특히 영화 산업에서는 투자, 마케팅 등에 활용을 위해 흥행 여부를 사전에 예측하고자하는 여러 가지 시도가 있어왔다. 예전에는 영화에 대한 정적 데이터만을 고려한 예측이 주류를 이뤘으나, 최근에는 실시간으로 생성되는 소셜 데이터를 활용하여 예측하고자하는 노력이 진행되고 있다. 본 논문에서는 영화의 정적 데이터와 더불어 기사, 블로그, 영화평 등 다양한 피드백 정보를 활용한 예측 기법을 제안한다. 또한 제안한 기법을 활용하여 상대적으로 흥행에 성공한 영화만을 대상으로 이들의 흥행정도를 정량적으로 추정할 수 있는지의 여부를 실험적으로 평가하였다.

한의약에 대한 국내 언론보도 경향 분석 : 2018년~2022년 뉴스 기사 비교 (Comparative analysis of domestic news trends in Korean Medicine from 2018 to 2022)

  • 진나윤;최영선;임병묵
    • 대한예방한의학회지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2023
  • Objectives : The aim of this study is to analyze the news articles related to Korean Medicine(KM) and compare trends in news reports from 2018 to 2022. Method : News articles related to KM were collected through the BigKinds, the news bigdata service of the Korea Press Foundation. News reports from 1 January 2018 to 31 December 2022 were searched. 2,950 news articles out of a total of 12,497 met the inclusion criteria. First, quantitative changes in media coverage were analyzed by year, media outlet, and month. For qualitative analysis, two authors independently coded the content of news articles, discussed them until consensus, and consulted with a third researcher to classify them. In addition, keywords extracted by the BigKind's Topic Rank algorithm were compared and analyzed in each year. Results : The number of news articles on KM decreased by 42% in 2022 compared to 2018. Over a fiveyear period, the Naeil Shinmun reported the most on KM among newspapers, while the Hankyoreh did the least. Among broadcasters, YTN reported the most and SBS did the least. When analyzing the reports by category, the most common was 'treatment', followed by 'prevention' and 'scientification'. As a result of extracting keywords with high weight and frequency, 'immunity' and 'immune system' ranked the first and second in 2018, while 'COVID 19' and 'medical law violation' did in 2022. Conclusion : The decrease in media reports on KM during the COVID-19 epidemic period seems to be due to the limited role of KM in responding to infectious diseases, and efforts to expand the scope of KM can induce increased media reports and social interest.

빅데이터 분석을 활용한 스포츠 지도자들의 리더십 유형에 관한 연구 (A Study on Leadership Typology in Sports Leaders Based on Big Data Analysis)

  • 박은미;서정해
    • 한국융합학회논문지
    • /
    • 제10권7호
    • /
    • pp.191-198
    • /
    • 2019
  • 본 연구에서는 한국의 스포츠 지도자 중에서 축구국가대표팀 감독중에서 외국인 감독의 리더십 유형을 살펴보고자 한다. 이를 위해 감독의 재임기간 동안의 뉴스 기사들을 크롤링하고 이를 분석하였다. 본 연구의 결과는 다음과 같다. 첫째, 성공한 스포츠 지도자들이 갖추고 있는 리더십의 유형이 있는 것으로 나타났다. 둘째, 실패한 스포츠 지도자들이 갖추고 있는 리더십의 유형이 있는 것으로 나타났다. 본 연구 결과에서 나타난 리더십 유형 및 특성은 지도자들이 갖추어야 할 효과적인 리더십을 규명하여, 선수들을 지도하는데 있어 필요한 리더십이 무엇인지를 파악하고 이를 통해 선수들을 지도하고 성과를 창출하는데 활용이 가능하다는 점에서 실무적 차원의 시사점이 있다.

소셜 빅데이터 기반 사회적 이슈 리스크 유형 분류 (Social Issue Risk Type Classification based on Social Bigdata)

  • 오효정;안승권;김용
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.1-9
    • /
    • 2016
  • 소셜미디어의 정치사회적인 활용도가 높아짐에 따라 소셜빅데이터 기반 온라인 동향분석 및 모니터링 기술에 대한 수요 역시 급증하고 있다. 본 논문에서는 이러한 요구에 부합, 특히 여론 형성의 악영향을 끼치는 부정적 이슈 탐지를 위해 사회적으로 파장이 큰 이슈 중 공공여론이 부정적으로 형성될 이슈를 '리스크'로 정의하고 세부 유형을 분류한다. 리스크 유형 정의를 위해 뉴스 문서집합을 대상으로 전수조사를 실시하였으며, 이슈 분야 즉 도메인별 특성을 파악하여 세부 유형을 정의한다. 또한 뉴스와 같은 공적미디어를 통해 정의된 리스크 유형이 개인화된 소셜 미디어에 나타난 리스크 유형과 어떤 차이가 있는지를 알아보기 위해 교차분석을 수행한다. 조사 결과에 따라 6개의 도메인별로 58개의 세부 유형을 정의하고 기계학습 방법을 통해 자동 분류 학습 모델을 구축한다. 실험 결과를 통해 소셜 미디어에 나타난 사회적 이슈 리스크를 자동으로 탐지, 분류가 가능함을 보인다.

빅데이터 기반 어휘연결망분석을 활용한 '창업'과 '기업가정신'의 의미변화연구 (The Study on the Meaning Change of 'Startup' and 'Entrepreneurship' using the Bigdata-based Corpus Network Analysis)

  • 김연종;박상혁
    • 디지털산업정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.75-93
    • /
    • 2020
  • The purpose of this study is to extract keywords for 'startup' and 'entrepreneurship' from Naver news articles in Korea since 1990 and Google news articles in foreign countries, and to understand the changes in the meaning of entrepreneurship and entrepreneurship in each era It is aimed at doing. In summary, first, in terms of the frequency of keywords, venture sprouting is a sample of the entrepreneurial spirit of the government-led and entrepreneurs' chairman, and various technology investments and investments in corporate establishment have been made. It can be seen that training for the development of items and items was carried out, and in the case of the venture re-emergence period, it can be seen that the youth-oriented entrepreneurship and innovation through the development of various educational programs were emphasized. Second, in the result of vocabulary network analysis, the network connection and centrality of keywords in the leap period tended to be stronger than in the germination period, but the re-leap period tended to return to the level of germination. Third, in topic analysis, it can be seen that Naver keyword topics are mostly business-related content related to support, policy, and education, whereas topics through Google News consist of major keywords that are more specifically applicable to practical work.

A Heuristic Method of In-situ Drought Using Mass Media Information

  • Lee, Jiwan;Kim, Seong-Joon
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.168-168
    • /
    • 2020
  • This study is to evaluate the drought-related bigdata characteristics published from South Korean by developing crawler. The 5 years (2013 ~ 2017) drought-related posted articles were collected from Korean internet search engine 'NAVER' which contains 13 main and 81 local daily newspapers. During the 5 years period, total 40,219 news articles including 'drought' word were found using crawler. To filter the homonyms liken drought to soccer goal drought in sports, money drought economics, and policy drought in politics often used in South Korea, the quality control was processed and 47.8 % articles were filtered. After, the 20,999 (52.2 %) drought news articles of this study were classified into four categories of water deficit (WD), water security and support (WSS), economic damage and impact (EDI), and environmental and sanitation impact (ESI) with 27, 15, 13, and 18 drought-related keywords in each category. The WD, WSS, EDI, and ESI occupied 41.4 %, 34.5 %, 14.8 %, and 9.3 % respectively. The drought articles were mostly posted in June 2015 and June 2017 with 22.7 % (15,097) and 15.9 % (10,619) respectively. The drought news articles were spatiotemporally compared with SPI (Standardized Precipitation Index) and RDI (Reservoir Drought Index) were calculated. They were classified into administration boundaries of 8 main cities and 9 provinces in South Korea because the drought response works based on local government unit. The space-time clustering between news articles (WD, WSS, EDI, and ESI) and indices (SPI and RDI) were tried how much they have correlation each other. The spatiotemporal clusters detection was applied using SaTScan software (Kulldorff, 2015). The retrospective and prospective cluster analyses were conducted for past and present time to understand how much they are intensive in clusters. The news articles of WD, WSS and EDI had strong clusters in provinces, and ESI in cities.

  • PDF

메타버스에 관한 연구: 뉴스 빅데이터 서비스 활용과 사례 연구를 중심으로 (A Study on the Metaverse: Focused on the Application of News Big Data Service and Case Study)

  • 김창식;이윤희;안현철
    • 디지털산업정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.85-101
    • /
    • 2021
  • This study aims to gain insight through understanding the Metaverse, which has recently become a hot topic. The study utilizes the methods of case study and News Bigdata Analysis Services. The Metaverse can be defined as a world with no separation between the virtual and real worlds. Currently, the Metaverse is dominated mainly by the MZ generation, but just like smartphones have quickly entered our lives, the Metaverse will soon, too, become a part of our lives. To follow up on this change, all companies, including global companies, are going after the Metaverse. Today, the Metaverse is successfully being used in all types of fields, including gaming, performing arts, business, etc., and its essential technologies include VR/AR/MR/XR and AI. This study intends to help understand the Metaverse through a case analysis of Zepeto, which has 200 million users worldwide. On Zepeto, users can decorate their own avatars, hang out with friends, go to art galleries and performances, and create and sell items. Of these users, 90% are from outside of South Korea, and 80% are teenagers. With most of the users being underage, many legal and social problems also follow. Nevertheless, who will be the first to conquer the new world of the Metaverse will continue to be a big issue. This study also analyzes domestic news articles about the Metaverse by utilizing the BigKinds system. Starting in 1996, the number of articles about the Metaverse each year remains single digit, until in 2020 when the number sharply rises to 86 news. As of June 2021, there are 1,663 articles on the Metaverse. This study suggests that the Metaverse should now be carefully examined and closely followed.

제주시의 지속가능한 여행 활성화를 위한 지역화폐 '탐나는전' 가맹점의 리뷰 데이터 분석 (Analysis of Review Data of 'Tamna' Franchisees to Promote Sustainable Travel in Jeju City)

  • 백세희;김세형;배미란;강주영
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.113-128
    • /
    • 2022
  • 코로나19 이후 '지속가능한 관광'에 대한 관심이 커지면서 '지속가능한 관광'을 하고자 하는 관광객 또한 증가하였다. 그러나, '지속가능한 관광'을 할 수 있는 프로그램과 방법 등이 구체적이지 않다는 문제점이 있다. 또한, 대부분의 '지속가능한 관광'의 관심사가 '환경' 및 '탄소중립' 등에 초점을 맞추고 있어 지역사회에 공헌할 수 있는 프로그램이나 정책들이 많지 않다. 따라서 본 연구에서는 '지속가능한 관광'을 활성화하기 위하여 뉴스 데이터와 리뷰 데이터를 분석하였다. 우선, 본 연구에서는 뉴스 빅데이터 분석을 통해 지속가능한 여행의 주요한 주제들을 도출하였다. 이를 통해 지속가능한 여행의 정책적 주제 및 사건들을 분석한다. 지속가능한 여행과 관련된 뉴스 빅데이터를 분석하여 아직까지 한국에서 지속가능한 여행이 활성화되지 못한 이유들을 분석하고 이를 해결할 수 있는 방안으로 지역사회가 직접 혜택을 볼 수 있는 방안을 도출하고자 한다. 최종적으로, 제주시의 지속가능한 여행 활성화를 위하여 제주 지역화폐인 '탐나는전' 가맹점의 이용자 리뷰 데이터를 분석하고 지역사회와 공생할 수 있는 방안을 제안한다.

도서관에 대한 언론 보도 경향: 1990~2018 뉴스 빅데이터 분석 (An Analysis of News Trends for Libraries in Korea: Based on 1990~2018 News Big Data)

  • 한승희
    • 정보관리학회지
    • /
    • 제36권3호
    • /
    • pp.7-36
    • /
    • 2019
  • 이 연구에서는 1990년부터 2018년까지 29년간의 도서관을 주제로 한 뉴스 기사 37,818 건을 대상으로 양적 분석과 내용분석을 통해 도서관에 대한 언론 보도 경향을 분석하였다. 이를 위해 먼저, 시기별, 주제별, 언론사 유형별 기준에 따라 언론 보도의 양적 변화 추이를 분석한 후, 키워드 빈도 분석과 언어 네트워크 분석을 통해 시기별 보도 내용의 변화 추이와 기사에 내재된 언론 프레임을 분석하였다. 분석 결과, 언론은 도서관의 정보제공 기능과 교육적 기능, 그리고 문화적 기능에 주된 관심을 보였으며, 언론의 관심 주제 변화 추이는 사서직 처우 문제를 제외하고는 대체적으로 도서관계 이슈의 변화 추이와 일치하는 것으로 나타났다. 마지막으로, 언론이 도서관 기사 보도에 대해 취하는 주된 태도는 보도기능과 광고기능인 것으로 나타났다.