• 제목/요약/키워드: news big data

검색결과 287건 처리시간 0.027초

포스트 코로나 시대 알베르 카뮈의 『페스트』에 관한 탐색적 빅데이터 분석 (Exploratory Big Data Analysis of Albert Camus's La Peste in Post Corona era)

  • 민진영
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.432-438
    • /
    • 2021
  • 이 글은 2000년에 들어 알베르 카뮈의 『페스트』가 한국 사회에서 갑작스럽게 인기를 끄는 것을 확인해보고 작품의 내용이 포스트 코로나 시대에 던져주는 시사점을 증명하기 위해서 4차 산업혁명 시대의 주요도구인 빅데이터로 접근한 논문이다. 언론 기사 검색을 통해 『페스트』의 인기를 확인하는 빅데이터 분석에서부터 시작하여 330여 페이지 분량에 해당하는 작품 자체에 대한 어휘 빈도수 분석까지 다양한 분석 도구를 활용하여 이 텍스트가 포스트 코로나 시대에 시사하는 바를 분석하였다. 분석도구로는 한국언론진흥재단의 빅카인즈와 프랑스어판 워드클라우드를 사용하였다. 지난 30여 년 동안 카뮈는 소설 『이방인』으로 한국 사회에 알려진 작가였다. 그러나 코로나바이러스의 창궐 이후 카뮈는 『페스트』의 작가로 한국의 독자들에게 적극적인 관심을 불러일으켰다. 합리적이지 못한 세계의 부조리에 대해 권태로 반항하는 인간상을 그린 『이방인』에 비해, 『페스트』는 연대를 통한 저항의 힘이 얼마나 중요한지 깨우쳐 주는 작품이다. 카뮈의 『페스트』는 포스트 코로나 시대에 전 지구적 공동체가 함께 고민하며 대처해 나아가야 할 문제를 보여줌으로써 하나의 트렌드로 자리 잡았다. 『페스트』에는 도시폐쇄와 격리로 인해 고통을 겪는 오랑시 시민들의 절절한 재난 상황을 보여주는 한편, 보건대를 조직하여 페스트에 정면으로 저항하는 인물들을 보여줌으로써 희망의 메시지를 전해준다. 『페스트』는 포스트 코로나 시대를 살아가는 한국 독자들에게 작가 카뮈를 새롭게 인식하게 해 준 작품이다.

코로나19 상황에서 지역사회 먹을거리 이슈에 관한 탐색적 연구: 지역별 이슈를 통한 소셜 빅데이터를 중심으로 (An Exploratory Study on Local Community Food Issues in the Context of COVID-19: Focusing on Social Big Data through Regional Issues)

  • 최홍규
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.546-558
    • /
    • 2021
  • 본 연구는 코로나19 상황에서 지역사회 먹을거리 관련 이슈를 살펴보았으며, 온라인 공간에서 생산된 소셜 빅데이터의 내용을 분석하는 데 초점을 맞췄다. 우선, 코로나19로 사회적 거리두기가 시행된 후 지역별 홈페이지와 온라인 커뮤니티인 카페에서 확산한 먹을거리 관련 이슈를 분석했다. 다음으로는 언론 뉴스, SNS, 포털 등에서 확산하는 먹을거리 관련 이슈의 내용을 살펴봤다. 그 결과 서울과 경기 등 수도권에 비해 여타 지역 홈페이지에 먹을거리 관련 게시물이 더 많았지만, 온라인 커뮤니티의 경우에는 서울과 경기 지역에 등록된 온라인 커뮤니티에 먹을거리 관련 이슈가 더 많았다. 지역별 온라인 커뮤니티의 먹을거리 관련 키워드는 지역사회 경제와 관련한 내용을 주로 포함하고 있었다. 언론 기사, SNS, 검색포털 이슈에는 지역사회 먹을거리 관련 정책, 정보, 상품 등의 소비과정에서 논의될 수 있는 내용이 주로 나타났다. 연구결과를 통해 지역사회 단위로 특화한 정보 공유체계는 발견되지 않고, 온라인 커뮤니티가 현실적인 먹을거리 정보를 제공하는 데 기여할 수 있으며, 소셜미디어를 통해 지역별 먹을거리 정책의 성과검증이 가능할 것이라는 점을 발견할 수 있었다.

한국도로공사 VOC 데이터를 이용한 토픽 모형 적용 방안 (Application of a Topic Model on the Korea Expressway Corporation's VOC Data)

  • 김지원;박상민;박성호;정하림;윤일수
    • 한국IT서비스학회지
    • /
    • 제19권6호
    • /
    • pp.1-13
    • /
    • 2020
  • Recently, 80% of big data consists of unstructured text data. In particular, various types of documents are stored in the form of large-scale unstructured documents through social network services (SNS), blogs, news, etc., and the importance of unstructured data is highlighted. As the possibility of using unstructured data increases, various analysis techniques such as text mining have recently appeared. Therefore, in this study, topic modeling technique was applied to the Korea Highway Corporation's voice of customer (VOC) data that includes customer opinions and complaints. Currently, VOC data is divided into the business areas of Korea Expressway Corporation. However, the classified categories are often not accurate, and the ambiguous ones are classified as "other". Therefore, in order to use VOC data for efficient service improvement and the like, a more systematic and efficient classification method of VOC data is required. To this end, this study proposed two approaches, including method using only the latent dirichlet allocation (LDA), the most representative topic modeling technique, and a new method combining the LDA and the word embedding technique, Word2vec. As a result, it was confirmed that the categories of VOC data are relatively well classified when using the new method. Through these results, it is judged that it will be possible to derive the implications of the Korea Expressway Corporation and utilize it for service improvement.

비정형 데이터를 활용한 가뭄평가 - 보령지역을 중심으로 - (Drought evaluation using unstructured data: a case study for Boryeong area)

  • 정진홍;박동혁;안재현
    • 한국수자원학회논문집
    • /
    • 제53권12호
    • /
    • pp.1203-1210
    • /
    • 2020
  • 가뭄은 다양한 수문학적 또는 기상학적 인자들이 복합적으로 작용하여 발생하기 때문에 가뭄의 사상을 정확히 평가하는 것은 어려운 일이나, 이를 정량적으로 해석하기 위해 다양한 가뭄지수들이 개발되어 왔다. 하지만 현재 활용중인 가뭄지수들은 단일변량의 부족량을 통해 산정되며, 복합적인 원인으로 발생하는 가뭄의 사상을 정확히 판단하지 못하는 문제가 있다. 단순 단일변량의 부족을 가뭄이라고 판단하기는 어렵기 때문이다. 최근에는 빅데이터 분석에서 많이 활용되고 있는 비정형 데이터를 활용하여 지수를 개발하는 연구들이 타 분야에서 진행되고 있으며 우수성이 입증되고 있다. 따라서 본 연구에서는 기존 가뭄지수에 활용 중인 기상 및 수문정보(강수량, 댐 유입량)에 각각 비정형 데이터(뉴스데이터)를 결합하여 가뭄지수를 산정하고, 산정된 가뭄지수의 검증을 통해 가뭄해석의 활용성을 평가하고자 한다. 결합가뭄지수 산정을 위해 Clayton Copula 함수를 활용하였으며, 매개변수 추정은 교정방법을 이용하였다. 분석결과, 기존의 가뭄지수(SPI, SDI)보다 비정형 데이터를 결합한 가뭄지수가 가뭄기간을 적절히 재현하는 것으로 나타났다. 또한 Receiver Operating Characteristic (ROC) score가 기존의 가뭄지수들보다 높게 산정되어 가뭄해석에 있어 활용성이 우수하였다. 본 연구에서 산정된 결합가뭄지수는 기존 단일변량 가뭄지수의 해석적 한계를 보완하고 비정형데이터를 활용한 가뭄지수의 활용성이 우수하다는 점에서 활용성이 높다고 판단된다.

토픽모델링을 활용한 항만안전 위험요인 도출에 관한 연구 (A Study on the Derivation of Port Safety Risk Factors Using by Topic Modeling)

  • 이정민;김율성
    • 한국항만경제학회지
    • /
    • 제39권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 본 연구에서는 일반대중들이 쉽게 접할 수 있는 뉴스 기사 데이터와 항만 연구자들의 인사이트가 반영된 국내 학술지 초록 데이터를 통하여 다양한 시각에서 항만안전에 대해 알아보고자 하였다. 본 연구의 의의는 방대한 양의 데이터가 쏟아지고 있는 현 시대에 맞는 새로운 방식인 온라인상의 빅데이터를 활용한 분석을 통해 새로운 시각에서의 항만안전과 관련된 위험요인을 탐색하고자 함에 있다. 본 연구에서는 파이썬을 활용한 NMF기반의 토픽모델링을 실시하여 데이터별 주요 토픽을 도출한 후 각 토픽에 대한 의미분석을 실시하였다. 뉴스 기사 데이터에서는 주로 항만안전 위험요인 중 자연적 요인, 환경적 요인이 도출되었고 학술지 초록 데이터에서는 보안적 요인, 기계적 요인, 인적요인, 환경적 요인, 자연적 요인이 도출되었다. 이를 통해 항만안전의 회복탄력성 강화 등 국내 항만의 안전강화전략 필요성, 항만안전에 대한 일반대중들의 시각을 넓히기 위한 안전의식개선 필요성, 항만산업 환경이 안전하고 전문화된 성숙한 항만으로 발전할 수 있는 정책적 차원과 인식적 차원의 연구를 진행할 필요성을 도출하였다. 결과적으로 일반대중들의 시각과 항만 연구자의 시각에서 두드러지게 나타나는 항만안전 위험요인을 탐구함으로써 국내 항만이 항만안전을 위해 개선해야할 주요 요인들을 밝혔고 항만의 안전성확보가 더욱 중요해지는 시점에서 기존의 항만에서 항만안전 문화를 가진 성숙된 항만으로 발전하기 위한 기초자료를 제공하였다.

빅데이터 분석을 통한 발명 교육 센터에 대한 사회적 인식 (Social Perception of the Invention Education Center as seen in Big Data)

  • 이은상
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.71-80
    • /
    • 2022
  • 이 연구의 목적은 빅데이터 분석 방법을 이용하여 발명 교육 센터에 대한 사회적 인식을 확인해 보는 데 있다. 이를 위해 TEXTOM 사이트를 이용하여 네이버와 다음 사이트의 블로그, 카페, 뉴스 채널에서 '발명+교육+센터'를 검색 키워드로 2014년 1월부터 2021년 9월까지의 데이터를 수집하였다. 수집된 데이터는 TEXTOM 사이트에서 정제하였으며, 텍스트 마이닝 분석과 의미 연결망 분석을 위해 TEXTOM 사이트, Ucinet 6, Netdraw 프로그램을 이용하였다. 수집된 데이터는 1차와 2차의 정제 과정을 거쳐 단어빈도를 바탕으로 주요 키워드 60개를 선정하였으며, 선정된 주요 키워드는 매트릭스 데이터로 변환하여 의미 연결망 분석을 실시하였다. 이 연구의 텍스트 마이닝 분석 결과 '학생', '운영', '한국발명진흥회', '특허청' 등이 의미 있는 키워드임을 확인하였다. 의미 연결망 분석 결과 발명 교육 센터와 관련된 '교육 운영', '발명 대회', '교육 과정 및 진행', '사업 모집 및 지원', '주관 및 선정 기관' 등 5개의 군집을 확인할 수 있었다. 이 연구의 결과는 발명 교육 센터에 대한 연구를 수행하는 연구자나 정책 입안자의 학술 연구에 활용될 수 있을 것이다.

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

Analizing Korean media reports on security guard : focusing on visual analysis

  • Park, Su-Hyeon;Shin, Min-Chul;Cho, Cheol-Kyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.195-200
    • /
    • 2019
  • 이 연구의 목적은 언론 보도 분석을 통해 우리나라에서 경비원에 대한 인식과 이미지를 살펴보고 이를 통해 경비원의 지위와 역할에 대해 살펴보는데 있다. 연구방법은 뉴스 빅데이터 분석이 가능한 빅카인즈를 통해 경비원에 대한 키워드 트랜드와 연관어 분석을 실시하였다. 민간경비의 시대적 구분에 따라 정착기, 성장기(양적), 성장기(질적)으로 구분하여 분석한 결과 범죄, 경비업, 최저임금, 갑질에 관련된 언론의 관심과 노출이 많았던 것으로 나타났지만 범죄예방의 주체가 아닌 범죄와 갑질의 피해자, 경비업무의 애매모함, 최저임금 근무자로 근무환경이 열악한 직업의 이미지로 비춰지는 것으로 나타났다. 앞으로 경비원의 이미지 제고를 위해 경비원의 지위와 업무영역을 확고히 하고 전문성을 높여야 할 것이다.

SNS 데이터 분석을 통한 스마트 충북관광 구축 (Implementation of smart chungbuk tourism based on SNS data analysis)

  • 조완섭;조아;권가은;류관희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.409-418
    • /
    • 2015
  • SNS 등 온라인에 쏟아지는 고객의 감성분석을 활용하여 마케팅 등 다양한 분야에서 성과를 내고 있다. 고객의 제품사용 후기 데이터를 수집하여 신제품의 마케팅 전략과 제품개선 방안을 도출하고 있으며, 선거철에는 유권자들의 마음을 실시간으로 읽어서 선거 전략을 수립하고 있다. 본 연구에서는 온라인 상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보전략과 관광진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북전역의 관광지를 대상으로 한다. 분석결과 충청북도 북부지역의 관광지들이 주요 이슈 관광지로 나타났으며, 관광지별로 연관 관광지와 연관 키워드들이 분석되었다. 또한, 주요 관광지별 감성분석을 통하여 긍/부정 현황과 그 원인을 파악할 수 있도록 하였다. 특히 이들 분석에 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 하였다.

SNS Effect of the negative event on the Firm Performance: Comparison between Pre and Post SNS media appearance

  • Kim, Sang Yong;Lee, Da Eun
    • Asia Marketing Journal
    • /
    • 제16권1호
    • /
    • pp.21-33
    • /
    • 2014
  • When the negative event is published, the company tends to go through the negative impact on the firm performance. Especially, with the SNS, the negative event is instantly spread on indefinite region so the impact seems bigger than the period before the SNS media appearance. It seems that everyone considers the SNS media impact on the firm performance quite big. However, there has been no empirical study on the impact comparison on the firm performance between pre and post SNS media occurrence periods. This study tries to empirically compare the impact of the negative event on the firm performance between pre and post SNS media appearance. Our study starts fromthe basic but not verified question; Does really the negative event have more negative impact in the post-SNS-occurrence period than in the pre-SNS-occurrence period? In order to examine the impact of the negative publicity on firm performance in two eras, pre and post SNS media appearance, we used CAR (Cumulative Abnormal Resturns) model. By using this model, we could verify the statistical significance of cumulative abnormal returns in market between before and after the events. For event samples, we focused on food manufacturers and collected the negative events from 1991 to 2003 for pre-SNS occurrence period, and from 2010 to 2013 for post-SNS occurrence period. Based on the listed food companies at KOSPI, we researched Naver News Library (newslibrary.naver.com) and Naver News (news.naver.com) for all the individual negative events published for both periods. Firm returns data were collected from TS 2000 (KOCO Info) and market portfolio data were collected from KRX Exchange. Through our empirical analysis, our finding is interesting to note that the type of events differently influences on the firm performance. With the SNS, the health-related events have influence on the firm performance 'after the event day' whereas the company behavior trust events have influence 'before the event day'. Our findings have implications for management. When a negative event directly related to or threatening customers or their life such as health, it is crucial to fix up the situation right after the event occurs. On the other hand, when a negative event is not publicly available information such as company behavior trust, it is important for marketers to strengthen the firms' trust reputation and control the bad WOM before the event.

  • PDF