• 제목/요약/키워드: social media mining

검색결과 239건 처리시간 0.026초

텍스트 마이닝을 이용한 SNS와 언론의 이슈에 대한 반응 비교 -"한일군사정보보호협정(GSOMIA) 종료"를 중심으로- (Comparison of responses to issues in SNS and Traditional Media using Text Mining -Focusing on the Termination of Korea-Japan General Security of Military Information Agreement(GSOMIA)-)

  • 이수련;최은정
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.277-284
    • /
    • 2020
  • 텍스트마이닝은 비정형, 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석의 대표적인 방법이다. 트위터와 같은 SNS는 1초에서 수십만건의 데이터를 생성해내며 대중들의 의견이나 생각 등을 즉각적이며 직접적으로 보여주는 1인 미디어로의 역할을 하고 있다. 기성 미디어인 언론은 정보전달, 사회비판, 여론형성의 기능을 수행하고 있다. 본 논문에서는 미디어로의 SNS와 언론을 비교해 보고자 한다. 이를 위해 2019년 하반기 국내의 이슈 중의 하나인 "한일군사정보보호협정(GSOMIA) 종료"에 대한 SNS의 반응과 언론의 반응을 비교 분석한다. 수집된 데이터는 총 201,728개의 트윗과 20,698개의 신문 기사를 대상으로 감성분석, 연관분석, 군집분석을 수행하였다. 그 결과로 SNS의 경우 이슈에 대해 긍정적 반응이 높았고 언론의 경우는 부정적 반응이 높았다. 연관검색의 경우는 SNS의 경우 "파기, 결정, 우리" 등 국내적 이슈에 대한 지지가 높았고 언론의 경우 "실망, 유감, 우려" 등으로 대외적 이슈에 대한 부정적 견해를 보여주는 차이를 보여주었다. SNS는 정보전달의 기능보다는 사회 비판 및 여론의 추이를 살피거나 형성하는데 언론보다 빠르고 강하게 나타내고 있어 언론이 대중의 인식을 반영해주는 역할을 보완할 수 있다.

Social Media based Real-time Event Detection by using Deep Learning Methods

  • Nguyen, Van Quan;Yang, Hyung-Jeong;Kim, Young-chul;Kim, Soo-hyung;Kim, Kyungbaek
    • 스마트미디어저널
    • /
    • 제6권3호
    • /
    • pp.41-48
    • /
    • 2017
  • Event detection using social media has been widespread since social network services have been an active communication channel for connecting with others, diffusing news message. Especially, the real-time characteristic of social media has created the opportunity for supporting for real-time applications/systems. Social network such as Twitter is the potential data source to explore useful information by mining messages posted by the user community. This paper proposed a novel system for temporal event detection by analyzing social data. As a result, this information can be used by first responders, decision makers, or news agents to gain insight of the situation. The proposed approach takes advantages of deep learning methods that play core techniques on the main tasks including informative data identifying from a noisy environment and temporal event detection. The former is the responsibility of Convolutional Neural Network model trained from labeled Twitter data. The latter is for event detection supported by Recurrent Neural Network module. We demonstrated our approach and experimental results on the case study of earthquake situations. Our system is more adaptive than other systems used traditional methods since deep learning enables to extract the features of data without spending lots of time constructing feature by hand. This benefit makes our approach adaptive to extend to a new context of practice. Moreover, the proposed system promised to respond to acceptable delay within several minutes that will helpful mean for supporting news channel agents or belief plan in case of disaster events.

Reorganizing Social Issues from R&D Perspective Using Social Network Analysis

  • Shun Wong, William Xiu;Kim, Namgyu
    • Journal of Information Technology Applications and Management
    • /
    • 제22권3호
    • /
    • pp.83-103
    • /
    • 2015
  • The rapid development of internet technologies and social media over the last few years has generated a huge amount of unstructured text data, which contains a great deal of valuable information and issues. Therefore, text mining-extracting meaningful information from unstructured text data-has gained attention from many researchers in various fields. Topic analysis is a text mining application that is used to determine the main issues in a large volume of text documents. However, it is difficult to identify related issues or meaningful insights as the number of issues derived through topic analysis is too large. Furthermore, traditional issue-clustering methods can only be performed based on the co-occurrence frequency of issue keywords in many documents. Therefore, an association between issues that have a low co-occurrence frequency cannot be recognized using traditional issue-clustering methods, even if those issues are strongly related in other perspectives. Therefore, in this research, a methodology to reorganize social issues from a research and development (R&D) perspective using social network analysis is proposed. Using an R&D perspective lexicon, issues that consistently share the same R&D keywords can be further identified through social network analysis. In this study, the R&D keywords that are associated with a particular issue imply the key technology elements that are needed to solve a particular issue. Issue clustering can then be performed based on the analysis results. Furthermore, the relationship between issues that share the same R&D keywords can be reorganized more systematically, by grouping them into clusters according to the R&D perspective lexicon. We expect that our methodology will contribute to establishing efficient R&D investment policies at the national level by enhancing the reusability of R&D knowledge, based on issue clustering using the R&D perspective lexicon. In addition, business companies could also utilize the results by aligning the R&D with their business strategy plans, to help companies develop innovative products and new technologies that sustain innovative business models.

A Sentiment Classification Approach of Sentences Clustering in Webcast Barrages

  • Li, Jun;Huang, Guimin;Zhou, Ya
    • Journal of Information Processing Systems
    • /
    • 제16권3호
    • /
    • pp.718-732
    • /
    • 2020
  • Conducting sentiment analysis and opinion mining are challenging tasks in natural language processing. Many of the sentiment analysis and opinion mining applications focus on product reviews, social media reviews, forums and microblogs whose reviews are topic-similar and opinion-rich. In this paper, we try to analyze the sentiments of sentences from online webcast reviews that scroll across the screen, which we call live barrages. Contrary to social media comments or product reviews, the topics in live barrages are more fragmented, and there are plenty of invalid comments that we must remove in the preprocessing phase. To extract evaluative sentiment sentences, we proposed a novel approach that clusters the barrages from the same commenter to solve the problem of scattering the information for each barrage. The method developed in this paper contains two subtasks: in the data preprocessing phase, we cluster the sentences from the same commenter and remove unavailable sentences; and we use a semi-supervised machine learning approach, the naïve Bayes algorithm, to analyze the sentiment of the barrage. According to our experimental results, this method shows that it performs well in analyzing the sentiment of online webcast barrages.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

Impact of Rumors and Misinformation on COVID-19 in Social Media

  • Tasnim, Samia;Hossain, Md Mahbub;Mazumder, Hoimonty
    • Journal of Preventive Medicine and Public Health
    • /
    • 제53권3호
    • /
    • pp.171-174
    • /
    • 2020
  • The coronavirus disease 2019 (COVID-19) pandemic has not only caused significant challenges for health systems all over the globe but also fueled the surge of numerous rumors, hoaxes, and misinformation, regarding the etiology, outcomes, prevention, and cure of the disease. Such spread of misinformation is masking healthy behaviors and promoting erroneous practices that increase the spread of the virus and ultimately result in poor physical and mental health outcomes among individuals. Myriad incidents of mishaps caused by these rumors have been reported globally. To address this issue, the frontline healthcare providers should be equipped with the most recent research findings and accurate information. The mass media, healthcare organization, community-based organizations, and other important stakeholders should build strategic partnerships and launch common platforms for disseminating authentic public health messages. Also, advanced technologies like natural language processing or data mining approaches should be applied in the detection and removal of online content with no scientific basis from all social media platforms. Furthermore, these practices should be controlled with regulatory and law enforcement measures alongside ensuring telemedicine-based services providing accurate information on COVID-19.

Analysis of Social Media Utilization based on Big Data-Focusing on the Chinese Government Weibo

  • Li, Xiang;Guo, Xiaoqin;Kim, Soo Kyun;Lee, Hyukku
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권8호
    • /
    • pp.2571-2586
    • /
    • 2022
  • The rapid popularity of government social media has generated huge amounts of text data, and the analysis of these data has gradually become the focus of digital government research. This study uses Python language to analyze the big data of the Chinese provincial government Weibo. First, this study uses a web crawler approach to collect and statistically describe over 360,000 data from 31 provincial government microblogs in China, covering the period from January 2018 to April 2022. Second, a word separation engine is constructed and these text data are analyzed using word cloud word frequencies as well as semantic relationships. Finally, the text data were analyzed for sentiment using natural language processing methods, and the text topics were studied using LDA algorithm. The results of this study show that, first, the number and scale of posts on the Chinese government Weibo have grown rapidly. Second, government Weibo has certain social attributes, and the epidemics, people's livelihood, and services have become the focus of government Weibo. Third, the contents of government Weibo account for more than 30% of negative sentiments. The classified topics show that the epidemics and epidemic prevention and control overshadowed the other topics, which inhibits the diversification of government Weibo.

오피니언 마이닝을 통한 브랜드 클러스터링: 자동차 산업 사례연구 (Clustering Corporate Brands based on Opinion Mining: A Case Study of the Automobile Industry)

  • 황현석
    • 한국산학기술학회논문지
    • /
    • 제17권11호
    • /
    • pp.453-462
    • /
    • 2016
  • 인터넷의 등장으로 고객들은 자신의 의견이나 생각을 인터넷 공간에서 다른 사람들과 공유하기 시작하였다. 이에 따라 기업은 인터넷에서 수집된 데이터를 이용하여 기업에 활용할 수 있는 유의미한 결과를 찾으려는 노력을 하고 있다. 과거 설문조사를 기반으로 고객의 브랜드에 대한 태도나 만족도, 충성도 등을 분석하던 방식에서 소셜 네트워크 서비스(Social Network Service) 등에서 추출된 빅데이터를 이용하여 분석하려는 시도가 이루어지고 있다. 본 연구에서는 SNS에서 수집된 결과를 활용하여 브랜드간의 군집을 발견하는 프레임워크를 제시하고자 한다. 또한 제시된 프레임워크의 실무적용 가능성을 살펴보기 위해 자동차 산업에 대한 사례연구를 수행하였다. 두 개의 브랜드 이름이 소셜 미디어에서 동시에 언급되는 빈도가 높을수록 고객이 두 브랜드를 유사하게 인식한다는 가정 하에 자동차 브랜드 사이의 유사성을 측정하고 거리의 개념으로 변화한 후 다차원 척도법을 이용하여 3차원 상에 표시하였다. 또한 자동차 브랜드에 대한 고객의 인식을 파악하기 위해 유사한 브랜드간의 군집을 도출하고 각 군집을 특징을 기술하였다. 아울러 연구의 한계점과 향후 연구방향을 제시하였다.

뉴스기사 분석을 통한 사회이슈와 가격에 관한 연구 - 조류인플루엔자와 달걀가격 중심으로 - (Analysis of the Relations between Social Issues and Prices Using Text Mining - Avian Influenza and Egg Prices -)

  • 한무명초;;이충권
    • 스마트미디어저널
    • /
    • 제7권1호
    • /
    • pp.45-51
    • /
    • 2018
  • 조류인플루엔자는 전염 속도가 매우 빠르고 양계농장을 중심으로 생산자들과 소비자들에게 심각한 영향을 끼친다. 그중에서도 2016년 말에 전국적으로 발생한 조류인플루엔자는 좁은 공간에 밀집시켜 사육하는 산란계 농장에 큰 피해를 주었다. 이에 따라 달걀과 달걀을 재료로 하는 가공식품의 가격이 급등하였고 언론은 많은 속보성 뉴스기사를 게재하였다. 본 연구는 사회이슈를 반영한 온라인 뉴스기사의 키워드 변화와 달걀가격 변동과의 상관관계를 알아보고자 하였다. 이를 위하여 2016년 11월부터 14주 동안 한국에서 발생한 조류인플루엔자 관련 온라인 뉴스기사 682건과 같은 기간의 달걀가격 변화를 분석하였다. 본 연구의 결과는 사회이슈를 반영하는 뉴스기사의 키워드와 실물가격과의 관계를 이해하는 데 기여할 것으로 기대한다.

Customer Service Evaluation based on Online Text Analytics: Sentiment Analysis and Structural Topic Modeling

  • 박경배;하성호
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권4호
    • /
    • pp.327-353
    • /
    • 2017
  • Purpose Social media such as social network services, online forums, and customer reviews have produced a plethora amount of information online. Yet, the information deluge has created both opportunities and challenges at the same time. This research particularly focuses on the challenges in order to discover and track the service defects over time derived by mining publicly available online customer reviews. Design/methodology/approach Synthesizing the streams of research from text analytics, we apply two stages of methods of sentiment analysis and structural topic model incorporating meta-information buried in review texts into the topics. Findings As a result, our study reveals that the research framework effectively leverages textual information to detect, prioritize, and categorize service defects by considering the moving trend over time. Our approach also highlights several implications theoretically and practically of how methods in computational linguistics can offer enriched insights by leveraging the online medium.