• 제목/요약/키워드: comments analysis

Search Result 405, Processing Time 0.025 seconds

형태소 분석을 통한 악성 댓글 필터링 방안 (A Filtering Method of Malicious Comments Through Morpheme Analysis)

  • 하예람;천준석;왕인서;박민욱;우균
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.750-761
    • /
    • 2021
  • 인터넷 기사에 대한 댓글은 토론 및 소통 등 긍정적 효과도 있지만, 악성 댓글은 사람의 목숨을 앗아가는 정도로 심각한 문제이다. 이런 측면에서 악성 댓글을 자동으로 검출하는 것은 중요한 문제이다. 그러나 현재 채택되고 있는 금칙어 바탕의 댓글 필터 방안은, 특히 한글 댓글의 경우 효과적이지 못한 실정이다. 이 논문에서는 형태소 분석을 통해 비속어 형태소와 존대어 형태소를 구별함으로써 댓글 필터링을 수행하는 방법을 제안한다. 이들 두 형태소를 바탕으로 댓글 건전도를 계산하고, 또한 건전도를 바탕으로 한 댓글 충격량 계산방법을 여럿 제안한다. 악성 댓글을 대상으로 한 실험을 수행한 결과, 포털에서 수행되고 있는 클린봇보다 재현율이 37.93% 포인트 개선되었으며 F-지수 값은 47.66 포인트 개선된 것으로 나타났다. 이 결과에 따르면, 형태소 분석을 기초로 한 새로운 필터 방법이 금칙어를 바탕으로 한 방법의 좋은 대안이 될 수 있을 것으로 기대된다.

소셜미디어 뉴스를 이용한 관심 이슈 연구 (A Study on Interest Issues Using Social Media New)

  • 곽노영;이문봉
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권2호
    • /
    • pp.177-190
    • /
    • 2023
  • Purpose Recently, as a new business marketing tool, short form content focused on fun and interest has been shared as hashtags. By extracting positive and negative keywords from media audiences through comment analysis of social media news, various stakeholders aim to quickly and easily grasp users' opinions on major news. Design/methodology/approach YouTube videos were searched using the YouTube Data API and the results were collected. Video comments were crawled and implemented as HTML elements, and the collection results were checked on the web page. The collected data consisted of video thumbnails, titles, contents, and comments. Comments were word tokenized with the R program, comparing positive and negative dictionaries, and then quantifying polarity. In addition, social network analysis was conducted using divided positive and negative comments, and the results of centrality analysis and visualization were confirmed. Findings Social media users' opinions on issue news were confirmed by analyzing and visualizing the centrality of keywords through social network analysis by dividing comments into positive and negative. As a result of the analysis, it was found that negative objective reviews had the highest effect on information usefulness. In this way, previous studies have been reaffirmed that online negative information has a strong effect on personal decision-making. Corporate marketers will analyze user comments on social network services (SNS) to detect negative opinions about products or corporate images, which will serve as an opportunity to satisfy customers' needs.

Sentiment analysis of nuclear energy-related articles and their comments on a portal site in Rep. of Korea in 2010-2019

  • Jeong, So Yun;Kim, Jae Wook;Kim, Young Seo;Joo, Han Young;Moon, Joo Hyun
    • Nuclear Engineering and Technology
    • /
    • 제53권3호
    • /
    • pp.1013-1019
    • /
    • 2021
  • This paper reviewed the temporal changes in the public opinions on nuclear energy in Korea with a big data analysis of nuclear energy-related articles and their comments posted on the portal site NAVER. All articles that included at least one of "nuclear energy," "nuclear power plant (NPP)," "nuclear power phase-out," or "anti-nuclear" in their titles or main text were extracted from those posted on NAVER in January 2010-December 2019. First, we performed annual word frequency analysis to identify what words had appeared most frequently in the articles. For that period, the most frequent words were "NPP," "nuclear energy," and "energy." In addition, "safety" has remained in the upper ranks since the Fukushima NPP accident. Then, we performed sentiment analysis of the pre-processed articles. The sentiment analysis showed that positive-tone articles have been reported more frequently than negativetone over the entire analysis period. Last, we performed sentiment analysis of the comments on the articles to examine the public's intention regarding nuclear issues. The analysis showed that the number of negative comments to articles each month-irrespective of positive or negative tone-was always larger than that of positive comments over the entire analysis period.

유튜브 댓글을 통해 살펴본 버추얼 인플루언서에 대한 인식 연구 -캐릭터 디자인에 대한 긍부정 감성 반응을 중심으로- (A Study on Perceptions of Virtual Influencers through YouTube Comments -Focusing on Positive and Negative Emotional Responses Toward Character Design-)

  • 안효선;김지영
    • 한국의류학회지
    • /
    • 제47권5호
    • /
    • pp.873-890
    • /
    • 2023
  • This study analyzed users' emotional responses to VI character design through YouTube comments. The researchers applied text-mining to analyze 116,375 comments, focusing on terms related to character design and characteristics of VI. Using the BERT model in sentiment analysis, we classified comments into extremely negative, negative, neutral, positive, or extremely positive sentiments. Next, we conducted a co-occurrence frequency analysis on comments with extremely negative and extremely positive responses to examine the semantic relationships between character design and emotional characteristic terms. We also performed a content analysis of comments about Miquela and Shudu to analyze the perception differences regarding the two character designs. The results indicate that form elements (e.g., voice, face, and skin) and behavioral elements (e.g., speaking, interviewing, and reacting) are vital in eliciting users' emotional responses. Notably, in the negative responses, users focused on the humanization aspect of voice and the authenticity aspect of behavior in speaking, interviewing, and reacting. Furthermore, we found differences in the character design elements and characteristics that users expect based on the VI's field of activity. As a result, this study suggests applications to character design to accommodate these variations.

'좋아요'와 '싫어요'같은 간접적 사회적 정보의 방향과 강도는 온라인 뉴스 콘텐츠 댓글의 숙의의 질과 어떤 관련이 있는가? 토픽 모델링을 이용한 토픽 다양성 분석 (How Are the Direction and the Intensity of Indirect Social Information such as Likes and Dislikes Related to the Deliberative Quality of Online News Content Comments? A Topic Diversity Analysis Using Topic Modeling)

  • 민진영;이애리
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권4호
    • /
    • pp.303-327
    • /
    • 2021
  • Purpose The online comments on news content have become social information and are understood based on deliberative democracy. Although the related research has focused on the relationship between online comments and their deliberative quality, the social information provided by online comments consists of not only direct information such as comments themselves but also indirect information such as 'likes' and 'dislikes'. Therefore, the research on online comments and deliberative quality should study this direct and indirect information together, and the direction and the degree of the indirect information should be also considered with them. Design/methodology/approach This study distinguishes comments by the attached 'likes' and 'dislikes', identifies highly supported and highly unsupported comments by the intensity of 'likes' and 'dislikes', and investigates the relationship between their existence and the deliberative quality measured as the topic diversity. Then, we applied topic modeling to the 2,390 news articles and their 74,385 comments collected from five news sites. Findings The topic diversities of the supported and unsupported comments are related to the topic diversity of all comments but the degree of the relationship is higher in the case of supported comments. Furthermore, the existence of highly supported and unsupported comments is led to less diversity of all comments compared to the case where those comments are absent. Particularly, when only highly supported comments are present, topic diversity was lower than in the opposite case.

텍스트마이닝을 통한 댓글의 공감도 및 비공감도에 영향을 미치는 댓글의 특성 연구 (Applying Text Mining to Identify Factors Which Affect Likes and Dislikes of Online News Comments)

  • 김정훈;송영은;진윤선;권오병
    • 한국IT서비스학회지
    • /
    • 제14권2호
    • /
    • pp.159-176
    • /
    • 2015
  • As a public medium and one of the big data sources that is accumulated informally and real time, online news comments or replies are considered a significant resource to understand mentalities of article readers. The comments are also being regarded as an important medium of WOM (Word of Mouse) about products, services or the enterprises. If the diffusing effect of the comments is referred to as the degrees of agreement and disagreement from an angle of WOM, figuring out which characteristics of the comments would influence the agreements or the disagreements to the comments in very early stage would be very worthwhile to establish a comment-based eWOM (electronic WOM) strategy. However, investigating the effects of the characteristics of the comments on eWOM effect has been rarely studied. According to this angle, this study aims to conduct an empirical analysis which understands the characteristics of comments that affect the numbers of agreement and disagreement, as eWOM performance, to particular news articles which address a specific product, service or enterprise per se. While extant literature has focused on the quantitative attributes of the comments which are collected by manually, this paper used text mining techniques to acquire the qualitative attributes of the comments in an automatic and cost effective manner.

온라인 뉴스 베스트 댓글의 특성 분석 (Analyzing the Characteristics of Online News Best Comments)

  • 김진우;조혜인;이봉규
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권8호
    • /
    • pp.1489-1497
    • /
    • 2018
  • 온라인 뉴스에 개인의 참여가 활성화되면서 댓글의 중요성은 더욱 커지고 있다. 특히 이용자들에게 많은 공감을 받는 '베스트 댓글'은 주된 여론으로 인식되고 큰 영향력을 가진다. 따라서 본 연구는 온라인 뉴스 댓글 데이터를 이용하여 베스트 댓글의 특성을 알아보고자 하였다. 이를 위해 일반 댓글과 차이점을 보일 가능성이 있는 요소를 설정 후, 데이터를 수치화하여 일반 댓글과 베스트 댓글의 차이를 분석하였다. 본 연구는 최근 댓글 조작 등의 문제 해결에 실마리를 제공하고 개인 및 학술단체, 정부기관 등을 주체로 하여금 기초 자료로 활용될 것으로 기대된다.

SNS 댓글의 정보 증폭 양상에 대한 연구: 뉴스 사이트 댓글과 SNS 댓글의 센티멘트 차원 비교를 통한 탐색적 분석 (The Amplifying Aspects of SNS Comments: An Exploratory Study through the Sentiment Comparison between News Site Comments and SNS Comments)

  • 민진영
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.163-184
    • /
    • 2020
  • SNS에서 포스팅과 댓글 형태로 만들어지는 정보는 가공 및 확대되어 뉴스미디어로 재전송되거나 현실 세계에서의 활동으로 연결되기도 하는 등, 그 영향력이 점점 커지고 있다. 최근 들어 SNS 댓글의 이러한 정보 증폭 현상에 대한 논의가 진행되고 있으나, 구체적으로 어떠한 차원의 정보가 확대되는지나 증폭의 방향과 정도 및 이에 영향을 미치는 요인 등은 아직 잘 밝혀져 있지 않다. 따라서 본 연구에서는 댓글 내용의 센티멘트를 이용하여 SNS 댓글이 구체적으로 어떠한 차원에서 원 게시글을 확대하는지 살펴보고, SNS 포스팅 구조와 사회적 연결망의 특징이 어떻게 이 확대 방향과 크기에 영향을 미치는지 뉴스 댓글과 비교하여 살펴보았다. 2,378개의 페이스북 포스팅과 그에 포함된 뉴스 게시글, 이들에 달린 페이스북 댓글 26,312개, 뉴스 사이트 댓글 74,730개를 분석한 결과, SNS 댓글은 원 게시글의 센티멘트를 확대하는 것으로 나타났다. 특히 인지적, 사회적 차원에서는 뉴스 사이트의 댓글보다도 그 확대 정도가 더 큰 것을 알 수 있었다. 정서적 차원에서는 뉴스 사이트 댓글보다 부정적 감정의 확대 정도는 약하고 긍정적 감정의 확대 정도가 큰 것으로 드러나 SNS 댓글이 부정적 감정보다 긍정적 감정을 증폭하는 경향이 있음을 알 수 있었다. 댓글의 원 게시글 증폭 방향과 정도에 있어서는 댓글이 긍정 유지, 혹은 긍정 전환될 때는 SNS 포스팅 작성자와 포스팅에 포함된 게시글 작성자가 동일할 경우 증폭정도도 커지지만 부정 유지되는 경우에는 그렇지 않은 경우에 오히려 증폭되는 경향이 있다는 것을 밝혀 사회적 연결망 하의 관계가 댓글 증폭에 큰 영향을 미치는 것을 보였다.

도서관 이용자 코멘트 데이터 분석도구 리뷰 및 적용: LibQUAL+ 설문 데이터를 중심으로 (A Review and Application of Library User Comments Data Analysis Tool: Focused on the LibQUAL+ Survey Comments)

  • 변제연;심원식
    • 정보관리학회지
    • /
    • 제30권3호
    • /
    • pp.157-181
    • /
    • 2013
  • 최근 도서관에서 실시하는 이용자 만족도 조사, LibQUAL+ 평가 등을 통해 계량적 데이터뿐만 아니라 이용자의 직접적 견해를 담은 이용자 코멘트 데이터가 점점 더 많이 수집되고 있다. 이러한 질적 데이터는 이용자의 입장을 이해하고, 도서관 서비스의 환경 개선이 필요한 영역을 확인하며, 이용자 니즈의 우선순위를 파악하는 등 도서관 서비스 개선을 위한 전략 수립에 유용한 자료로써 활용될 수 있는 것이다. 따라서 이용자 코멘트 데이터는 그 내용이 분석되고, 분석 결과를 서비스 및 정책에 반영할 필요가 있다. 본 연구는 이용자 코멘트 데이터의 활용성을 높일 수 있는 기반을 제공하고자, LibQUAL+ 설문의 이용자 코멘트 분석을 중심으로 하여 실제 외국 도서관의 LibQUAL+ 설문 이용자 코멘트 분석 방법을 알아보고, 분석을 위해 사용된 질적 데이터 분석 소프트웨어 및 분류표 등 분석도구에 대해 살펴보았다. 또한, 대표적 질적 데이터 분석 소프트웨어와 외국에서 LibQUAL+ 이용자 코멘트 분석을 위해 개발된 분류표를 최근 국내 대학도서관에서 시행된 LibQUAL+ 설문의 이용자 코멘트 일부에 적용하여 분석해봄으로써 그 유용성을 확인하였다.

기업가 연설문의 주제와 시청자 댓글 간의 관계 분석: 유튜브 콘텐츠를 중심으로 (Entrepreneur Speech and User Comments: Focusing on YouTube Contents)

  • 김성범;이정환
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.513-524
    • /
    • 2020
  • 최근 유튜브의 성장이 주목받고 있다. 유튜브는 콘텐츠를 소비하는 채널일 뿐만 아니라 소비자의 의사를 표시하는 공간이 되고 있다. 소비자들은 댓글이라는 형식으로 유튜브 안에서 그들의 의견을 표출한다. 이 연구는 유튜브에 업로드되어 시청되는 글로벌 기업가 연설문과 영상을 시청하고 작성한 댓글의 텍스트를 연구대상으로 한다. 텍스트 마이닝 소프트웨어인 Leximancer를 사용하여 각각의 연설문과 댓글을 대상으로 내용 분석(content analysis)을 시행하였다. 각 기업가 연설문의 주제는 대응분석(correspondence analysis)을 사용하여 분석하였고 기업가 개인의 성향과 특성과 관련 있는 주제를 도출하였다. 댓글에서는 각 연설문의 내용과는 관계없이 공통적으로 money, work, need의 주제를 발견하였다. 텍스트의 길이가 다름을 고려하여 추가로 중요도 지표 (Prominence Index) 분석을 실행하였고 연설문 내용과 시청자 댓글의 공통적인 주제를 구성하는 핵심어로 time, future, better, best, change, life, business, need를 도출하였다. 유튜브 연설문의 시청자는 인생과 시간, 미래, 고객의 니즈, 긍정적 변화에 대한 메시지에 대하여 동일한 주제로 반응하는 것으로 나타났다.