• 제목/요약/키워드: Opinion Word

검색결과 102건 처리시간 0.019초

해양사고 원인을 분류하기 위한 공통단어의 축소에 관한 연구 (A Study on the Reduction of Common Words to Classify Causes of Marine Accidents)

  • 임정빈
    • 한국항해항만학회지
    • /
    • 제41권3호
    • /
    • pp.109-118
    • /
    • 2017
  • 주제어(key word, KW)는 해양사고의 주요한 원인을 간단하게 표현하기 위한 단어들의 집합으로 해양안전심판원의 심판관들이 작성한다. KW는 심판관들의 서로 다른 주관적인 견해 때문에 일관성 유지가 어렵고, KW의 수가 너무 많은 문제점이 있다. 이러한 문제를 해결하기 위해서는 최적화된 최소의 공통단어(common word, CW)를 이용한 체계적인 KW 구축 프레임이 필요하다. 본 연구의 목적은 체계적인 KW 구축 프레임 개발에 필요한 CW을 도출하는데 있다. 이러한 목적을 달성하기 위하여 본 연구에서는 파레토(Pareto) 분포함수와 파레토 지수를 이용한 최적의 최소 CW 도출방법을 제안하였다. 총 2,642개의 KW을 수집한 후, 수집한 KW의 세부 단어와 이들의 빈도를 갖는 데이터 세트에서 총 56개의 특징적인 CW를 식별하였다. 56개의 특징적인 CW를 이용한 단어 축소실험을 통해서 평균 58.5%의 축소율을 획득하였고, 축소율에 따라서 추정한 CW는 파레토 차트로 검증하였다. 이를 통해서 체계적인 KW 구축 프레임 개발이 가능할 것으로 기대된다.

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

온라인 리뷰에서 평점의 분류 (Classification of ratings in online reviews)

  • 최동준;최호식;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.845-854
    • /
    • 2016
  • 감성분석 (sentiment analysis) 혹은 오피니언 마이닝 (opinion mining)은 블로그, 리뷰, 신문기사나 소셜네트워크 등의 문서에서 개인의 주관적인 정보 혹은 의견을 알아보는데 사용되는 텍스트 마이닝의 기법이다. 평점이 있는 온라인 리뷰에서 리뷰 텍스트에 기반한 평점의 분류문제에 대한 선행연구에서는 이진 분류만을 고려하였다. 그러나 긍정과 부정 외에도 중립적인 의견도 있을 수 있기 때문에 이진 분류보다는 다범주 분류가 더 적합할 것이다. 본 연구에서는 리뷰 텍스트에 기반한 평점의 다범주 분류문제를 고려한다. 전처리에서는 카이제곱 통계량을 이용하여 평점과 연관된 단어들을 추출하고 이를 입력변수로 삼아 지지벡터기계 (support vector machines)와 비례오즈 모형 (proportional odds model) 등 다범주 분류기의 예측력을 비교한다.

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.

Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템 (Question and Answering System through Search Result Summarization of Q&A Documents)

  • 유동현;이현아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권4호
    • /
    • pp.149-154
    • /
    • 2014
  • 지식iN과 같은 사용자 참여 질의응답 커뮤니티에서 원하는 질문에 대한 답을 찾기 위해서는 검색 결과로 제공되는 다양한 문서를 일일이 확인하여 판단하는 과정이 필요하다. 만일 사용자가 원하는 답변을 자동으로 정제하여 제시할 수 있다면, 질의응답의 사용성이 크게 향상될 수 있다. 본 논문에서는 질의응답 데이터 분석을 통해 사용자의 질문의 유형을 단어, 목록, 도표, 글의 4가지 유형으로 분류하고, 문서 내 통계적 특성을 활용하여 각 분류별 답변을 자동으로 제시하기 위한 방식을 제안한다. 단어, 목록, 글 유형은 질의어에 대해 검색된 질문을 군집화하고, 군집 내 빈도와 질의어에 대한 근접도, 답변 신뢰도 등으로 계산된 답변 내 어휘의 적합도를 활용하여 요약한 답변을 사용자에게 제시한다. 도표형은 답변들에서 사용자의 의견 정보를 추출하여 의견 통계를 도표로 제시한다.

소비자의 프로슈머 성향이 인터넷 패션사이트의 구전효과에 미치는 영향 (The Effect of Consumer's Prosumer Propensity on the WOM Effect of Fashion Website)

  • 홍금희
    • 한국의류산업학회지
    • /
    • 제14권1호
    • /
    • pp.75-82
    • /
    • 2012
  • Compared to off-line, on-line word-of-mouth has fast dissemination speed and extensive effects based on interactive features. Moreover, in the age of Web 2.0, on-line media has made consumers evolve from simple purchasers to producers, who intervene into product manufacturing through on-line WOM. According to this, this study is conducted to clarify how consumer's prosumer propensity affects WOM in detail when purchasing fashion products on-line through website interactivity and perceived usefulness of WOM. The results are as follows. 1. Consumer's prosumer propensity is classified in four dimensions: the propensity to participate, the propensity to relate, the propensity to amuse and the propensity to create. 2. The sample has shown low prosumer propensity overall, and there were no gender differences. 3. Testing structural equation model, it was clarified that the higher the consumer's prosumer propensity, the higher the consumer's evaluation of website interactivity and thus the greater the WOM effect through its perception of usefulness. 4. There were some differences in the path of structural equation model according to consumer's prosumer propensity. From the results, it can be concluded that consumer's prosumer propensity is a key factor in the on-line WOM. Therefore fashion businesses should actively utilize consumer's prosumer propensity to apply their opinion in the product planning stage or use it as the means of company-friendly viral marketing.

DIMENSIONS OF INTEGRATED MARKETING COMMUNICATION (IMC) AND THEIR IMPACT IN CREATING BRAND EQUITY IN THE QUICK SERVICE RESTAURANT (QSR) INDUSTRY IN COIMBATORE CITY

  • Selvakumar, J. Joshua
    • 동아시아경상학회지
    • /
    • 제1권3호
    • /
    • pp.42-50
    • /
    • 2013
  • Brand Equity plays a major role in the highly competitive Quick Service Restaurants (QSR) industry in India. There are a variety of factors which affect the brand equity that a company commands in the market. Integrated Marketing Communication (IMC) is an emerging concept in marketing wherein all the major promotional activities are used to create a synergic output and send across a clear and consistent message to the customers. This study aims to find out the impact of five major tools of IMC namely Advertising, Word of Mouth, Sales Promotion, Event Sponsorships and Public Relations which are most applicable in the QSR industry on the four major dimensions namely Brand Awareness, Brand Association, Perceived Quality and Brand Loyalty which aid in creating Brand Equity. The study was conducted by collecting data from a sample and analyzing the data using statistical tools to find any relationships between the above mentioned variables. The findings suggest that marketers should focus on building favorable opinion about the brand amongst customers and take care regarding the news published about the brand since it affects brand image. Moreover, it was also found out that making people aware about the brand and the perceived quality about the brand play the major role in creating brand equity more than other factors.

비정형 데이터 마이닝을 활용한 한국농수산대학 재학생의 학교생활 감성 분석(1) (An Analysis of School Life Sensibility of Students at Korea National College of Agriculture and Fisheries Using Unstructured Data Mining(1))

  • 주진수;이소영;김종숙;송천영;신용광;박노복
    • 현장농수산연구지
    • /
    • 제21권1호
    • /
    • pp.99-114
    • /
    • 2019
  • 본 논문은 빅 데이터 분석기법을 이용하여 한국농수산대학 학생들의 대학생활 요소에 대한 선호도를 연구하기 위하여 비정형 데이터 분석기법으로서 감성 분석(opinion mining) 기법과 텍스트 마이닝 기법을 활용하였다. 분석도구로는 RStudio를 이용하였으며, 긍정과 부정의 감성을 분류하고 선호도를 평가하기 위한 긍정어 사전과 부정어 사전을 새롭게 작성하여 프로그래밍하였다. 비정형 텍스트에 대한 분석 결과는 도표와 워드 클라우드를 이용한 시각화 자료로 나타내어 정보를 추출하였다. 학교생활 요소로는 '나의 현재', '10년 후 모습', '교우관계', '한농제(대학 축제)', '후생관(식사)', '청학관(기숙사)', '한농대', '장기현장실습' 등 학생들에게 밀접한 8가지 주제를 대상으로 하였다. 분석 결과 한농대 학생들은 '후생관 식사'과 ' 교우관계'의 주제에 대해서 85% 이상의 긍정적 감성을 나타냈으나 '장기현장실습'과 '청학관(기숙사)'에 대해서는 긍정적 감성이 60%를 넘지 않는 만족도를 갖는 것으로 나타났다. 그리고 '나의 현재', '10년 후 모습', '한농제(대학 축제)' 및 'KNCAF' 등의 주제에 대해서는 69.3~74.2% 정도의 긍정적 감성을 나타냈다. 남녀 학생별 차이를 보면 '나의 현재', '10년 후 모습', '교우관계', '청학과(기숙사)' 및 '장기현장실습' 주제에서는 남학생의 긍정적 감성이 높게 나타났으며, '한농제(대학 축제)', '후생관' 및 '한농대' 주제에서는 여학생의 긍정적 감성이 높게 나타났다. 전공별 특징을 살펴보면 학생들은 '현재'나 '10년 후'의 자신의 모습에 대하여 71% 이상 긍정적 자신감을 지니고 있는 것으로 나타났다. 특히 축산계열 학생들의 긍정적 감성이 높게 나타났으며, 화훼학과 학생들은 다른 전공의 학생들에 비하여 긍정적 감성이 낮게 나타나 자신감이 부족한 결과를 보였다. '교우관계'에 대해서는 화훼학과를 제외하고 80% 이상의 긍정적 감성을 나타냈으며, 중소가축학과 학생들은 93%를 초과하는 적극적인 교우관계를 맺고 있는 것으로 나타났다. 대학 축제인 '한농제'에 대하여 전체 학생들의 긍정적 감성은 약 70% 정도이나 과수학과와 수산양식학과 학생들의 호감도는 60% 미만으로 축제에 대한 부정적 이미지가 높게 나타났다. '후생관 식사'에 대한 전체 학생들의 긍정적 감성은 85%를 넘어 매우 높은 만족도를 나타냈으나 수산양식학과 학생(남학생)들의 만족도는 매우 낮게 나타났다. 모든 학생들이 공동생활을 하는 '청학관'에 대한 학생들의 호감도는 59.5%로 낮게 나타났으며, 과수학과와 수산양식학과 학생들의 만족도는 약 42% 미만으로 더욱 부정적인 감성을 나타냈다. 또한 자신들이 3년간 학업을 재학한 한농대에 대해서는 74% 이상이 긍정적인 평가를 하는 것으로 나타났다. 특히 학생들의 호감도가 가장 낮게 나타난 장기현장실습에 대한 화훼학과, 채소학과, 중소가축학과 학생들의 호감도는 50%를 넘지 않는 매우 부정적 감성을 나타냈다. 빅 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하기 위하여 텍스트 마이닝 기법으로 구조화되지 않은 텍스트에서 주요 단어를 긍정어와 부정어로 나누어 추출하고 그 단어들의 word cloud를 작성하여 학생들의 감성을 시각화하였다. 한농대는 학생들에게 지금보다 더욱 긍정적인 감성을 가지고 밝고 환한 말, 힘이 되고 용기를 주는 말, 사람을 기쁘게 하는 말을 많이 할 수 있도록 여건을 제공함으로써 학생들은 삶의 활기가 넘치고 성공적인 인생을 살아가는 행복을 만들 수 있으리라 여겨진다.

델파이 기법을 활용한 도시 하천 환경 평가지표 선정 (A Study on the Development of the Urban River Environment Evaluation Indexes Using Delphi Method)

  • 박은하;김진원;오충현
    • 한국환경복원기술학회지
    • /
    • 제18권6호
    • /
    • pp.27-38
    • /
    • 2015
  • This study is for deriving an evaluation system which fits to the domestic urban river. For this, two times of Delphi survey was conducted to various experts who are eminent for ecology, urban design, governance, landscape architecture, hydrology. The purpose was for analysing validity and getting extra opinion of evaluation items which were preferentially have chosen. Reflecting $1^{st}$ survey's opinions as changing the word or explaining more details, the second survey was conducted, In this time, all evaluation items were analysed as valid and experts agreed with that. In conclusion, the evaluation items, "Amenity", "Biodiversity", "Ecosystem service", "Governance", "Management", which are for evaluating domestic urban river environment were derived.

Text Mining and Visualization of Papers Reviews Using R Language

  • Li, Jiapei;Shin, Seong Yoon;Lee, Hyun Chang
    • Journal of information and communication convergence engineering
    • /
    • 제15권3호
    • /
    • pp.170-174
    • /
    • 2017
  • Nowadays, people share and discuss scientific papers on social media such as the Web 2.0, big data, online forums, blogs, Twitter, Facebook and scholar community, etc. In addition to a variety of metrics such as numbers of citation, download, recommendation, etc., paper review text is also one of the effective resources for the study of scientific impact. The social media tools improve the research process: recording a series online scholarly behaviors. This paper aims to research the huge amount of paper reviews which have generated in the social media platforms to explore the implicit information about research papers. We implemented and shown the result of text mining on review texts using R language. And we found that Zika virus was the research hotspot and association research methods were widely used in 2016. We also mined the news review about one paper and derived the public opinion.