• 제목/요약/키워드: Customer Review Classification

검색결과 34건 처리시간 0.023초

Analyzing Online Customer Reviews for the Hotel Classification in Vietnam

  • NGUYEN, Ha Thi Thu;TRAN, Tuan Minh;NGUYEN, Giang Binh
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권8호
    • /
    • pp.443-451
    • /
    • 2021
  • The classification standards for hotels in Vietnam are different from many other hotel classification standards in the world. This study aims to analyze customer reviews on the TripAdvisor website to develop a new algorithm for hotel rating that is independent of Vietnam's hotel classification standards. This method can be applied to individual hotels, or hotels of a region or the whole country, while online booking sites only rate individual hotels. Data was crawled from TripAdvisor with 22,287 reviews of 5 cities in Vietnam. This study used a statistical model to analyze the review dataset and build an algorithm to rate hotels according to aspects or hotel overall. The results have less rating deviation when compared to the TripAdvisor system. This study also supports hotel managers to regularly update the status of their hotels using data from customer reviews, from which, managers can strategize long-term solutions to improve the quality of the hotel in all aspects and attract more travelers to Vietnam. Moreover, this method can be developed into an automatic system to rate hotels and update the status of service quality more quickly, thus, saving time and costs.

Hierarchical Attention Network를 활용한 주제에 따른 온라인 고객 리뷰 분석 모델 (Analysis of the Online Review Based on the Theme Using the Hierarchical Attention Network)

  • 장인호;박기연;이준기
    • 한국IT서비스학회지
    • /
    • 제17권2호
    • /
    • pp.165-177
    • /
    • 2018
  • Recently, online commerces are becoming more common due to factors such as mobile technology development and smart device dissemination, and online review has a big influence on potential buyer's purchase decision. This study presents a set of analytical methodologies for understanding the meaning of customer reviews of products in online transaction. Using techniques currently developed in deep learning are implemented Hierarchical Attention Network for analyze meaning in online reviews. By using these techniques, we could solve time consuming pre-data analysis time problem and multiple topic problems. To this end, this study analyzes customer reviews of laptops sold in domestic online shopping malls. Our result successfully demonstrates over 90% classification accuracy. Therefore, this study classified the unstructured text data in the semantic analysis and confirmed the practical application possibility of the review analysis process.

텍스트 마이닝을 활용한 고객 리뷰의 유용성 지수 개선에 관한 연구 (A Study on Classifications of Useful Customer Reviews by Applying Text Mining Approach)

  • 이홍주
    • 한국IT서비스학회지
    • /
    • 제14권4호
    • /
    • pp.159-169
    • /
    • 2015
  • Customer reviews are one of the important sources for purchase decision makings in online stores. Online stores have tried to provide useful reviews in product pages to customers. To assess the usefulness of customer reviews before other users have voted enough on the reviews, diverse aspects of reviews were utilized in prevous studies. Style and semantic information were utilized in many studies. This study aims to test diverse alogrithms and datasets for identifying a proper classification method and threshold to classify useful reviews. In particular, most researches utilized ratio type helpfulness index as Amazon.com used. However, there is another type of usefulness index utilized in TripAdviser.com or Yelp.com, count type helpfulness index. There was no proper threshold to classify useful reviews yet for count type helpfulness index. This study used reivews and their usefulness votes on restaurnats from Yelp.com to devise diverse datasets and applied text mining approaches to classify useful reviews. Random Forest, SVM, and GLMNET showed the greater values of accuracy than other approaches.

엔트로피 점수를 이용한 감성분석 분류알고리즘의 수행도 평가 (Evaluation of Classification Algorithm Performance of Sentiment Analysis Using Entropy Score)

  • 박만희
    • 한국정보통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.1153-1158
    • /
    • 2018
  • 다양한 온라인 고객 평가 및 소셜 미디어 정보는 고객의 의사결정에 영향을 미치기 때문에 기업에게 매우 중요한 정보 출처라고 할 수 있다. 설문 조사를 통해 고객의 다양한 요구와 불만 사항을 파악하는 데는 많은 비용과 시간적인 제약이 발생하고 있다. 온라인 쇼핑몰의 고객 후기 데이터는 제품에 대한 고객들의 감성을 분석할 수 있는 이상적인 자료를 제공하고 있다. 본 연구에서는 삼성과 애플 스마폰에 대한 감성분석을 위해 아마존 쇼핑몰로부터 고객 리뷰 데이터를 수집하였다. 선행 연구에서 대표적인 감성분석 기법으로 사용된 5가지 분류 알고리즘을 적용하였다. 5가지 분류알고리즘은 support vector machines, bagging, random forest, classification or regression tree, maximum entropy 등이다. 본 연구에서는 분류 알고리즘의 수행도를 종합적으로 평가할 수 있는 entropy score를 제안하였다. Entropy score를 이용하여 5가지 알고리즘을 평가한 결과에 따르면 support vector machines 알고리즘의 entropy score가 가장 높은 것으로 분석되었다.

Online Social Media Review Mining for Living Items with Probabilistic Approach: A Case Study

  • Li, Shuai;Hao, Fei;Kim, Hee-Cheol
    • 스마트미디어저널
    • /
    • 제2권2호
    • /
    • pp.20-27
    • /
    • 2013
  • The concept of social media is top of the agenda for many business executives and decision makers, as well as consultants try to identify ways where companies can make profitable use of applications such as Netflix, Flixster. The social media is playing an increasingly important role as the information sources for customers making product choices etc. With the flourish of Web 2.0 technology, customer reviews are becoming more and more useful and important information resources for people to save their time and energy on purchasing products that they want. This paper proposes the Bayesian Probabilistic Classification algorithm to mine the social media review, and evaluates it by different splits and cross validation mechanism from the real data set. The explored study experimental results show the robustness and effectiveness of proposed approach for mining the social media review.

  • PDF

고객 감성 분석을 위한 학습 기반 토크나이저 비교 연구 (Comparative Study of Tokenizer Based on Learning for Sentiment Analysis)

  • 김원준
    • 품질경영학회지
    • /
    • 제48권3호
    • /
    • pp.421-431
    • /
    • 2020
  • Purpose: The purpose of this study is to compare and analyze the tokenizer in natural language processing for customer satisfaction in sentiment analysis. Methods: In this study, a supervised learning-based tokenizer Mecab-Ko and an unsupervised learning-based tokenizer SentencePiece were used for comparison. Three algorithms: Naïve Bayes, k-Nearest Neighbor, and Decision Tree were selected to compare the performance of each tokenizer. For performance comparison, three metrics: accuracy, precision, and recall were used in the study. Results: The results of this study are as follows; Through performance evaluation and verification, it was confirmed that SentencePiece shows better classification performance than Mecab-Ko. In order to confirm the robustness of the derived results, independent t-tests were conducted on the evaluation results for the two types of the tokenizer. As a result of the study, it was confirmed that the classification performance of the SentencePiece tokenizer was high in the k-Nearest Neighbor and Decision Tree algorithms. In addition, the Decision Tree showed slightly higher accuracy among the three classification algorithms. Conclusion: The SentencePiece tokenizer can be used to classify and interpret customer sentiment based on online reviews in Korean more accurately. In addition, it seems that it is possible to give a specific meaning to a short word or a jargon, which is often used by users when evaluating products but is not defined in advance.

스마트 홈 어플리케이션의 고객반응리뷰분석을 통한 기업별 서비스개선전략에 대한 연구 : 스마트 홈 사용성 가치의 기능적요소와 디자인적 요소 분류를 바탕으로 (A Study on the Service Improvement Strategies by Enterprise through the Analysis of Customer Response Reviews in Smart Home Applications : Based on the Classification of Functional Elements and Design Elements of smart Home Usability Values)

  • 허지연;김민지;차경진
    • 한국IT서비스학회지
    • /
    • 제19권4호
    • /
    • pp.85-107
    • /
    • 2020
  • The Internet of Things market, a technology that connects the Internet to various things, is growing day by day. Besides, various smart home services using IoT and AI (Artificial Intelligence) are being launched in homes. Related to this, existing smart home-related studies focus primarily on ICT technology, not on what service improvements should be made in customer positions. In this study, we will use smart home application customer review data to classify functional and design elements of smart home usability value and examine the ways customers think of service improvement. For this, LG Electronics and Samsung Electronics" Smart Home application, the main provider of Smart Home in Korea, customer reviews were crawled to conduct a comparative analysis between them. In this study, the review of IoT home-applications was analyzed to find service improvement insights from customer perspective, and related analysis of text mining, social network analysis and Doc2vec was used to efficiently analyze data equivalent to about 16,000 user reviews. Through this research, we hope that related companies effectively seek ways to improve smart home services that reflect customer needs and are expected to help them establish competitive strategies by identifying weaknesses and strengths among competitors.

사전 세분화를 통한 고객 분류모형의 효과성 제고에 관한 연구 (Improving the Effectiveness of Customer Classification Models: A Pre-segmentation Approach)

  • 장남식
    • 경영정보학연구
    • /
    • 제7권2호
    • /
    • pp.23-40
    • /
    • 2005
  • 시장에서의 경쟁이 점차 심화되고 서비스나 상품에 대한 고객들의 요구와 기대치가 증가함에 따라 기업들에 있어 과학적인 데이터 분석에 근거한 경영전략 수립 및 실행의 필요성이 어느 때보다 크게 강조되고 있다. 그러나 인적자원과 및 자금 등을 포함한 가용자원은 한정적이기 때문에 이들 자원을 얼마나 효율적으로 사용하여 효과적인 결과를 획득하는가가 기업 성패를 좌우하는 주요 지표가 되고있다. 본 연구에서는 선택과 집중적 자원 배분이라는 이슈에 초점을 맞춰 사전 세분화를 통해 선정된 고객 군만을 대상으로 고객의 특성을 파악하고 관리하는 방안이 전체 고객을 대상으로 하는 것보다 보다 의미가 있다는 것을 실제 현업데이터를 통해 검증하고자 하였다. 이를 위해 카드사, 이동통신사, 보험사의 고객 인적데이터 및 거래데이터를 수집하였고, 통계분석과 현업전문가의 의견을 수렴해 고객 세분화를 수행하였으며, 각 세분 군별로 데이터마이닝의 의사결정나무 기법을 이용해 해지모형을 구축하여 전체 고객을 대상으로 한 모형과 정분류율과 규칙의 간결성 측면에서 비교 평가하였다. 결과적으로 세분 군별 해지모형이 전체 고객대상 모형에 비해 정분류율은 높거나 비슷한 수준을 유지하면서 보다 간결하고 의미있는 규칙을 제공하였다.

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.129-142
    • /
    • 2016
  • 전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.

An Optimal Weighting Method in Supervised Learning of Linguistic Model for Text Classification

  • Mikawa, Kenta;Ishida, Takashi;Goto, Masayuki
    • Industrial Engineering and Management Systems
    • /
    • 제11권1호
    • /
    • pp.87-93
    • /
    • 2012
  • This paper discusses a new weighting method for text analyzing from the view point of supervised learning. The term frequency and inverse term frequency measure (tf-idf measure) is famous weighting method for information retrieval, and this method can be used for text analyzing either. However, it is an experimental weighting method for information retrieval whose effectiveness is not clarified from the theoretical viewpoints. Therefore, other effective weighting measure may be obtained for document classification problems. In this study, we propose the optimal weighting method for document classification problems from the view point of supervised learning. The proposed measure is more suitable for the text classification problem as used training data than the tf-idf measure. The effectiveness of our proposal is clarified by simulation experiments for the text classification problems of newspaper article and the customer review which is posted on the web site.