DOI QR코드

DOI QR Code

Development of a Tourist Satisfaction Quantitative Index for Building a Rating Prediction Model: Focusing on Jeju Island Tourist Spot Reviews

평점 예측 모델 개발을 위한 관광지 만족도 정량 지수 구축: 제주도 관광지 리뷰를 중심으로

  • Dong-kyu Yun (Dept. of Bigdata, Chungbuk National University) ;
  • Ki-tae Park (Dept. of Bigdata, Chungbuk National University) ;
  • Sang-hyun Choi (Dept. of MIS/Bigdata, Chungbuk National University)
  • 윤동규 (충북대학교 빅데이터 협동과정) ;
  • 박기태 (충북대학교 빅데이터 협동과정) ;
  • 최상현 (충북대학교 경영정보학과/빅데이터 협동과정)
  • Received : 2023.11.28
  • Accepted : 2023.12.11
  • Published : 2023.12.31

Abstract

As the tourism industry recovers post the COVID-19 pandemic, an increasing number of tourists are utilizing various platforms to leave reviews. However, amidst the vast amount of data, finding useful information remains challenging, often leading to time and cost inefficiencies in selecting travel destinations. Despite ongoing research, there are limitations due to the absence of ratings or the presence of different rating formats across platforms. Moreover, inconsistencies between ratings and the content of reviews pose challenges in developing recommendation models. To address these issues, this study utilized 7,104 reviews of tourist spots in Jeju Island to develop a specialized satisfaction index for Jeju tourist attractions and employed this index to construct a 'Rating Prediction Model.' To validate the model's performance, we predicted the ratings of 700 experimental data points using both the developed model and an LSTM approach. The proposed model demonstrated superior performance with a weighted accuracy of 73.87%, which is approximately 4.67% higher than that of the LSTM. The results of this study are expected to resolve the discrepancies between ratings and review contents, standardize ratings in reviews without ratings or in various formats, and provide reliable rating indicators applicable across all areas of travel in different domains.

코로나19 팬데믹 이후 관광 산업이 회복되면서 많은 관광객들이 다양한 플랫폼을 활용하고 리뷰를 남기고 있지만, 대량의 데이터 속에서 유용한 정보를 찾기 어려워 아직도 여행지 선정 과정에서 많은 시간과 비용이 낭비되고 있다. 이에 따라 많은 연구들이 진행되고 있지만, 평점이 없거나 플랫폼별로 다른 형태의 평점 제공으로 인해 연구에 한계를 가지고 있으며, 평점과 리뷰 내용이 일치하지 않는 경우도 있어 추천 모델 구축에 어려움을 주고 있다. 본 연구에서는 이러한 문제를 해결하기 위해 7,104개의 제주도 지역 관광지 리뷰를 활용하여 제주도에 특화된 관광지 만족도 정량 지수를 개발하고 이를 활용하여 '평점 예측 모델'을 구축하였다. 모델의 성능을 확인하기 위해 실험 데이터 700건의 평점을 본 연구에서 개발된 모델과 LSTM을 활용하여 예측 하였으며, 제안된 모델이 LSTM 보다 약 4.67% 높은 73.87%의 가중 정확도로 성능이 더 우수한 것을 확인하였다. 본 연구의 결과를 통해 평점과 리뷰 내용 사이의 불일치 문제를 해결하고, 평점이 없는 리뷰나 다양한 형태의 평점을 정형할 수 있으며, 다른 도메인에 적용하여 여행의 모든 분야에서 신뢰할 수 있는 평점 지표를 제공할 수 있을 것으로 기대된다.

Keywords

Acknowledgement

본 연구는 문화체육관광부 및 한국콘텐츠진흥원의 2023년 문화체육관광 연구개발사업의 연구결과로 수행되었음(RS-2023-00227532) 이 논문은 한국전자통신연구원에서 공개한 한국어 언어모델(KorBERT)를 사용함(No.2013-2-00131, 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발)

References

  1. 강희재, 김창희, 성원우. (2019). 텍스트 분석을 통한 서비스 온라인 리뷰의 부정적 편향성에 관한 실증 연구. 한국생산관리학회 학술대회 논문집, 2019(1), 6-6.
  2. 김백기, 장경배. (2023). 딥러닝과 감성사전을 결합한 하이브리드 감성분석 시스템 개발. 한국사물인터넷학회 논문지, 9(4), 21-31.
  3. 김은미. (2021). 온라인 리뷰의 감성분석과 순환 신경망을 적용한 국내 인바운드 관광수요 예측 모형. 관광연구저널, 35(3), 69-79. DOI : 10.21298/IJTHR.2021.3.35.3.69
  4. 노민정. (2021). 리뷰의 품질이 리뷰의 유용성에 미치는 영향: 리뷰 별점의 조절효과를 중심으로. 한국디지털콘텐츠학회 논문지, 22(6), 999-1007. DOI : 10.9728/dcs.2021.22.6.999
  5. 노성화, 김정. (2022). 텍스트마이닝을 위한 한국어 범용 불용어 목록 연구. 한말연구, 63(13), 1-15. DOI : 10.16876/klrc.2022.63.13.1
  6. 박상민, 나철원, 최민성, 이다희, 온병원. (2018). Bi-LSTM 기반의 한국어 감성사전 구축 방안. 지능정보연구, 24(4), 219-240. https://doi.org/10.13088/JIIS.2018.24.4.219
  7. 박소형, 조성준. (2022). 이모지 임베딩을 활용한 한글 소셜 미디어 텍스트 임베딩 방법론 연구. 한국경영과학회 학술대회논문집, 3853-3853.
  8. 박영욱, 정규엽. (2021). DMR(Dirichlet Multinomial Regression) 토픽모델링을 이용한 온라인 리뷰 빅데이터 기반 고객감성 분석에 관한 연구: 국내 5 성급 호텔의 외국인 이용객 리뷰를 중심으로. 호텔경영학연구, 30(2), 1-20. DOI : 10.24992/KJHT.2021.2.30.02.1
  9. 박지수. (2021). 관광이벤트산업에 관한 서비스 품질이 고객만족도와 고객충성도에 미치는 영향에 관한 연구. 동북아관광연구, 17(2), 23-44.
  10. 박지원, 이형룡. (2022). 관광지 만족도를 평가하는 관광지 선택속성에 관한 연구: 텍스트 마이닝과 퍼지셋 질적비교분석의 활용. 관광학연구, 46(6), 105-126.
  11. 서윤암, 김희수, 윤상후. (2022). 날씨와 인기도를 고려한 경북 관광지 추천 알고리즘 개발에 관한 연구. 한국데이터정보과학회지, 33(5), 845-856.DOI : 10.7465/jkdi.2022.33.5.845
  12. 심영석, 김홍범. (2018). 온라인 리뷰 빅데이터 기반의 Word2Vec 기법을 활용한 관광지 개성과 여행객 평점 간 구조적 관계 분석. 관광학연구, 42(8), 165-189. DOI : 10.17086/JTS.2018.42.8.165.189
  13. 어균선, 이건창. (2019). 속성선택방법과 워드임 베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구. 디지털융복합연구, 17(2), 163-170. DOI : 10.14400/JDC.2019.17.2.163
  14. 윤민지, 조창규, 서용원. (2021). 온라인 리뷰의 텍스트 분석을 통한 고객 평점 예측에 관한 연구. 한국생산관리학회지, 32(1), 89-103.
  15. 이상훈, 최정, & 김종우. (2016). 영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석. 지능정보연구, 22(2), 97-113. DOI : https://doi.org/10.13088/jiis.2016.22.2.097
  16. 이종수, 채동규. (2021). 제주도 여행지 추천 시스템: 딥러닝 기반의 여행객 평점 및 다양성 분석 기법. 한국정보과학회 학술발표논문집, 1470-1471.
  17. 정효선, 이선이, 윤혜현. (2021). O2O 외식 배달 앱 서비스 품질이 고객만족도 및 행동의도에 미치는 영향: 식생활 라이프 스타일의 조절효과를 중심으로. 관광연구저널, 35(2), 193-208.DOI : 10.21298/IJTHR.2021.2.35.2.193
  18. 조은경, 남길임. (2022). 한국어 텍스트 감성 분석. 서울: 커뮤니케이션북스.
  19. 조재현. (2023). 정보과다의 위험성과 대응방안에 관한 연구. 東亞法學, -(98), 1-30. DOI : 10.31839/DALR.2023.02.98.1
  20. 조호수, 류민호. (2020). 사업자의 네트워크 중심성이 이용자 만족도에 미치는 영향 연구: 지능정보서비스를 중심으로. 정보사회와 미디어, 21(3), 65-87. DOI : 10.52558/ISM.2020.12.21.3.65
  21. 채영길, 이종혁. (2022). 국제 뉴스에서 국가별 보도 빈도와 보도 태도에 대한 차이 탐색: 감성사전과 인공신경망을 연계한 '하이브리드 감성분석'을 통해. 정치커뮤니케이션 연구, -(65), 5-64. DOI : 10.35731/kpca.2022..65.001
  22. 현지연, 유상이, 이상용. (2019). 평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구, 지능정보연구, 25(1), 219-239. https://doi.org/10.13088/JIIS.2019.25.1.219
  23. 홍태호. (2022). 방한 관광객의 온라인 리뷰에 대한 빅데이터 분석 기반의 감성분석 및 평점예측모형, 지식경영연구, 23(1), 187-201. DOI : 10.15813/kmr.2022.23.1.010
  24. Devika, M. D., Sunitha, C., & Ganesh, A. (2016). Sentiment analysis: a comparative study on different approaches. Procedia Computer Science, 87, 44-49. DOI : 10.1016/j.procs.2016.05.124
  25. Eisenstein, J. (2019). Introduction to natural language processing. MIT press.
  26. Ganesan, K., Zhai, C., & Viegas, E. (2012). Micropinion generation: an unsupervised approach to generating ultra-concise summaries of opinions. In Proceedings of the 21st international conference on World Wide Web, 869-878. DOI : 10.1145/2187836.2187954
  27. Jo, T. (2019). Text mining (Vol. 45). Cham, Switzerland: Springer International Publishing.
  28. Liu, C. Z., Sheng, Y. X., Wei, Z. Q., & Yang, Y. Q. (2018). Research of text classification based on improved TF-IDF algorithm. In 2018 IEEE International Conference of Intelligent Robotic and Control Engineering(IRCE), 218-222. DOI: 10.1109/IRCE.2018.8492945
  29. Nasir, A. F. A., Nee, E. S., Choong, C. S., Ghani, A. S. A., Majeed, A. P. A., Adam, A., & Furqan, M. (2020). Text-based emotion prediction system using machine learning approach. In IOP Conference Series: Materials Science and Engineering, 769(1), 012022. DOI:10.1088/1757-899X/769/1/012022
  30. Shi, F., Chen, L., Han, J., & Childs, P. (2017). A data-driven text mining and semantic network analysis for design information retrieval. Journal of Mechanical Design, 139(11), 111402. DOI : 10.1115/1.4037649
  31. Yang, Z., & Zhang, M. (2020). TextOG: A recommendation model for rating prediction based on heterogeneous fusion of review data. IEEE Access, 8, 159566-159573. DOI: 10.1109/ACCESS.2020.3020942