DOI QR코드

DOI QR Code

리뷰 데이터 감성 분류 성능 향상을 위한 Fine-tuning 방법

Fine-tuning Method to Improve Sentiment Classification Perfoimance of Review Data

  • 박정일 (조선대학교 소프트웨어융합공학과 ) ;
  • 임명진 (조선대학교 신산업융합학부) ;
  • 김판구 (조선대학교 컴퓨터공학과)
  • Jung II Park ;
  • Myimg Jin Lim ;
  • Pan Koo Kim
  • 투고 : 2024.05.09
  • 심사 : 2024.06.17
  • 발행 : 2024.06.28

초록

현대사회의 기업들은 소셜 미디어, 제품 리뷰, 고객 피드백 등 다양한 영역에 걸쳐 소비자 의견을 정확하게 이해하는 것이 경쟁에서 성공하기 위한 주요 과제임을 강조하며 감성 분류를 점점 더 중요한 작업으로 채택하고 있다. 감성 분류는 소비자의 다양한 의견과 감성을 파악하여 제품이나 서비스 개선에 도움을 주는 이유로 많은 연구가 진행중이다. 감성 분류에서는 대규모 데이터 셋과 사전 학습된 언어 모델을 통한 미세 조정이 성능 향상에 중요한 역할을 한다. 최근 인공지능 기술의 발전으로 감성 분류 모델은 높은 성능을 보이고 있으며, 특히 ELECTRA 모델은 효율적인 학습 방법과 적은 컴퓨팅 자원을 통해 뛰어난 결과를 제공한다. 따라서 본 논문에서는 ELECTRA에서 한국어를 학습한 KoELECTRA 모델을 이용하여 다양한 데이터 셋에 대한 효율적인 미세 조정을 통해 감성 분류 성능을 향상하는 방법을 제안한다.

Companies in modern society are increasingly recognizing sentiment classification as a crucial task, emphasizing the importance of accurately understanding consumer opinions opinions across various platforms such as social media, product reviews, and customer feedback for competitive success. Extensive research is being conducted on sentiment classification as it helps improve products or services by identifying the diverse opinions and emotions of consumers. In sentiment classification, fine-tuning with large-scale datasets and pre-trained language models is essential for enhancing performance. Recent advancements in artificial intelligence have led to high-performing sentiment classification models, with the ELECTRA model standing out due to its efficient learning methods and minimal computing resource requirements. Therefore, this paper proposes a method to enhance sentiment classification performance through efficient fine-tuning of various datasets using the KoELECTRA model, specifically trained for Korean.

키워드

과제정보

이 논문은 2023학년도 조선대학교 학술연구비의 지원을 받아 연구되었음.

참고문헌

  1. YuNa Lee, Mijin Noh, YangSok Kim, MuMoungCho Han, Analysis of service strategies through changes in Messenger application reviews during the pandemic: focusing on topic modeling," Smart Media Journal, Vol. 12, No. 6, pp. 15-26, Jun. 2023.
  2. Myung Jin Lim, Pankoo Km, Ju Hyun Shin, "Sentiment Analysis Model with Semantic Topic Classification of Reviews," Smart Media Journal, Vol. 9, No. 2, pp. 69-77, 2020.
  3. Jeong In Km, Sang Jin Park, Hyoung Ju Km, Jun Ho Choi, Han II Kim, Pan Koo Kim, "Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification," Smart Media Journal, Vol. 9, No. 1, pp. 51-59, 2020.
  4. Seung Wan Chae, Woo Chang Lee, Byoung Woo Lee, Choong Kwon Lee, "A study on classification of textile design and extraction of regions of interest," Smart Media Journal, Vol. 10, No. 2, pp. 70-75, 2021.
  5. Hong, Sung-jun, "Korean Spoken Sentences Emotion Classification using Recurrent - Convolutional Neural Network", master, Kyungpook National University, 2017.
  6. Jacov Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova, "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding", NAACL-HLT, 2019.
  7. Kevin Clark, Minh-Thang Luong, Quoc V. Le, Christopher D. Manning, "ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators", ICLR, May 2020.
  8. Ha, Jae-ryong, "A study on sentiment labeling techniques for news article titles", master, Korea University, Feb. 2022.
  9. Park, Sang-min, Na Cheol-won, Choi Min-seong, Da-hee Lee, On Hospital, "Building a sentiment dictionary based on Bi-LSTM", Kunsan National University, Intelligence Information Research, Vol. 24, No. 4, pp. 219-240, Dec. 2018.
  10. "KoELECTRA", Github, https://github.com/monologg/KoELECTRA (accessed. Oct., 13, 2023).
  11. "nsmc", Github, https://gitiiub.com/e9t/nsmc/(accessed, Oct., 13, 2023).
  12. "말뭉치 모음", https://github.corn/bab2min/corpus/tree/master/sentiment (accessed, Oct" 13, 2023).
  13. ''Transfer Learning", Tistory, https://]einalog.tistory.com/13 (accessed. Oct., 13, 2023).