DOI QR코드

DOI QR Code

Prediction of Good Seller in Overseas sales of Domestic Books Using Big Data

빅데이터를 활용한 국내 도서의 해외 판매시 굿셀러 예측

  • Kim, Nayeon (Department of Statistics and Information Science, Dongduk Women's University) ;
  • Kim, Doyoung (Department of Statistics and Information Science, Dongduk Women's University) ;
  • Kim, Miryeo (Department of Statistics and Information Science, Dongduk Women's University) ;
  • Jung, Jiyeong (Department of Statistics and Information Science, Dongduk Women's University) ;
  • Kim, Hyon Hee (Department of Statistics and Information Science, Dongduk Women's University)
  • 김나연 (동덕여자대학교 정보통계학과) ;
  • 김도영 (동덕여자대학교 정보통계학과) ;
  • 김미려 (동덕여자대학교 정보통계학과) ;
  • 정지영 (동덕여자대학교 정보통계학과) ;
  • 김현희 (동덕여자대학교 정보통계학과)
  • Published : 2022.05.17

Abstract

한국 문학이 세계로 뻗어나감에 따라 해외 시장에서 자리를 잡는 것이 중요해진 시점이다. 본 연구에서는 2016 년도부터 2020 년도까지 최근 5 년간 해외 출간된 도서들 중에서 굿셀러로 분류되는 누적 5 천부 이상 판매 여부를 예측하고자 했다. 굿셀러로 분류되는 도서는 전체 번역 도서 중 적은 비율을 차지하여 데이터 불균형이 발생하였으며, 본 연구에서는 SMOTE 기법과 앙상블 알고리즘을 적용하여 데이터 불균형 문제를 해결하였다. 그 결과, 데이터 클래스 비율이 1:1 에 가까울수록 성능 개선 효과가 나타났으며 LightGBM 모델이 99.83%의 AUC 값을 얻어 다른 앙상블 알고리즘에 비해 가장 좋은 예측 성능을 보임을 검증하였다. 또한 누적 5 천부 이상 판매 여부 예측에 있어 큰 영향을 미치는 변수로는 작가가 가장 중요한 요인으로 나타났으며 출간 국가, 그리고 평점 평균, 평점 참여자 수 같은 온라인 요인도 판매 예측에 유의미한 변수로 나타난 것을 확인할 수 있었다.

Keywords