DOI QR코드

DOI QR Code

Searching association rules based on purchase history and usage-time of an item

콘텐츠 구매이력과 사용시간을 고려한 연관규칙탐색

  • 이봉규 (제주대학교 전산통계학과)
  • Received : 2020.05.29
  • Accepted : 2020.06.19
  • Published : 2020.06.30

Abstract

Various methods of differentiating and servicing digital content for individual users have been studied. Searching for association rules is a very useful way to discover individual preferences in digital content services. The Apriori algorithm is useful as an association rule extractor using frequent itemsets. However, the Apriori algorithm is not suitable for application to an actual content service because it considers only the reference count of each content. In this paper, we propose a new algorithm based on the Apriori that searches association rules by using purchase history and usage-time for each item. The proposed algorithm utilizes the usage time with the weight value according to purchase items. Thus, it is possible to extract the exact preference of the actual user. We implement the proposed algorithm and verify the performance through the actual data presented in the actual content service system.

디지털 콘텐츠를 사용자 개인별로 차별화하여 서비스하는 방법들이 다양하게 연구되고 있다. 연관규칙 탐색은 디지털 콘텐츠 서비스에서 각 개인의 선호도를 발견하는데 유용한 방법이다. Apriori 알고리즘은 빈발항목집합을 이용한 연관규칙 알고리즘으로 유용하게 사용되고 있다. 그러나 Apriori 알고리즘은 각 콘텐츠의 참조횟수만을 고려하기 때문에 상용 콘텐츠 서비스에서 나타나는 개인의 실제적인 선호도를 반영하기 어렵다. 본 논문에서는 콘텐츠별 구매이력과 사용시간을 기반으로 연관규칙을 탐색하는 Apriorir기반의 알고리즘을 제안한다. 제안하는 알고리즘은 빈발항목을 선택할 때 구매여부에 따른 가중치 값을 가지는 사용시간을 활용한다. 이러한 방법을 통하여 실제 사용자의 정확한 선호도를 파악할 수 있다. 제안된 알고리즘을 구현하고, 실제 콘텐츠 서비스 시스템에서 나타난 실제 데이터를 통하여 성능을 검증한다.

Keywords

References

  1. 이상호, 김종배, "캠페인 실행에 영향을 미치는 디지털 마케팅 성과모형 연구", 한국디지털콘텐츠학회논문지, vol.13, no.2, pp.205-211, 2012. DOI: http://dx.doi.org/
  2. 황현숙, 박규석, "연관규칙 기반의 상품검색 데이터베이스 최적화 연구", 한국멀티미디어학회논문지, vol.7, no.2, pp. 145-155, 2004. https://academic.nave r.com/article.naver?doc_id=30588026
  3. R. Agrawal, R. Srikant, "Fast algorithms for mining association rules", Proceeding of the 20th VLDB Conference, 487-499, Santiago, Chile, 1994. http://www.vldb.org/conf/1994/P487.PDF
  4. J. S. Park, M. S. Chen, S. Y. Philips, "An effecvie hash-based algorithms for mining association rules", ACM SIGMOD Record, vol.24, no.2, pp.175-186, 1995. https://doi.org/10.1145/568271.223813
  5. H. Mannila, H. Toivonen, A. I. Verkanmo, "Discovering frequent episodes in sequences", Data Mining and Knowledge Discovery, vol.1, no.3, pp.259-290, 1997. http://www.aaai.org/Library/KDD/1995/kdd95-024.php https://doi.org/10.1023/A:1009748302351
  6. L. Huang, H. Chen, X. Wanf, G. Chen, "A Fast distribution algorithm for mining association rules", Journal of Computer Science and Technology, vol.15, no.6, pp.619-624, 2000. https://academic.naver.com/article.naver?doc_id=593065990 https://doi.org/10.1007/BF02948845
  7. P. T. Kavitha, T. Sasipraba, "Performance Evaluation of Algorithms using a Distributed Data Mining Frame Work based on Association Rule Mining", International Journal on Computer Science and Engineering, vol.3, no.12, pp.3845-3853, 2011. https://academic.naver.com/article.naver?doc_id=81433342
  8. 김정현, 김재련, "시간을 고려한 연관규칙을 이용한 웹 사용자 접근패턴 분석", 한국경영과학회/대한산업공학회 춘계공동학술대회 발표논문집, 852-855, 관동대학교, 양양, 2001. https://www.dbpia.co.kr/pdf/pdfView.do?nodeId=NODE01979990&mark=0&useDate=&bookmarkCnt=0&ipRange=N&language=ko_KR
  9. 강형창, 양근탁, 김철수, 이윤정, 이봉규, "아이템 사용시간을 고려한 Apriori 알고리즘", 대한전기학회논문지 D, vol.59, no.7, pp.1327-1331, 2010. https://www.dbpia.co.kr/pdf/pdfView.do?nodeId=NODE01461451&mark=0&useDate=&bookmarkCnt=1&ipRange=N&language=ko_KR
  10. 박희창, "연관규칙 마이닝에서 기여 순수 신뢰도의 제안중요지지도를 고려한 연관규칙 탐사 알고리즘", 한국데이터정보과학회지, vol.22, no.2, pp.235-243, 2011. http://www.koreascience.kr/journal/JBGHAN/y2003m10a.kr