DOI QR코드

DOI QR Code

협력필터링과 사회연결망을 이용한 신규고객 추천방법에 대한 연구

The Research on Recommender for New Customers Using Collaborative Filtering and Social Network Analysis

  • 신창훈 (한국해양대학교 물류시스템학과) ;
  • 이지원 (한국해양대학교 물류시스템학과) ;
  • 양한나 (한국해양대학교 물류시스템학과) ;
  • 최일영 (경희대학교 경영학과.경영연구원)
  • Shin, Chang-Hoon (Dept. of Logistics engineering, Korea Maritime University) ;
  • Lee, Ji-Won (Dept. of Logistics engineering, Korea Maritime University) ;
  • Yang, Han-Na (Dept. of Logistics engineering, Korea Maritime University) ;
  • Choi, Il Young (School of Management and Management Research Institute, Kyung Hee University)
  • 투고 : 2012.11.07
  • 심사 : 2012.11.22
  • 발행 : 2012.12.31

초록

고객이 상품을 구매하는 패턴이 빠르게 변화하고 있다. 오프라인에서 고객이 직접 상품을 보고, 체험한 후 구매하던 패턴이 TV홈쇼핑, 인터넷 쇼핑 등 고객이 편리한 장소에서 자유롭게 구매하는 방법으로 확산되었다. 이처럼 구매 가능한 상품의 범위는 점점 더 다양해지고 있지만 이로 인하여 고객이 상품을 구매할 때 생기는 번거로움은 더욱 커지고 있다. 오프라인에서는 물건을 직접보고 구매하기 때문에 반품율이 낮은 반면에 온라인 구매 물품은 배송과 환불 등에서 복잡한 일들이 많이 발생한다. 온라인을 통해서 물건을 구매할 때 상품에 대한 사전 정보는 매우 한정적이며 실제로 물건을 구매했을 경우 고객이 생각했던 것과 다를 수 있다. 이러한 결과는 결국 고객의 불만족 및 구매취소로 이어진다. 또한 TV홈쇼핑이나 인터넷 쇼핑 등을 통해서 물건을 구매할 때 고객들은 이미 상품을 구매한 고객의 리뷰에도 관심을 기울이고 있다. 좋은 평가를 받은 상품은 더 많은 매출로 이어질 수 있기 때문에 기업은 이에 관심을 기울일 필요가 있다. 고객의 욕구를 만족시킬 수 있는 적절한 상품을 추천해 주고 이를 구매로 연결시키는 것은 기업의 이윤 창출과 직결되기 때문에 그 중요성이 강조된다. 고객을 위한 추천방법은 베스트셀러기반 추천방법, 인구통계 정보기반 추천방법, 최소질의대상 상품결정방법, 내용필터링기법, 협력필터링기법 등이 존재하며, 이에 대한 많은 연구가 활발하게 진행되고 있다. 그러나 위의 방법들을 신규고객에게 적용하는 것에는 문제가 발생할 수 있다. 신규고객은 상품에 대한 과거 구매이력이 존재하지 않기 때문이다. 이를 해결하기 위한 방안으로 가입 시, 고객의 인구통계적 정보나 선호도에 대한 응답을 유도하는 방법을 활용할 수 있다. 그러나 고객이 이에 대한 번거로움을 느낄 수도 있으며, 불완전한 답변을 하게 되면 추천의 정확도는 감소한다. 최근 이미 상품을 구매한 고객의 리뷰 및 기업에서 추천하는 제품에 의존하는 고객들이 증가하면서 이를 악용하는 사례도 자주 등장한다. 결국 추천에 대한 고객들의 신뢰는 감소하게 될 것이다. 따라서 좀 더 명확한 방식의 추천시스템이 절실하며, 이것이 개선된다면 는 곧 고객들의 신뢰 증가로 이어질 것이다. 본 연구에서는 협력필터링기법과 사회연결망기법의 중심성을 결합한 분석을 시도하였다. 중심성은 신규고객의 선호도를 기존고객들의 데이터를 통하여 유추하기 위하여 활용되는 정보이다. 기존 연구들에서는 기존고객들의 구매 가운데 구매성향이 유사한 고객들의 정보에 초점을 맞추고 있으며 구매성향이 다른 고객들의 정보에 대한 분석은 이루어지고 있지 않다. 그러나 이처럼 구매성향이 서로 다른 고객들의 정보를 활용한다면 추천의 정확성이 더 향상되지 않을까 하는 점을 기반으로 데이터들을 다양한 방식으로 분석하였다. 연구에 사용된 데이터는 미네소타대학의 GroupLens Research Project팀이 협력필터링기법을 통하여 영화를 추천하기 위해 만든 MovieLens의 데이터이다. 이는 1,684편의 영화에 대한 선호도를 943명이 응답한 정보로 총 100,000개의 데이터가 있다. 이를 시간 순으로 구분하여 초기 50,000개의 데이터를 기존고객의 데이터로, 후기 50,000개의 데이터를 신규고객의 데이터로 사용하였다. 이 때, 신규고객과 기존고객은 연구자가 임의로 구분한 것이다. 따라서 신규고객이라고 표현되는 고객의 데이터는 실제로 추천시스템을 통해 정보를 제공받은 고객이라고는 볼 수 없다. 그러나 현실적으로 실제 신규고객의 데이터를 수집하는 것이 쉽지 않기 때문에 전체 고객의 정보를 시간 순으로 구분하고 신규고객으로 분류한 것임을 밝혀둔다. 제시된 추천시스템은 [+]집단 추천시스템, [-]집단 추천시스템, 통합 추천시스템으로 총 3가지이다. [+]집단 추천시스템은 기존의 연구들과 유사한 방식으로 유사도가 높은 고객들을 신규고객의 이웃고객으로 분석하였다. 유사도가 높다는 것은 다른 고객들과 상품 구매에 대한 성향이 유사한 것을 의미한다. 또한 [-]집단 추천시스템은 유사도가 낮고 다른 고객들과 상품의 구매패턴이 반대에 가까운 고객들의 데이터를 활용하였으며, 통합 추천시스템은 [+]집단 추천시스템과 [-]집단 추천시스템을 결합한 방식이다. [+]집단 추천시스템과 [-]집단 추천시스템에서 각각 추천된 영화 가운데 중복되는 영화만을 신규고객에게 추천하는 방식이다. 다양한 방법의 시도를 통하여 적절한 추천시스템을 찾고, 추천시스템의 정확도를 향상시키는데 그 목적이 있다. 활용된 데이터의 분석 결과는 통합 추천시스템이 정확도가 가장 높았으며 [-]집단 추천시스템, [+]집단 추천시스템의 순인 것으로 나타났다. 이는 통합 추천시스템이 가장 효율적일 것이라는 연구자의 추측과 일치하는 결과이다. 각각의 추천시스템은 정확도의 변화를 쉽게 비교할 수 있도록 등고선지도 및 그래프를 이용하여 나타냈다. 연구의 한계점으로는 연구자가 제시한 통합 추천시스템과 [-]집단 추천시스템에 대한 정확도는 향상되었지만 이는 임의로 구분한 기준을 바탕으로 분석하였다는 점이다. 실제 추천된 영화를 바탕으로 신규고객이 영화를 선택 한 것이 아니라 기존고객의 데이터를 임의로 분류하였기 때문이다. 따라서 이는 추천 영화가 실제 고객에 미친 영향이 아니라는 한계가 존재한다. 또한 영화가 아닌 다른 상품에 대해서 이 추천시스템을 적용하였을 경우 추천 정확도에는 차이가 있을 수 있다. 따라서 추천시스템을 적용할 때에는 각 상품 및 고객집단의 특성에 적합한 적용이 필요하다.

Consumer consumption patterns are shifting rapidly as buyers migrate from offline markets to e-commerce routes, such as shopping channels on TV and internet shopping malls. In the offline markets consumers go shopping, see the shopping items, and choose from them. Recently consumers tend towards buying at shopping sites free from time and place. However, as e-commerce markets continue to expand, customers are complaining that it is becoming a bigger hassle to shop online. In the online shopping, shoppers have very limited information on the products. The delivered products can be different from what they have wanted. This case results to purchase cancellation. Because these things happen frequently, they are likely to refer to the consumer reviews and companies should be concerned about consumer's voice. E-commerce is a very important marketing tool for suppliers. It can recommend products to customers and connect them directly with suppliers with just a click of a button. The recommender system is being studied in various ways. Some of the more prominent ones include recommendation based on best-seller and demographics, contents filtering, and collaborative filtering. However, these systems all share two weaknesses : they cannot recommend products to consumers on a personal level, and they cannot recommend products to new consumers with no buying history. To fix these problems, we can use the information which has been collected from the questionnaires about their demographics and preference ratings. But, consumers feel these questionnaires are a burden and are unlikely to provide correct information. This study investigates combining collaborative filtering with the centrality of social network analysis. This centrality measure provides the information to infer the preference of new consumers from the shopping history of existing and previous ones. While the past researches had focused on the existing consumers with similar shopping patterns, this study tried to improve the accuracy of recommendation with all shopping information, which included not only similar shopping patterns but also dissimilar ones. Data used in this study, Movie Lens' data, was made by Group Lens research Project Team at University of Minnesota to recommend movies with a collaborative filtering technique. This data was built from the questionnaires of 943 respondents which gave the information on the preference ratings on 1,684 movies. Total data of 100,000 was organized by time, with initial data of 50,000 being existing customers and the latter 50,000 being new customers. The proposed recommender system consists of three systems : [+] group recommender system, [-] group recommender system, and integrated recommender system. [+] group recommender system looks at customers with similar buying patterns as 'neighbors', whereas [-] group recommender system looks at customers with opposite buying patterns as 'contraries'. Integrated recommender system uses both of the aforementioned recommender systems to recommend movies that both recommender systems pick. The study of three systems allows us to find the most suitable recommender system that will optimize accuracy and customer satisfaction. Our analysis showed that integrated recommender system is the best solution among the three systems studied, followed by [-] group recommended system and [+] group recommender system. This result conforms to the intuition that the accuracy of recommendation can be improved using all the relevant information. We provided contour maps and graphs to easily compare the accuracy of each recommender system. Although we saw improvement on accuracy with the integrated recommender system, we must remember that this research is based on static data with no live customers. In other words, consumers did not see the movies actually recommended from the system. Also, this recommendation system may not work well with products other than movies. Thus, it is important to note that recommendation systems need particular calibration for specific product/customer types.

키워드

참고문헌

  1. Aggarwal, C. C., Z. Sun, and P. S. Yu, "Online Algorithms for Finding Profile Association Rules", Proceeding of the Seventh International Conference on Information and Knowledge Management, (1998), 86-95.
  2. Bae, S. H., J. K. Seo, and S. I. Baek, "Exploring Centralities of An Online Community", Knowledge Management Review, Vol.11, No.2(2010), 17-35.
  3. Barnes, J., "Class and Committees in a Norwegian Island Parish", Human Relations, Vol.7(1954), 39-58. https://doi.org/10.1177/001872675400700102
  4. Choi, J. H., J. Y. Xiang, H. S. Moon, I. L. Choi, and J. K. Kim, "Analyzing the User Intention of Booth Recommender System in Smart Exhibition Environment", Journal of Intelligence and Information Systems, Vol.18, No.3 (2012), 153-169.
  5. Gouk, S. Y., "A Study on Location Characteristics of Agricultural Distribution Center Using Social Network Aanlysis", Journal of Rural Development, Vol.30, No.4(2007), 221-235.
  6. Herlocker, J., J. Konstan, A. Borchers, and J. Riedl, "An Algorithm Framework for Performing Collaborative Filtering", Proceedings of the 22nd Annual International ACMSIGIR Conference on Research and Development in Information Retrieval (1999), 230-237.
  7. Kang, B. S., "A Novel Web Recommendation Method for New Customers Using Structural Holes in Social Networks", Journal of Industrial Economics and Business, Vol.23, No.5(2010), 2371-2385.
  8. Kang, B. S., S. J. Yu, and H. K. Hong, "Comparison of Similarity Measures for Performance Improvement of Collaborative Filtering", Journal of the Korean Data Analysis Society, Vol.10, No.5(2008), 2893-2906.
  9. Kim, Y. H., Social Network Theory, Pakyoungsa, Seoul, 2003.
  10. Kohrs, A. and B. Merialdo, "Creating User-adapted Websites by the Use of Collaborative Filtering", Interacting Computers, Vol.13, No.6(2001), 695-716. https://doi.org/10.1016/S0953-5438(01)00038-8
  11. Konstan, J., B. Miller, D. Maltz, J. Herlocker, L. Gordon, and J. Riedl, "GroupLens: Applying Collaborative Filtering to Usenet News", Communication of the ACM, Vol.40, No.3(1997), 77-87. https://doi.org/10.1145/245108.245126
  12. Krulwich, B., "Lifestyle Finder : Intelligent User Profiling Using Large-Scale Demographi Data", Artificial Intelligence Magazine, Vol.18, No.2 (1997), 37-45.
  13. Lee, C. H., Y. H. Kim, and P. K. Rhee, "Web Personalization Expert with Combining Collaborative Filtering and Association Rule Mining Technique", Expert Systems with Applications, Vol.21, No.3(2001), 131-137. https://doi.org/10.1016/S0957-4174(01)00034-3
  14. Lee, J. S. and S. D. Park, "Performance Improvement of a Movie Recommendation System using Genre-wise Collaborative Filtering", Journal of Intelligence and Information Systems, Vol.13, No.4(2007), 65-78.
  15. Lee, J. S. and S. K. Kang, "Collaboration among Stakeholders in Community Tourism Development- Social Network Aanlysis", Journal of Tourism Studies, Vol.22, No.2(2010), 75-97.
  16. Lee, K. H. and C. O. Kim, "Forecast on New Product Diffusion Dynamics : Multi Agent Simulation Considering psychological biases and Dynamic Purchase Threshold", In Proceedings of the 2010 Fall Conference of Korean Institute of Industrial Engineers (2010), 588 -595.
  17. Lee, Y. J., S. H. Lee, and C. J. Wang, "Improvement on Similarity Calculation in Collaborative Filtering Recommendation using Demographic Information", Journal of KIISE, Vol.9, No.5(2003), 521-529.
  18. Limb, S. J. and J. H. Kang, "A Study on Success Factors of Films in Internet VOD Theaters", Journal of Strategic Management, Vol.9, No.1(2006), 53-76.
  19. Park, J. H., Y. H. Cho, and J. K. Kim, "Social Network : A Novel Approach to New Customer Recommendations", Journal of Intelligence and Information Systems, Vol.15, No.1(2009), 123-140.
  20. Queiroz, S. R. de M. and F. de A. T. de Carvalho, "Making Collaborative Group Recommendations Based on Modal Symbolic Data", In Advances in Artificial Intelligence-SBIA 2004(2004), 307-316.
  21. Sarwar, B., G. Karypis, J. Konstan, and J. Riedl, "Analysis of Recommendation Algorithms for E-Commerce", Proceedings of ACM E-commerce 2000 conference, (2000), 158- 167.
  22. Schein, A. I., A. Popescul, L. H. Ungar, and D. M. Pennock, "Methods and Metrics for Cold-Start Recommedations", Proceedings of the 25thAnnual Internatinal ACM SIGIR Conference, (2002), 253-260.
  23. Shardanand, U. and P. Maes, "Social Information Filtering : Algorithms for Automating 'Word of Mouth'", Proceeding of ACM CHI'95 Conference on Human Factors in Computing Systems, (1995), 210-217.
  24. Shin, D. W., A Recommendation Methodology for the New Customer Using Social Network Anaysis, Master's thesis, Kookmin University, 2006.
  25. Sohn, D. W., Social Network Analysis, Kyungmoon Publisher, Seoul, 2002.
  26. Sung, Y. S., J. Y. Park, and E. A. Park, "The Influence of On-line Word of Mouth Information On Viewing Intention toward Motion Picture", Advertising Research, Winter(2002), 31-52.
  27. Yu, K., A. Schwaighofer, V. Tresp, and H. Kriegel, "Probabilistic Memory-based Collaborative Filtering", IEEE Transactions on Knowledge and Data Engineering, Vol.16, No.1 (2004), 56-69. https://doi.org/10.1109/TKDE.2004.1264822
  28. Zeng, W., M. S. Shang and Q. M. Zhang, "Can Dissimilar Users Contribute to Accuracy and Diversity of Personalized Recommendation?", International Journal of Modern Physics C, Vol.21, No.10(2010), 1217-1227. https://doi.org/10.1142/S0129183110015786

피인용 문헌

  1. 네트워크 중심성 척도가 추천 성능에 미치는 영향에 대한 연구 vol.27, pp.1, 2021, https://doi.org/10.13088/jiis.2021.27.1.023