DOI QR코드

DOI QR Code

Recommendation System using Associative Web Document Classification by Word Frequency and α-Cut

단어 빈도와 α-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템

  • 정경용 (상지대학교 컴퓨터정보공학부) ;
  • 하원식 (LG전자 MC사업부 단말연구소)
  • Published : 2008.01.28

Abstract

Although there were some technological developments in improving the collaborative filtering, they have yet to fully reflect the actual relation of the items. In this paper, we propose the recommendation system using associative web document classification by word frequency and ${\alpha}$-cut to address the short comings of the collaborative filtering. The proposed method extracts words from web documents through the morpheme analysis and accumulates the weight of term frequency. It makes associative rules and applies the weight of term frequency to its confidence by using Apriori algorithm. And it calculates the similarity among the words using the hypergraph partition. Lastly, it classifies related web document by using ${\alpha}$-cut and calculates similarity by using adjusted cosine similarity. The results show that the proposed method significantly outperforms the existing methods.

협력적 필터링을 개선하기 위하여 많은 기술들이 개발되고 실용화되었으나 아이템의 연관 관계를 정확하게 반영하지는 못한다. 본 논문에서는 협력적 필터링의 문제점을 보완하기 위하여 단어 빈도와 ${\alpha}$-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템을 제안한다. 제안된 방법은 형태소 분석을 통한 웹문서에서 단어를 추출하고 빈도 가중치를 계산한다. 추출된 단어를 Apriori 알고리즘을 이용해서 연관 규칙을 생성하고 신뢰도에 단어 빈도 가중치를 적용한다. 그리고 연관 규칙 하이퍼그래프 분할을 이용하여 연관 단어간의 유사도를 계산한다. 마지막으로 유사 클래스를 기반으로 연관 웹문서를 ${\alpha}$-cut을 이용하여 분류하고 개선된 코사인 유사도를 이용하여 유사도를 계산한다. 실험 결과 제안한 방법이 기존의 방법들보다 우수함을 확인하였다.

Keywords

References

  1. G. Linden, B. Smith, J. York, "Amazon.com Recommendations: Item-to-Item Collaborative Filtering," Internet Computing, IEEE, Vol.7, No.1, pp.76-80, 2003. https://doi.org/10.1109/MIC.2003.1167344
  2. K. Y. Jung and J. H. Lee, "Prediction of User Preference in Recommendation System using Association User Clustering and Bayesian Estimated Value," LNAI 2557, pp.284-296, Springer-Verlag, 2002.
  3. B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, "Analysis of Recommendation Algorithms for E-Commerce," Proc. of ACM E-Commerce 2000 Conference, pp.158-167, 2000.
  4. P. Melville, R. J. Mooney, and R. Nagarajan, "Content Boosted Collaborative Filtering for Improved Recommendations," Proc. of the Conference on Artificial Intelligence, pp.187-192, 2002.
  5. C. Vladimir and M. Yunqian, "Practical Selection of SVM Parameters and Noise Estimation for SVM Regression," Journal of Neural Networks, Vol.17, pp.113-126, 2004. https://doi.org/10.1016/S0893-6080(03)00169-2
  6. O. Carlos, "Clustering Binary Data Streams with K-Means," Proc. of the Workshop on Research Issues on Data Mining and Knowledge Discovery, pp.10-17, 2003.
  7. http://www.cs.umn.edu/Research/GroupLens/
  8. J. Han and M. Kamber, Data Mining: Concept and Techniques, Morgan Kaufmann, pp.225-333, 2001.
  9. E. Han, G. Karypis, V. Kumar, and B. Mobasher, "Clustering Based On Association Rule Hypergraphs," Proc. of SIGMOD Workshop on Research Issues on Data Mining and Knowledge Discovery, pp.9-13, 1997.
  10. J. L. Herlocker, J. A. Konstan, L. G. Terveen, and J. T. Riedl, "Evaluating Collaborative Filtering Recommender Systems," ACM Transactions on Information Systems, Vol.22, No.1, pp.5-53, 2004. https://doi.org/10.1145/963770.963772
  11. S. J. Ko, J. H. Lee, "User Preference Mining through Collaborative Filtering and Content Based Filtering in Recommender System," LNCS 2455, pp.244-253, Springer-Verlag, 2002.
  12. 하원식, 정경용, 이정현, "협력적 필터링을 위해 연관 단어 빈도를 이용한 웹문서 분류", 제31회 한국정보과학회 추계학술발표 논문집(I), pp.160-162, 2004.
  13. 정영미, 정보검색론, 구미무역 출판부, pp.182-293, 2003.