A Web Contents Ranking Algorithm using Bookmarks and Tag Information on Social Bookmarking System

소셜 북마킹 시스템에서의 북마크와 태그 정보를 활용한 웹 콘텐츠 랭킹 알고리즘

  • Received : 2009.12.17
  • Accepted : 2010.06.04
  • Published : 2010.08.31

Abstract

In current Web 2.0 environment, one of the most core technology is social bookmarking which users put tags and bookmarks to their interesting Web pages. The main purpose of social bookmarking is an effective information service by use of retrieval, grouping and share based on user's bookmark information and tagging result of their interesting Web pages. But, current social bookmarking system uses the number of bookmarks and tag information separately in information retrieval, where the number of bookmarks stand for user's degree of interest on Web contents, information retrieval, and classification serve the purpose of tag information. Because of above reason, social bookmarking system does not utilize effectively the bookmark information and tagging result. This paper proposes a Web contents ranking algorithm combining bookmarks and tag information, based on preceding research on associative tag extraction by tag clustering. Moreover, we conduct a performance evaluation comparing with existing retrieval methodology for efficiency analysis of our proposed algorithm. As the result, social bookmarking system utilizing bookmark with tag, key point of our research, deduces a effective retrieval results compare with existing systems.

현재 웹 2.0 환경에서의 핵심 기술 중 하나는 사용자가 관심 있는 웹페이지를 태깅 및 북마킹 하는 소셜 북마킹 기술이다. 소셜 북마킹은 웹 콘텐츠에 태깅된 북마크 정보 및 태깅 결과를 기반으로 검색, 분류, 공유를 통해 효율적인 정보 제공을 주목적으로 하고 있다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하는 방식을 사용하고 있다. 이는 소셜 북마킹 시스템에서 중요한 특징을 가지는 북마크와 태깅 기술을 효율적으로 활용하지 못하는 결과가 된다. 이에 본 연구에서는 태그 클러스터링을 통한 연관 태그 추출에 관한 선행연구를 기반으로, 북마크 정보와 혼합하기 위한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론들과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 북마크와 태그 정보를 함께 활용한 소셜 북마크 시스템이 기존 시스템보다 효율적인 검색결과를 도출하였다.

Keywords

References

  1. 정부연, "2006년 인터넷 화두 웹 2.0(Web2.0)," 기술동향, 2006.
  2. Farooq U., Yang Song, Carroll J.M., and Giles C.L., "Social Bookmarking for Scholarly Digital Libraries," Internet Computing, IEEE, Nov.-Dec. 2007.
  3. http://delicious.com/
  4. http://www.bibsonomy.org/
  5. http://mar.gar.in
  6. 이시화, 무효려, 이만형, 황대훈, "web2.0 환경에서의 Tag Clustering 시스템 설계 및 구현," 한국멀티미디어학회, Vol.10, No.1, pp.251-254, 2007.
  7. 이시화, 이만형, 황대훈, "web2.0에서의 Tag Clustering을 통한 이미지 검색의 효율성 분석," 한국멀티미디어학회, Vol. 10, No.2, 2007.
  8. S. Brin and L. Page, "The Anatomy of a Largescale Hypertextual Web Search Engine," In Proceedings of 7th International World Wide Web Conference, Computer Networks and ISDN Systems, Vol.20, No.1-7, pp.107-117, Apr.,1998.
  9. J M. Kleinberg, "Authoritative sources in hyperlinked environment," Journal of the ACM, Vol.46, No.5, pp.604-632, Sep, 1999. https://doi.org/10.1145/324133.324140
  10. E. Adar, L.Zhang, L.Adamic, and R. Lucose, "Implicit Structure and the Dynamics of Blogspace," Workshop on the Weblogging Ecosystem : Aggregation, Analysis and Dynamics, 2004.
  11. A. Turpin and F. Scholer, "User performance versus precision measures for simple search tasks," in Proceedings of the 29th Annual international ACM SIGIR Conference on Research and Development in information Retrieval (Seattle, Washington, USA, August 06-11, 2006). SIGIR '06. ACM, New York, NY, 11-18.
  12. W. Bruce Croft, Donald Metzler, and Trevor Strohman, Search Engines: Information Retrieval in Practice, 2009.
  13. Kalervo Jarvelin and Jaana Kekalainen, "Cumulated gain-based evaluation of IR techniques," ACM Transactions on Information Systems (TOIS), v.20 n.4, p.422-446, October 2002. https://doi.org/10.1145/582415.582418
  14. K. Jarvelin and J. Kekalainen, "IR evaluation methods for retrieving highly relevant documnets," In Proceedings of the ACM conference on Research and Development on Information Retrieval (SIGIR), pp.41-48, 2000.