DOI QR코드

DOI QR Code

웹 사용자 누적 사용정보 기반의 키워드 검색 모델

A Keyword Search Model based on the Collected Information of Web Users

  • 윤성희 (상명대학교 컴퓨터소프트웨어공학과)
  • 투고 : 2012.05.31
  • 심사 : 2012.08.09
  • 발행 : 2012.08.31

초록

본 논문은 웹 검색 시스템의 사용자 질의에 대한 키워드 색인 기반의 검색 과정에서 적합 문서를 선별하기 위해 검색 키워드의 의미정보와 사용자의 누적 사용정보를 사용하여 검색 성능을 향상시키는 방법을 소개한다. 검색 키워드 의미 정보를 이용하는 검색 방법은 검색 결과로서 의미적으로 무관한 많은 문서들을 배제할 수 있고, 사용자의 누적된 사용정보는 관심사에 중심을 둔 검색문서들을 상위에 제시할 수 있다. 검색 키워드의 의미정보 지식베이스를 구축하고, 검색 문서들을 색인어와 해당 의미범주로 분류하며, 사용자의 정답 문서 참조 행위에 대한 누적 정보를 순위 결정에 반영하여 검색 성능을 향상시킬 수 있다.

This paper proposes a technique for improving performance using word senses and user feedback in web information retrieval, compared with the retrieval based on ambiguous user query and index. Disambiguation using query word senses can eliminating the irrelevant pages from the search result. According to semantic categories of nouns which are used as index for retrieval, we build the word sense knowledge-base and categorize the web pages. It can improve the precision of retrieval system with user feedback deciding the query sense and information seeking behavior to pages.

키워드

참고문헌

  1. 김성진, "이용자 중심 웹 정보탐색 연구의 실체 이론 분석", 정보관리학회지, 23권, 3호. pp. 127-146, 2006.
  2. 박건우, 이상훈, "질의어 패턴 자동분석을 통한 커뮤니티 기반 개인화 검색," 한국정보과학회 논문지 D, 36권, 04호, pp. 321-326, 2009.
  3. 김태환, 전호철, 최중민, "페이지 랭크지수와 질의 확장을 이용한 재랭킹 방법", 한국정보처리학회 논문지, 18-B권, 04호. pp. 231-240, 2011.
  4. 윤태복, 이승훈, 윤광호, 이지형, "웹 사용 정보에 기반한 다중 성향 키워드 모델의 설계와 응용," 한국인터넷정보학회논문지, 10권, 05호, pp. 95-105, 2009.
  5. 김분희, "사용성 개선을 위한 P2P 그룹 검색 알고리즘", 한국전자통신학회논문지, 5권, 2호, pp. 185-192, 2010.
  6. 김분희, "전처리 검색 기반의 P2P 그룹 검색 알고리즘", 한국전자통신학회논문지, 5권, 5호, pp. 522-527, 2010.
  7. 김광백, 우영운, "HSI 컬러 공간과 신경망을 이용한 내용기반 이미지 검색", 한국전자통신학회 논문지, 5권, 2호, pp. 152-157, 2010.
  8. 박상규, 이찬규, 윤경현, 김성희, 이준호, 2007, "검색엔진에서 질의어 분포의 정상성에 관한 연구", 한국정보관리학회지, 24권, 4호. pp. 255-265, 2007.
  9. Moldova D. and Mihalcea R., "Using WordNet and Lexical Operators to improve Internet Searches," IEEE Internet Computing, Vol. 4, No. 1. pp. 36-43, 2000.
  10. 강현규, "개념 검색어 대체를 통해 질의 형식화를 도와주는 개념 마법사의 설계 및 구현". 정보처리학회논문지, 9-B권, 04호, pp. 437-444. 2002.
  11. Perez-Carballo Jose and Strazalkowski Tomek. "Natural Language Information Retrieval : progress report." Information Processing & Management, Vol. 36, No. 1, pp. 155-178, 2000. https://doi.org/10.1016/S0306-4573(99)00049-7
  12. 윤성희, 장혜진,"검색엔진의 정확률 향상을 위한 질의어 의미와 사용자 반응 정보의 이용", 정보관리학회지, 26권, 4호. pp. 81-92, 2009.
  13. 이용구, 정영미, 사전 정보를 이용한 단어 중의성 해소 모형에 관한 실험적 연구", 한국정보관리학회지, 24권, 1호. pp. 321-342, 2007.
  14. TREC