Weight Assignments on Keyfacts for Enhancing Precision in Information Retrieval

정보검색에서 정확률의 향상을 위한 키팩트의 가중치 부여

  • Published : 2000.12.01

Abstract

정보검색에서 궁극적으로 지향하는 바는 질의에 대한 정확률과 재현률을 동시에 높이는 것이다. 이 논문에서는 [중심어, 종속어]로 이루어지는 키팩트를 그 유형에 따라 9가지 형태로 분류하였으며. 이 유형들의 주요도를 반영하여 키팩트의 가중치를 계산하는 방법을 개발하였다. 키팩트 유형들에 주요도 값들을 할당한 방법을 검증하기 위한 실험은 질의문들을 이용하여 평균 재현률을 계산함으로써 수행되었다. 9개의 키팩트 타입에 9가지의 주요도 값을 할당하는 방법을 실험하였고 그 결과를 분석하였다. 이 논문의 결과는 기존의 키워드 기반 정보검색에서 문제시되고 있는 정확률을 키팩트 기반 정보 검색에서 향상할 수 있는 가능성을 시사하고 있다.

Keywords

References

  1. 한국전자 통신 연구원, 내용기반 멀티미디어 정보검색 기술 개발의 “의미정보 기반 검색 시스템 개발” (15 - 125), 정보통신부, 12월, 1997
  2. Salton, G., Automatic Text Processing : The Transformation, Analysis, and Retrieval of Information by Computer, Addison-Wesley Publishing Company, 1989
  3. 박영찬, 최기선, '통계적 명사패턴 분류를 이용한 복합명사 검색 모델', 제 8회 한글 및 한국어 정보처리 학술발표 논문집, 1996
  4. 이현아, 이종혁, 이근배, '구분분석과 공기정보를 이용한개념기반 명사구 색인방법', 제 7회 한글 및 한국어정보처리 학술대회 논문집, 1996
  5. 강승식, 음절 정보와 복수어 단위 정보를 이용한 한국어형태소 분석, 서울대학교 공학박사 학위논문, 1993
  6. Yasushi OGAWA, Ayako BESSHO, Masako HIROSE. 'Simple Word Strings as Compound Keywords: An Indexing and Ranking Method for Japanese Texts.', Proceedings of the sixteenth annual international ACM SIGIR conference on Research an Development in Information Retrieval, 1993 https://doi.org/10.1145/160688.160726
  7. 김판구, 조유근, '상호 정보에 기반한 한국어 텍스트의 복합어 자동색인', 한국정보과학회논문지, 제21권, 제7호, 1994
  8. 윤준태, 송만석, '한국어의 대등접속구문 분석', 정보과학회논문지(B), 제24권, 제3호, 1997
  9. 이현아, 이종혁, 이근배, '단문 분할을 통한 명사구 색인 방법', 정보과학회논문지(B), 제24권, 제3호, 1997
  10. 한국전자 통신 연구원, 내용기반 멀티미디어 정보검색기술 개발의 '내용기반 멀티미디어 정보검색 기술 개발' (3 - 7), 정보통신부, 12월, 1997
  11. Stephen Prata, C++ Primer Plus second edition, Waite Group Press, 1995
  12. 이경호, 파일처리론, 정익사, 1997
  13. 김수희, 박세영, '대규모의 정보검색을 위한 효율적인 최소 완전 해시함수의 생성', 한국정보처리학회 논문지, 제5권, 제9호, 1998
  14. 계몽사 편집부, 계몽사 학생백과사전 CD, 계몽사, 1991