The Study of Automatic Hypertext Generation using the Syntactic and Semantic Similarity

구문적 유사도와 의미적 유사도를 이용한 하이퍼텍스트 자동생성에 관한 연구

  • Kim, Mun-Seok (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University) ;
  • Nam, Se-Jin (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University) ;
  • Shin, Dong-Wook (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University)
  • 김문석 (충남대학교 컴퓨터공학과 정보검색 연구실) ;
  • 남세진 (충남대학교 컴퓨터공학과 정보검색 연구실) ;
  • 신동욱 (충남대학교 컴퓨터공학과 정보검색 연구실)
  • Published : 1996.10.11

Abstract

본 논문에는 일반문서를 대상으로 하여 그 문사를 하이퍼텍스트(hypertext)로 자동변환하는 기법을 제안하고자 한다. 자동변환의 과정은 대상 문서에서 키워드(keyword)의 인식, 문서를 노드(node) 단위로 분리, 키워드로부터 노드로의 링크(ink) 생성의 3 단계로 이루어 진다. 기존의 연구에서는 문서에서 노드를 분리하는데 구문적 유사도만을 이용하는데, 본 논문에서는 양질의 하이퍼텍스트를 생성하기 위하여 구문적 유사도(syntactic similarity)뿐만 아니라 의미적 유사도(semantic similarity)를 사용한다. 구문적 유사도는 tf*idf와 벡터 곱(vector product)을 이용하고, 의미적 유사도는 시소러스(thesaurus)와 부분부합(partial match)을 이용하여 계산되어 진다. 또 링크 생성시 잘못된 링크의 생성을 막기 위하여 시소러스를 이용하여 시소러스에 존재하는 용어에 한해서 링크를 생성한다.

Keywords