한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
- /
- Pages.424-429
- /
- 1996
- /
- 2005-3053(pISSN)
구문적 유사도와 의미적 유사도를 이용한 하이퍼텍스트 자동생성에 관한 연구
The Study of Automatic Hypertext Generation using the Syntactic and Semantic Similarity
- Kim, Mun-Seok (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University) ;
- Nam, Se-Jin (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University) ;
- Shin, Dong-Wook (Information Retrieval Lab, Dept. of Computer Engineering, Chungnam National University)
- 발행 : 1996.10.11
초록
본 논문에는 일반문서를 대상으로 하여 그 문사를 하이퍼텍스트(hypertext)로 자동변환하는 기법을 제안하고자 한다. 자동변환의 과정은 대상 문서에서 키워드(keyword)의 인식, 문서를 노드(node) 단위로 분리, 키워드로부터 노드로의 링크(ink) 생성의 3 단계로 이루어 진다. 기존의 연구에서는 문서에서 노드를 분리하는데 구문적 유사도만을 이용하는데, 본 논문에서는 양질의 하이퍼텍스트를 생성하기 위하여 구문적 유사도(syntactic similarity)뿐만 아니라 의미적 유사도(semantic similarity)를 사용한다. 구문적 유사도는 tf*idf와 벡터 곱(vector product)을 이용하고, 의미적 유사도는 시소러스(thesaurus)와 부분부합(partial match)을 이용하여 계산되어 진다. 또 링크 생성시 잘못된 링크의 생성을 막기 위하여 시소러스를 이용하여 시소러스에 존재하는 용어에 한해서 링크를 생성한다.
키워드