Extraction Algorithm of Field-Associated Terms for Korean Document Classification

;;;

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

2003.10a
/
Pages.544-546
/
2003
/
1598-5164(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

Extraction Algorithm of Field-Associated Terms for Korean Document Classification

한글문서 분류용 분야연상어의 추출 알고리즘

김숙영 (전주대학교 정보산업 대학원) ;
최창원 (전주대학교 정보기술컴퓨터공학부) ;
이상곤 (전주대학교 정보산업 대학원)

Published : 2003.10.01

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

인간은 문서에서 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서전체를 대상으로 하지 않고 부분적인 덱스트에서 출현하는 소수의 단어정보에서 문서의 분야를 정확히 결정하기 위해 분야연상어의 구축은 중요한 연구과제이다. 인간이 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집하고, 수집문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시정을 고려하여 분야연상어의 수준과 안정성랭크에 대하여 논의한다. 학습데이터에서 분야연상어 후보의 각 수준을 자동으로 결정하고, 컴퓨터가 제시하는 분야연상어의 수준, 안정성랭크, 집중률, 빈도정보를 이용하여 단일어로 된 분야연상어를 추출하는 방법을 제안한다.

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

Extraction Algorithm of Field-Associated Terms for Korean Document Classification

한글문서 분류용 분야연상어의 추출 알고리즘

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)