YDK : A Thesaurus Developing System for Korean Language

한국어 통합정보사전 시스템

  • 황도삼 (영남대학교 전자정보공학부) ;
  • 최기선 (한국과학기술원 전문용어언어공학연구센터)
  • Published : 2000.09.01

Abstract

Dictionaries are indispensable for NLP(natural language processing) systems. Sophisticated algorithms in the NLP systems can be fully appreciated only with matching dictionaries that are built systematically based on computational linguistics. Only few dictionaries are developed for natural language processing. Available dictionaries are far from complete specifications for practical uses. So, it is necessary to develop an integrated information dictionary that includes useful lexical information for processing and understanding natural languages such as morphology and syntactic and semantic information. In this paper, we propose a method to build an integrated dictionary, and introduce a dictionary developing system.

사전은 각종 자연언어처리 시스템에 있어서 고도의 언어처리 및 성능향상을 위한 필수 요소이며, 아무리 좋은 언어처리 도구와 알고리즘이라도 계산언어학에 근거한 양질의 체계적인 전자사전이 없는 한 이의 실용화는 불가능하다. 기존의 출판된 일반 사전은 자연언어처리 및 이해를 목적으로 하여 개발된 사전이 아니다. 또한, 자연언어처리 도구 및 응용시스템을 위해 개발된 사전은 각 시스템의 목적에 따라 각기 다른 체계에 의해 구축되어 있기 때문에 이용하는데 있어서 비효율적인 점이 있다. 따라서, 고도의 언어처리 및 이해를 목적으로 한 체계적이고 과학적인 방법론을 이용하여 형태소 구문 의미정보등 각종 정보가 통합된 통합정보사전의 개발이 필요하다. 본 논문에서는 통합정보사전을 구축하기 위한 방법론을 제시하고, 이에 근거하여 개발한 통합정보사전 개발 시스템을 제시한다.

Keywords

References

  1. 황도삼 외 4, , '심층국어정보처리 품질관리체계', 한국과학기술원, 위탁과제 최종보고서, 1998
  2. 이재성 외 3,'텍스트 및 전자사전 관리시스템의 설계' 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996
  3. 최병진 외 3, '표준화를 위한 일반사전의 논리 구조', 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집,pp.415-423, 1996
  4. 한국과학기술원, '텍스트코퍼스 및 전자사전 관리 시스템(TDMS)', 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996
  5. 오롬테크, '국어정보처리기술 개발-사전및텍스트 관리 통합시스템 개발' 한국과학기술원 위탁과제, 제2차년도 최종보고서, pp3-4, 1996
  6. 황도삼 외2, '자연언어처리', 홍릉과학출판사, 1998
  7. 技術????, '計算機用日本語動詞辦典IPAL(Ba-sic Verbs)', 일본 정보처리 진흥사업협회, 1987년 3월
  8. 技術技術????, '計算機用日本語動詞辦典 IPAL(Ba-sic Adjectives)', 일본 정보처리 진흥사업협회, 1990년 7월
  9. 부산대학교, '한국어 문장 분석을 위한 용언의 하위범주화에 관한 연구', 시스템공학연구소 최종보고서, 1997
  10. 大野不, 竝書爭人, '角川 類語新辭典', 角川書店, 1980
  11. 巖波書店, '日本語語彙大系', 日本電信電話妹式會社, 1997