Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2007.10a
- /
- Pages.241-249
- /
- 2007
- /
- 2005-3053(pISSN)
Studies on the linguistic properties of the IT-People documents for an efficient Information Retrieval
IT 인물 관련 텍스트 정보의 효율적인 검색을 위한 Sub-language의 속성 연구
- Koh, Seung-Hui (Hankuk University of Foreign Studies) ;
- Kim, So-Yeon (Hankuk University of Foreign Studies) ;
- Cheon, Seung-Mi (Hankuk University of Foreign Studies) ;
- Nam, Jee-Sun (Hankuk University of Foreign Studies) ;
- Kim, Kweon-Yang (Kyungil University) ;
- Park, Se-Young (Kyungpook University) ;
- Berlocher, Ivan (Saltlux Inc.)
- 고승희 (DICORA, 한국외국어대학교) ;
- 김소연 (DICORA, 한국외국어대학교) ;
- 천승미 (DICORA, 한국외국어대학교) ;
- 남지순 (DICORA, 한국외국어대학교) ;
- 김권양 (경일대학교) ;
- 박세영 (경북대학교) ;
- Published : 2007.10.12
Abstract
본 연구는 IT 인물 관련 텍스트 정보의 효율적인 검색을 위하여 문서 내에서 인물과 관련된 정보를 담고 있는 문장들이 어떠한 특징을 가지고 실현되는가를 살펴보고 언어적 속성을 어떻게 구조화하고 형식화할 것인가를 논의하는 것을 목적으로 한다. 언어적 속성 분석을 위해서 전자신문 내에서 인물 관련 코퍼스를 수집하고 이들의 분석을 통해 다음과 같이 문제가 되는 특징들을 확인하였다. 즉 외래어 음차 표기문제, 복합명사 및 명사구 그리고 서술 명사적 표현의 문제 등으로 요약된다. IT라는 특정 영역에 대해 텍스트 내에서의 어휘-통사적 패턴을 분석하고 언어적 특징에 대한 효율적 기술을 위해서는 LGG 부분 문법 그래프 모델을 활용하도록 한다. 본 연구는 특정 영역인 IT 관련 문서에서 자연언어 텍스트를 대상으로 정보 검색할 때 문제가 되는 다양한 언어학적 현상들을 다루며, 향후보다 확장된 영역에서의 효율적 언어 처리에 대한 방법론적 대안을 제시할 수 있을 것으로 기대된다.
Keywords