The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools

Ahn, Sung-Min;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2010.10a
/
Pages.162-165
/
2010
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools

통계 기법을 이용한 연어 추출 모형 연구

Ahn, Sung-Min (Chung-Nam University)

안성민 (충남대학교)

Published : 2010.10.08

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

공기하여 나타나는 구 정보 중에서 언어에 대한 연구는 응용 언어학에 발전에 기여할 수 있는 부분이 크다. 연어란 어휘들 간의 제한된 결합 관계를 갖는 공기 확률이 높은 구 구성이다. 이러한 연어 구성에 대한 연구는 특히 기계 번역이나 사전 편찬 등의 분야에서 관심이 높아지고 있다. 본 연구에서는 언어를 추출하기 위해 T-test와 상호 정보, 조건 확률 등의 여러 통계 기법의 사용을 제시한다. 각 기법을 적용하였을 때 연어 추출에 어떠한 변화를 보이는지 조사하였고, 가장 적절한 기법의 적용도 모색함으로써 향후 언어 추출의 방향을 제시하고자 한다.

Keywords

T-test

연어;
상호 정보;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools

통계 기법을 이용한 연어 추출 모형 연구

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)