Search | Korea Science

Text Chunking by Rule and Lexical Information (규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking))

김미영;강신재;이종혁
- Proceedings of the Korean Society for Cognitive Science Conference
- /
- 2000.06a
- /
- pp.103-109
- /
- 2000
본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다. 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.
PDF

word-sense Disambiguation based on Semantic Informations extracted from Definitions in Dictonary (사전 뜻말이에서 추출한 의미 정보에 기반한 의미 중의성 해결)

Hur, Jeong;Ock, Cheol-Young
- Proceedings of the Korean Society for Cognitive Science Conference
- /
- 2000.06a
- /
- pp.269-276
- /
- 2000
본 연구에서는 사전의 뜻말이에서 의미 정보를 추출하고, 이 의미 정보를 확률 통계적 방법에 적용하여 의미 중의성을 해결하는 모델을 제안한다. 사전의 뜻풀이말에 동형이의어를 포함하고 있는 표제어와 뜻풀이말을 구성하는 보통 명사, 형용사와 동사를 의미 정보로 추출한다. 비교적 중의성이 자주 발생하는 9개의 동형이의어 명사를 대상으로 실험하였다. 학습에 이용된 데이터로 정확률을 실험하는 내부 실험의 결과, 체언류(보통 명사)와 용언류(동사, 형용사)의 가중치를 0.9/0.1로 주는 것이 가장 정확률이 높았다. 외부 실험은 국어 정보베이스와 ETRI 코퍼스를 이용하여 1,796문장을 실험하였는데, 평균 79.73%의 정확률을 보였다.
PDF

Resolving structural ambiguity of Chinese V＋NP$_1$＋的＋NP$_2$syntactic pattern (중국어 V＋NPl＋的＋NP2 구문 패턴의 애매성 해소)

Cui, Zheng;Kim, Mi-Young;Kim, Dong-Il;Lee, Jong-Hyuk
- Proceedings of the Korean Information Science Society Conference
- /
- 2002.10d
- /
- pp.667-669
- /
- 2002
중국어 V＋NP$_1$＋的＋NP$_2$형 패턴은 동사구와 명사구로 분석이 가능하여 중국어 구문분석의 결과에 중요한 영향을 미친다. 본 논문은 중국어 V＋NP$_1$＋的＋NP$_2$형 패턴의 구조적 중의성 문제를 해결하기 위한 방법을 제안한다. 제안하는 방법은 통계정보로 보완된 동사의 결합가 정보, 두 명사간의 결합도 정보 및 휴리스틱으로 구조적 애매성을 해소하고자 한다.
PDF

A Study on Generation of Social Network for Movie Tastes based on Emotional Verb Selections (감정동사 선택을 통한 영화취향 기반의 소셜 네트워크 구축에 관한 연구)

Song, Min-A;NamGung, Hyeon;Kim, Hong-Gi;Yun, Ju-Hyeon
- Proceedings of the Korean Society for Emotion and Sensibility Conference
- /
- 2008.10a
- /
- pp.94-97
- /
- 2008
CD Now, Video Recommender, Amazon 등과 같은 현재의 협업 기반 필터링 서비스는 일반적으로 서비스를 요구하는 사용자가 관심을 가진 아이템과 비슷한 속성의 아이템을 추천하고 있다. 하지만 영화와 같은 경우 사용자의 주관적 평가가 배제된-명시적 속성만으로는 아이템의 특징을 표현하는데 한계가 있다. 때문에 이를 이용한 방법은 서비스를 제공하는 데 있어 제한을 가지게 된다. 따라서 본 논문에서는 소셜 네트워크 서비스 사용자가 영화에 대한 자신의 감정을 간단한 선택을 통해 표현함으로써 쉽고 편하게 사용자의 영화 취향을 도출하고 이를 기반한 소셜 네트워크를 형성하는 방법에 대해 논의해 보고자 한다. 이러한 방법을 통해 일반적으로 사용되는 빈도나 인기도 기반의 추천이 아닌 실제 사용자와 유사한 취향과 특성을 가지는 사용자들은 연결해줌으로써 보다 사용자에 특화된 추천을 가능하게 할 것이다.
PDF

Study on Automatic Construction and Evaluation method of Caseframe (격틀 자동구축과 격틀평가 방법에 관한 연구)

Choi, Yong-Seok;Lee, Ju-Ho;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 1999.10e
- /
- pp.272-279
- /
- 1999
격틀이란 동사에 대해 필요한 격들과 그 격에 알맞은 단어집합으로 이루어져 있는 것으로 명사와 동사의 의미적 호응을 표현한다. 격틀은 자연언어처리분야에서 주요한 정보로 사용할 수 있다. 의미구분이라든지 번역에서 한국어 생성, 정보검색에서 중요정보 추출 등 잘 구성한 질 높은 격틀은 여러 연구의 질을 높여줄 수 있다. 따라서, 질 좋은 격틀을 구성하기 위한 여러 노력들이 현재 이루어지고 있다. 본 논문에서는 기계 가독형 사전과 말모듬을 이용해서 자동으로 격틀을 구성한다. 자동구성 방법으로 먼저 기계가독형 사전을 이용해서 상위개념 정보를 가지는 분류정보를 구성한다. 말모듬과 사전의 예문들을 형태소 분석한 후에 각각의 예문들을 분류정보를 이용하여 최상위 개념으로 바꾼다. 그리고, 말모듬과 사전의 예문에서 나온 정보들을 통합하므로 해서 자동으로 격틀을 구성한다. 자동으로 격틀을 구성한 후에 수동으로 구성한 격틀과 비교해 본다. 비교하기 위한 평가방법에 대해서 논의한다.
PDF

A Study on Corpusgram Experiment and Development (코퍼스그람 실험과 개발에 대한 연구)

Lee, Ho Suk
- Annual Conference on Human and Language Technology
- /
- 2007.10a
- /
- pp.145-149
- /
- 2007
코퍼스그람에서 실험이 필요한 부분은, 첫 번째는 변수 d와 dust의 정의 부분이다. 즉, 변수 d만을 이용한 경우, 변수 dist만을 이용한 경우, 그리고 변수 d와 dist를 모두 이용한 경우를 실험해 보아야 한다. 두 번째는 코퍼스그람에서 거리가 가까운 단어들의 조합, 예를 들어 명사와 명사, 동사와 명사, 형용사와 명사, 동사와 부사를, 조사하여 그 의미를 해석하여 보는 것이다. 세 번째로는 코퍼스그람의 단어들에 대하여 거리를 중심으로 단어 연결(connection) 네트워크를 구성하고 의미 네트워크와 비교하여 보는 것이다. 네 번째로는 연결 네트워크를 정보 검색 등의 응용에 적용하여 효과를 확인하는 것이다. 그리고 언어 처리, 온톨로지 등에 중요한 요소인 부분-전체 관계에 대하여 소개하였다.
PDF

Korean Parsing using Sejong Dictionary (세종전자사전을 활용한 한국어 구문분석)

Seong, Yeolwon
- Annual Conference on Human and Language Technology
- /
- 2007.10a
- /
- pp.261-268
- /
- 2007
본 논문에서는 세종전자사전의 정보를 활용하여 논항 결합의 정확도를 향상시키는 한국어 구문분석 모델을 제안한다. 구문분석 과정에서 노드간의 결합 가능성을 계산할 때, 세종전자사전 동사사전의 격틀 정보, 논항 제약 정보와 명사사전의 의미부류 정보를 활용하여 가산점을 부여하여 사전의 내용과 일치하는 결합이 선호되도록 하였다. 이 과정에서 구조적 오류를 해결할 수 있었고, 결합에 참여하는 동사와 명사의 의미 중의성도 해소할 수 있었다. 평균 13어절 길이의 실험용 문장 50개를 대상으로 실험한 결과, 35% 정도의 오류 감소 효과를 볼 수 있었다. 또한 구문분석 결과 정보를, 전자 사전에 기술된 정보의 완결성을 시험하고 보완하는 데에도 활용하였다.
PDF

The Acoustic Realization of Phrasal Verb vs. Verb-preposition (구절 동사와 전치사 수반동사의 의미에 따른 음성적 실현)

Kim, Hee-Sung;Song, Ji-Yeon;Kim, Kee-Ho
- MALSORI
- /
- no.63
- /
- pp.67-84
- /
- 2007
Verb phrase could have two different meanings according to which is followed after verb; adverb or preposition. The meaning of 'verb+adverb' is deduced from a figurative meaning which is idiomatic expression, and 'verb+preposition' is interpreted as the literal meaning. The purpose of this study is to observe how English native speakers and Korean leaners of English distinguish two sentences of the same word strings with acoustic cues like pause and duration. According to the result, as pause was used for meaning distinction, it was likely that the pause length preceding prepositions was longer than that of following adverbs. To distinguish two sentences of the same word strings, all participants seemed to use pause, verb lengthening and adverb/preposition lengthening. Among them, there is a hierarchical significance; in sequence, pause, verb lengthening, adverb/preposition lengthening.
PDF

A recognition algorithm of Korean verb and noun idiomatic phrases (한국어 동사와 명사 관용구 인식 알고리즘)

Lee, Ho Suk
- Annual Conference on Human and Language Technology
- /
- 2009.10a
- /
- pp.170-175
- /
- 2009
본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.
PDF

Automatic Extraction of Collocations based on Corpus using mutual information (말뭉치에 기반한 상호정보를 이용한 연어의 자동 추출)

Lee, Ho-Suk
- The Transactions of the Korea Information Processing Society
- /
- v.1 no.4
- /
- pp.461-468
- /
- 1994
This paper describes the automatic extraction of collocations based on corpus. The collocations are extracted from corpus using cooccurrence frequency and mutual information between words. In English, 5 types of collocations are defined. These collocations are transitive verb and object, intransitive verb and subject, adjective and noun, verb and adverb, and adverb and adjective. In this paper another type of collocation is recognized and extracted, which consists of verb and preposition. So 6 types of collocations are extracted based on corpus.
PDF

Search Result 664, Processing Time 0.028 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)