• Title/Summary/Keyword: 동사

Search Result 663, Processing Time 0.024 seconds

Post-processor of Parsing Results Using Case Frames (한국어 동사의 격틀 정보를 이용한 구문분석 후처리기)

  • Jeon, Eun-Hee;Lee, Song-Wook;Seo, Jeon-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.445-449
    • /
    • 2001
  • 언어를 컴퓨터로 처리하기 위한 방법으로 격문법(Case Grammar)을 사용하는 것이 있다. 격문법은 동사에 대한 격틀(Case Frame)을 기술함으로써 그 동사와 의미적으로 관계를 가지는 명사들에 대해 표현하는 것이다. 따라서 이러한 격 문법을 사용하기 위해서는 동사에 대한 격틀을 기술하는 것이 필수 과제이다. 본 연구에서는 동사에 대한 격틀을 기술하기 위해서 말뭉치에서 직접 사용된 명사-조사 쌍과 동사를 추출하여 이들의 격관계를 결정하고 이 자료들을 모두 동사의 격틀 정보로 사용하였다 이렇게 구축된 격틀 자료를 구문분석의 후처리 단계에 적용하여 구문분석 결과 잘못된 명사-조사 쌍 의존관계를 수정하였다.

  • PDF

Design of Verb-Phrase Patterns for Korean-to-English MT (한영 자동 번역을 위한 동사구 번역패턴의 활용)

  • 양성일;김영길;서영애;김창현;홍문표;최승권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.178-180
    • /
    • 2001
  • 원시언어 문장의 구조 분석을 기반으로 하는 기계번역 시스템에서 원시언어의 최소 의미 단위는 동사를 중심으로 한 단문으로 생각할 수 있다. 단문 단위 대역어를 지정하기 위해서는 동사구 번역패턴의 사용이 요구된다. 본 논문에서는 한국어 단문 내 격 정보와 번역을 위한 의미 제약조건을 기술하여 한영 기계번역 시스템에서 사용하는 동사구 번역패턴을 정의하고, 문장 정규화를 통한 동사구 번역패턴의 활용방법을 제안한다. 동사구 번역패턴은 단문 구조 파악을 위한 제약 조건부와 대역어 선정부로 나뉜다. 제약 조건부는 단문 구조 번역을 위한 최소한의 의미 제약만으로 기술되며, 격조사로 구분되는 격 정보를 갖는다. 이러한 격 정보는 원시언어인 한국어의 단문 분석을 위해 사용되며 분석결과에 대해 단문 단위 대역어를 지정한다. 동사구 번역 패턴은 실제 말뭉치에서의 사용을 반영하기 위해 병렬 말뭉치로부터 구축되며 실험을 통해 예측되는 패턴의 규모를 알아볼 수 있다.

  • PDF

A Study on Translation of 'Hata' Verb Based on Relation between 'X-hata' and 'X-lul hata' (`X하다`와 'X를 하다'의 상관성에 기반한 한중 자동 번역 시스템에서의 '하다' 동사 번역에 관한 연구)

  • Seo, Young-Ae;Huang, Yinxia;Hong, Mu-Xyo;Choi, Sung-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.607-610
    • /
    • 2002
  • 패턴에 기반한 자동번역 시스템에 있어서, 번역률을 결정하는 가장 중요한 요소는 패턴의 양과 질이다. 필요한 대량의 패턴을 단기에 구축하기 위해서 패턴 정보 기술상의 잉여성을 줄일 필요가 있다. '하다' 동사는 한국어에서 가장 빈번하게 사용되는 동사 중의 하나로서, 'X를 하다'와 'X하다'의 2가지 구문 구조를 갖는다. 본 논문에서는 동사구 패턴에 기반한 한중 자동 번역 시스템에서 'X를 하다'와 'X하다' 구문간의 상관성을 이용하여 두 구문이 'X하다' 동사에 대한 동사구 패턴을 공유하도록 함으로써 동사구 패턴 구축 시에 정보의 중복 기술을 피하고, 패턴의 적용 범위를 넓힌다. 패턴의 공유로 인해 발생하는 대역문 생성 시의 문제점은, 'X를 하다' 구문에 대응하는 중국어 대역 형태 별로 분류하여 해결함으로써 패턴을 공유하면서도 번역의 질은 유지시킬 수 있는 방법을 제안한다.

  • PDF

Korean Verb Clustering Using Self-Organizing Maps (Self-Organizing Map을 이용한 한국어 동사 클러스터링)

  • 박성배;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.183-184
    • /
    • 1998
  • 본 논문에서는 목적어-동사 관계의 분포에 따라 한국어 동사를 자동적으로 클러스터링하는 방법을 제시한다. SOM(Self-Organizing Map)이 입력 패턴을 분석하고 가시화하는데 뛰어난 성능을 보이므로, 본 논문에서는 클러스터링하는 방법으로 SOM을 채택하였다. 일단 맵(map)이 만들어지고 나면 학습하는 동안 경험하지 못한 동사도 쉽게 적당한 클러스터로 분류될 수 있고 클러스터들 간의 의미 거리도 맵을 이용하여 쉽게 계산할 수 있다. 본 논문에서 제안한 방법을 명사 확률 분포의 상대 엔트로피(relative entropy)에 기반한 클러스터링 방법과 비교해 본 결과, SOM에 의해 만들어진 동사 클러스터가 상대 엔트로피를 이용해서 만들어진 클러스터를 잘 반영한다는 것을 알 수 있었다.

  • PDF

Implementation of a [parser for news summarization (신문 기사 요약문 생성을 위한 구문 분석기 구현)

  • 정영규;이현주;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.379-381
    • /
    • 2001
  • 본 논문은 문서요약 시스템의 일부로써 신문기사의 문장을 효율적으로 구문 분석할 수 있는 구문 분석기를 구현한다. 요약의 대상인 신문기사의 문장은 보조동사, 화용조사, 인용동사 등 많은 동사들을 가지며, 이와 같은 동사들은 구문분석을 할 때 많은 문제점을 발생시킨다. 본 논문은 이러한 동사들을 단위화하고, 여기서 발생하는 주어 생략과 모호성 문제를 해결하는 방법을 제시한다. 그리고 단위화의 결과로 나온 의미적 중심용언을 이용하여 문장의 필수 성분을 추출한다.

  • PDF

Implementation of SENKVO and Its Application to the Selectional Restriction for Semantic Analysis of Korean Verbs (한국어 동사 의미처리를 위한 SENKOV의 구축과 공기제약 관계에의 활용)

  • 고병수;정성훈;문유진
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.177-179
    • /
    • 1998
  • 본 논문은 의미론적 어휘개념에 기반한 한국어 동사 Isa 계층구조 시스템을 이용한 Semantic Network을 구축하며, 이를 활용하여 부사와 동사 간의 공기제약관계 설정에 유효한 개념 분류를 수행한다. 일반적으로 많이 쓰이는 한국어 동사 658개를 대상으로 semantic network을 구축한 결과, SENKOV는 44개의 top node를 가지고 있으며 depth 는 약 2.35이었다. 한국어 동사의 semantic network은 영어에서와 마찬가지로 명사보다 top node의 개수가 많고 depth가 훨씬 더 얕았다. 그리고 성상부사의 selectional restriction에 유효한 개념분류를 하는데 SENKOV를 활용하였다.

  • PDF

The Recognition of Korean Auxiliary Verb and its Description Based on Conceptual Graph (한국어 보조동사의 인식 및 개념그래프에 의한 표현)

  • 이병희
    • Journal of Internet Computing and Services
    • /
    • v.2 no.3
    • /
    • pp.37-49
    • /
    • 2001
  • Korean auxiliary verbs are often used in Korean sentences in spite of the small number of the auxiliary verbs, However. the incorrect processing of the verbs concept leads to the poor translation quality. To solve the problems of the auxiliary verb processing. the paper proposes a description of the auxiliary verbs based on Conceptual Graph (CG), For the description of the auxiliary verbs within CG. we first collect 40 Korean auxiliary verbs and example sentences from papers and a Korean dictionary, Next, we perform the analysis of the Korean auxiliary verbs through a classification: perfective, progressive, benefactive, attemptive, emphatic, desirable, retentive, and presumptive. Then we depict the eight meanings based on CG. In the experiment. the paper implements the program that translates sentences included in the auxiliary verbs into CG and explains the experimental results.

  • PDF

Verb concept clustering using Independent Component Analysis and Box-Cox transformation (독립성분분석과 Box-Cox 변환을 이용한 동사 개념 클러스터링)

  • Chagnaa, Altangerel;Lee, Chang-Beom;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.164-170
    • /
    • 2006
  • 본 논문에서는 한국어 동사의 개념적 클러스터링 방법을 제안하다. 사용되는 기법은 독립성분분석, Box-Cox 변환, 상관분석 등이다. 독립성분분석은 잠재적인 성분을 통계적 독립(statistical independence)에 기반하여 추출하는 분석 방법이다. 그런데, 독립성분분석에서는 mixture(동사)의 분포는 정규 분포(가우시안 분포)에 따른다고 가정한다. 따라서 동사의 분포를 보다 정규 분포화 할 필요가 있다. 이에 본 논문에서는 Box-Cox 변환을 이용하여 동사의 분포를 정규 분포에 근사한다. 또한, 독립성분분석에서는 추출할 적당한 성분의 개수를 결정할 수가 없다. 이에 본 논문에서는 주성분분석의 결과로 획득되는 고유치의 누적 기여율을 이용하여 독립성분의 수를 결정한다. 그리고, 추출된 독립성분 벡터와 동사 벡터간의 상관계수에 이용하여 독립성분(개념)에 밀접하게 관련 있는 동사들을 하나의 클러스터로 구성한다. 한국어 동사를 대상으로 클러스터링한 결과, Box-Cox 변환을 적용한 경우가 더 좋은 성능을 보였다.

  • PDF

English Critique and Verb Dictionary based on Extended Verb Pattern (확장 동사형에 기반한 동사사전과 영어 문장 검사기)

  • 차의영
    • Korean Journal of Cognitive Science
    • /
    • v.3 no.2
    • /
    • pp.311-328
    • /
    • 1992
  • The level and accuracy of English sentence that is generated by a man or machine translator are determined by the content of the verb dictionary and effective generation algorithm.The conventional English critiques is not adequate for foreigners because they do not have the verb dictionary including verb pattern or the important grammatical constraints. In this paper,Ipropose a structure of verb dictionary and an English sentence critique based on extended verb pattern that is useful to check and correct mistakes of English sentences generated by machine translator.

The Semantic Structure and Argument Realization of Korean Passive Verbs (한국어 피동동사의 의미구조와 논항실현)

  • 김윤신;이정민;강범모;남승호
    • Korean Journal of Cognitive Science
    • /
    • v.11 no.1
    • /
    • pp.25-32
    • /
    • 2000
  • Korean passive verbs are derived from their corresponding active verbs by suffixation or by adding endings and auxiliaries to their stems. Therefore. we assume p passive verbs share some lexical informations with their active counterparts. This paper extending the Generative Lexicon theory of Pustejovsky (995). aims to characterize the argument realization patterns of Korean passive verbs focusing on the case alternation a and to propose their lexical semantic structures which account for the syntactic behavior.

  • PDF