• Title/Summary/Keyword: Syntactic ambiguity

Search Result 50, Processing Time 0.024 seconds

Two-Level Clausal Segmentation using Sense Information (의미 정보를 이용한 이단계 단문분할)

  • Park, Hyun-Jae;Woo, Yo-Seop
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.9
    • /
    • pp.2876-2884
    • /
    • 2000
  • Clausal segmentation is the method that parses Korean sentences by segmenting one long sentence into several phrases according to the predicates. So far most of researches could be useful for literary sentences, but long sentences increase complexities of the syntax analysis. Thus this paper proposed Two-Level Clausal Segmentation using sense information which was designed and implemented to solve this problem. Analysis of clausal segmentation and understanding of word senses can reduce syntactic and semantic ambiguity. Clausal segmentation using Sense Information is necessary because there are structural ambiguity of sentences and a frequent abbreviation of auxiliary word in common sentences. Two-Level Clausal Segmentation System(TLCSS) consists of Complement Selection Process(CSP) and Noncomplement Expansion Process(NEP). CSP matches sentence elements to subcategorization dictionary and noun thesaurus. As a result of this step, we can find the complement and subcategorization pattern. Secondly, NEP is the method that uses syntactic property and the others methods for noncomplement increase of growth. As a result of this step, we acquire segmented sentences. We present a technique to estimate the precision of Two-Level Clausal Segmentation System, and shows a result of Clausal Segmentation with 25,000 manually sense tagged corpus constructed by ETRl-KONAN group. An Two-Level Clausal Segmentation System shows clausal segmentation precision of 91.8%.

  • PDF

Resolving the Ambiguities of Negative Stripping Construction in English : A Direct Interpretation Approach (영어 부정 스트리핑 구문의 중의성 해소에 관한 연구: 직접 해석 접근법을 중심으로)

  • Kim, So-jee;Cho, Sae-youn
    • Cross-Cultural Studies
    • /
    • v.52
    • /
    • pp.393-416
    • /
    • 2018
  • Negative Stripping Construction in English involves the disjunction but, the adverb not, and a constituent NP. This construction is an incomplete sentence although it delivers a complete sentential meaning. Interpretation of this construction may be ambiguous in that the constituent NP can either be construed as the subject, or as the complements including the object. To generate such sentences and resolve the issue of ambiguity, we propose a construction-based analysis under direct interpretation approach, rejecting previous analyses based on deletion approaches. In so doing, we suggest a negative stripping construction rule that can account for ambiguous meaning. This rule further can enable us to explain syntactic structures and readings of Negative Stripping Construction.

Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types (표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.81-92
    • /
    • 2003
  • Generalized LR parsing is one of the enhanced LR parsing methods so that it overcome the limit of one-way linear stack of the traditional LR parser using graph-structured stack, and it has been playing an important role of a firm starting point to generate other variations for NL parsing equipped with various mechanisms. In this paper, we propose a conditional Action Model that can solve the problems of conventional probabilistic GLR methods. Previous probabilistic GLR parsers have used relatively limited contextual information for disambiguation due to the high complexity of internal GLR stack. Our proposed model uses Surface Phrasal Types representing the structural characteristics of the parse for its additional contextual information, so that more specified structural preferences can be reflected into the parser. Experimental results show that our GLR parser with the proposed Conditional Action Model outperforms the previous methods by about 6-7% without any lexical information, and our model can utilize the rich stack information for syntactic disambiguation of probabilistic LR parser.

The Semantics of amu N-to/-ilato/-ina in Korean: Arbitrary Choice and Concession

  • Lee, Chung-Min;Chung, Dae-Ho;Nam, Seung-Ho
    • Language and Information
    • /
    • v.4 no.2
    • /
    • pp.107-124
    • /
    • 2000
  • This paper reports the syntactic distribution of amu-N-to/-ilato/-ina phrase, which are representative polarity sensitive items. (PSIs) in Korean, and ac- counts for their semantic characteristics in therms of "arbitrary choice quantification" and "concession" In the first section, we extensively illustrate the distributional behaviour of the PSIs in various costructions and roughly generalize the distribu- tion in terms of "(anti/non-) verdicality" Section 2 claims amu denotes an arbi- trary choice quantifier and the particles -to/-ilato/-ina as "concessive" markers, so the compounds denote a special element in a pragmatic scale determined by con- text/situation, Section 3. based on the pragmatics of scalar implicature, accounts for the apparent ambiguity of PSIs between "universal"and "existential"readings and further characterizes the difference among the concessive markers -to/-ilato/-ina in terms of "quantity/ quality scale."rkers -to/-ilato/-ina in terms of "quantity/ quality scale."

  • PDF

A study on extraction of aspect and modality information in Korean (한국어의 시상과 양상 정보추출에 관한 연구)

  • 이수현;한광록
    • Korean Journal of Cognitive Science
    • /
    • v.1 no.2
    • /
    • pp.255-257
    • /
    • 1989
  • This paper proposes a method for extracting the imformation of aspect and modality from the predicative part which is consisted of main verbal and auxiiary verbals.Data which are expressed by the compound predicate with many consecutive verbals are collected and analyzed to thirty-six structual forms of the predicative part.Inthe final analysis, an extracting function of conceptual information is derived to find the connoted aspect and modality in each structure.The informations which are obtained by this function decrease the individual ambiguity of an auxiliary verbal and offer a detailed meaning inthe syntactic and semantic analysis of machine translation system or inference machine.

Efficient Analysis of Korean Dependency Structures Using Beam Search Algorithms (Beam Search 알고리즘을 이용한 효율적인 한국어 의존 구조 분석)

  • Kim, Hark-Soo;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.281-286
    • /
    • 1998
  • 구문분석(syntactic analysis)은 형태소 분석된 결과를 입력으로 받아 구문단위간의 관계를 결정해 주는 자연어 처리의 한 과정이다. 그러나 구문분석된 결과는 많은 중의성(ambiguity)을 갖게 되며, 이러한 중의성은 이후의 자연어 처리 수행과정에서 많은 복잡성(complexity)를 유발하게 된다. 지금까지 이러한 문제를 해결하기 위한 여러 가지 연구들이 있었으며, 그 중 하나가 대량의 데이터로부터 추출된 통계치를 이용한 방법이다. 그러나, 생성된 모든 구문 트리(parse tree)에 통계치를 부여하고, 그것들을 순위화하는 것은 굉장히 시간 소모적인 일(time-consuming job)이다. 그러므로, 생성 가능한 트리의 수를 효과적으로 줄이는 방법이 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 개선된 beam search 알고리즘을 제안하고, 기존의 방법과 비교한다. 본 논문에서 제안된 beam search 알고리즘을 사용한 구문분석기는 beam search를 사용하지 않은 구문분석기가 생성하는 트리 수의 1/3정도만으로도 같은 구문 구조 정확률을 보였다.

  • PDF

Resolution of Korean Syntactic Ambiguity using Sentence Pattems Information and Clausal Segmentation (문형과 단문 분할을 이용한 한국어 구문 모호성 해결)

  • 이현영;황이규;이용석
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.116-123
    • /
    • 2000
  • 한국어 구문 분석은 체언구 부착이나 부사구 부착의 문제를 가진다. 이런 부착의 문제는 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스 트리의 선택을 어렵게 한다. 한국어에서 이런 부착의 문제는 대부분 한국어 문장이 내포문을 포함하는 복문의 형태로 구성되어 있기 때문이다. 단문에서는 부착의 문제가 발생하지 않지만 복문에서는 체언구나 부사구가 어떤 용언에 부착하느냐에 따라 체언구 부착이나 부사구 부착의 문제가 발생한다. 따라서 용언이 가지는 정보를 이용하여 내포문의 범위를 결정해서 하나의 구문범주의 기능을 가지도록 분할한다. 이를 단문 분할이라 하며 문형이 가지는 필수격들을 최대로 부착하여 이루어진다. 단문분할을 하면 복문의 구조가 단문으로 바뀌므로 이런 부착의 문제가 자연스럽게 해결된다. 본 논문에서는 문형과 단문 분할을 이용하여 많은 구문 모호성을 해결할 수 있음을 제안한다.

  • PDF

Resolving structural ambiguity of Chinese V+NP$_1$+的+NP$_2$syntactic pattern (중국어 V+NPl+的+NP2 구문 패턴의 애매성 해소)

  • Cui, Zheng;Kim, Mi-Young;Kim, Dong-Il;Lee, Jong-Hyuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.667-669
    • /
    • 2002
  • 중국어 V+NP$_1$+的+NP$_2$형 패턴은 동사구와 명사구로 분석이 가능하여 중국어 구문분석의 결과에 중요한 영향을 미친다. 본 논문은 중국어 V+NP$_1$+的+NP$_2$형 패턴의 구조적 중의성 문제를 해결하기 위한 방법을 제안한다. 제안하는 방법은 통계정보로 보완된 동사의 결합가 정보, 두 명사간의 결합도 정보 및 휴리스틱으로 구조적 애매성을 해소하고자 한다.

  • PDF

The effect of syntactic category ambiguity on eojeol processing (통사적 중의성이 어절 처리에 미치는 영향)

  • Yi, Hoyoung;Nam, Kichun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.255-257
    • /
    • 2009
  • 본 논문은 한국어의 통사적 중의성이 언어정보처리에 어떠한 영향을 미치는지 알아보기 위하여 어휘판단과제(lexical decision task)를 실시하였다. 명사의 의미와 동사의 의미로 중의적인 어절을 사용하여 각각의 빈도가 영향을 미치는지를 살펴보고자 하였다. 개별 품사 정보가 모두 영향을 미친다면 각각의 빈도가 영향을 미치게 되고 누적빈도 효과가 발생하여 개별 품사의 빈도와 동일한 비교조건에서의 반응시간보다 빠를 것이다. 실험 결과, 중의어절에서의 반응시간이 가장 빠르게 발생하였고 이를 통해 하나의 중의어절이 의미하는 개별적인 품사 의미가 모두 언어정보처리에 영향을 미친다는 것을 의미한다.

  • PDF

Resolution of Korean Syntactic Ambiguity using Sentence Patterns Information and Clausal Segmentation (문형과 단문 분할을 이용한 한국어 구문 모호성 해결)

  • Lee, Hyeon-Yeong;Hwang, Yi-Gyu;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.116-123
    • /
    • 2000
  • 한국어 구문 분석은 체언구 부착이나 부사구 부착의 문제를 가진다. 이런 부착의 문제는 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스 트리의 선택을 어렵게 한다. 한국어에서 이런 부착의 문제는 대부분 한국어 문장이 내포문을 포함하는 복문의 형태로 구성되어 있기 때문이다. 단문에서는 부착의 문제가 발생하지 않지만 복문에서는 체언구나 부사구가 어떤 용언에 부착하느냐에 따라 체언구 부착이나 부사구 부착의 문제가 발생한다. 따라서 용언이 가지는 정보를 이용하여 내포문의 범위를 결정해서 하나의 구문범주의 기능을 가지도록 분할한다. 이를 단문 분할이라 하며 문형이 가지는 필수격들을 최대로 부착하여 이루어진다. 단문분할을 하면 복문의 구조가 단문으로 바뀌므로 이런 부착의 문제가 자연스럽게 해결된다. 본 논문에서는 문형과 단문 분할을 이용하여 많은 구문 모호성을 해결할 수 있음을 제안한다.

  • PDF