• 제목/요약/키워드: Syntactic Ambiguities

검색결과 20건 처리시간 0.02초

일본어 유악센트 방언과 무악센트 방언의 통사적 애매성의 해소와 운율적 특징 (Syntactic Ambiguities and their Resolution in Prosody in Japanese)

  • 최영숙
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.211-221
    • /
    • 2002
  • The prosody can play a crucial role in differentiating ambiguous sentences to correctly reflect their intended syntactic structures. In what way do the speakers in Tokyo and Sendai dialects of Japanese use prosodic elements to differentiate syntactic ambiguities? Acoustic measurement was made of utterances of ambiguous sentences in Japanese to observe prosodic strategies for disambiguation. Materials were sentences of the type ADV-VP1-NP-VP2, ADV-NP1-NP2-VP2, where the ambiguity lies in locative adverbial modification, ADV modifying either VP1 or VP2. For this construction the Japanese create the same ambiguities. After defining the depth of a syntactic boundary, F0 of the phrase before and after the boundary, and duration of the syllable and pause before the boundary were measured. The results show that Tokyo dialects speakers use F0 after syntactic boundary, and Sendai dialects speakers use of the syllable and/or pause before the boundary.

  • PDF

구간 분할과 논항정보를 이용한 구문분석시스템 구현에 관한 연구 (A Study of Parsing System Implementation Using Segmentation and Argument Information)

  • 박용욱;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제16권3호
    • /
    • pp.366-374
    • /
    • 2013
  • 본 논문에서는 한국어 구문분석에서 발생하는 중의성을 해결하기 위하여 구간분할 방법과 논항정보를 사용하여 개선한 구문분석시스템을 소개한다. 본 논문에서 제안하는 구문분석 시스템은 어절대신 형태소를 입력으로 사용하고, 또한 주어진 형태소에 대하여 가능한 모든 구문 분석 구조를 생성하는 알고리즘을 사용한다. 따라서 많은 중의성을 포함한 구문 분석 결과를 생성한다. 이러한 중의성 구조 결과를 해결하기 위하여 세 가지 방법을 사용했다. 첫째 방법은 형태소분석 결과에서 중의성을 제거하는 방법이고 두 번째는 구문 분석시 구간 분할하는 방법, 세 번째 방법은 논항정보를 이용하는 것이다. 이러한 방법을 사용하여 많은 중의성을 제거할 수 있었다. 실험을 통하여 약 53%의 중의성을 제거할 수 있었음을 보여준다.

형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용 (Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity)

  • 황이규;이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.784-793
    • /
    • 2000
  • 기존의 한국어 형태소 해석은 한국어의 교착어 특성상 다양한 형태론적 모호성을 가진다. 이러한 형태론적 모호성은 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스트리의 선택을 어렵게 한다. 한국어에서 이런 형태론적 모호성의 대부분이 보조용언이나 의존 명사와 관련이 있다. 보조용언이나 의존명사는 주위의 형태소들과 강한 결합 관계를 가지고 있으며, 대부분 자립성이 없는 기능형태소이다. 결합된 형태소들은 문장 내에서 하나의 기능적 역할이나 구문적 역할을 수행한다. 우리는 품사 태깅된 20 만 어절 크기의 말뭉치로부터 이 형태소열을 찾아 이를 3가지 유형으로 분류하였다. 그리고, 이를 구문 형태소로 정의하고 구문 형태소를 구문 분석의 기본 입력 단위로 간주하였다. 본 논문에서는 구문 형태소가 아래와 같은 문제의 해결에 있어서 효율적인 방법임을 제안한다: 1) 형태소 해석의 축소, 2) 구문 해석 도중 불필요한 부분 파스트리의 배제, 3) 구문 모호성의 축소. 마지막으로, 실험 결과를 통해 구문단위 형태소가 형태소 및 구문 모호성을 축소하기 위해 반드시 필요함을 보인다.

  • PDF

일본 센다이 방언과 터키 앙카라 방언의 운율에 나타나는 통사적 애매성 해소에 관한 연구 (Syntactic Ambiguities and Their Resolution in Prosody between Sendai dialect of Japanese and Ankara dialect of Turkish)

  • 최영숙
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.175-185
    • /
    • 2003
  • Japanese and Turkish are syntactically similar to each other, and there are syntactic structures that become ambiguous in terms of NP's and VP's modified by adjectives and adverbs, respectively. The prosody can play a crucial role in differentiating ambiguous sentences to correctly reflect their intended syntactic structures. In what way do the speakers of Sendai dialect of Japanese and Turkish use prosodic elements to differentiate syntactic ambiguities? Acoustic measurements were made of utterances of ambiguous sentences in Japanese and Turkish to observe prosodic strategies for disambiguation. Materials were sentences of the type ADV-VP1-NP-VP2, ADV-NP1-NP2-VP2, where the ambiguity lies in locative adverbial modification, ADV modifying either VP1 or VP2. For this construction the Japanese and Turkish creates the same ambiguities. In this paper, I look at duration, F0, and pause as observed in their speech and see how each language uses three prosodic elements in disambiguation. The results show that both speakers of Sendai dialect in Japan and those of Ankara dialect in Turky use lengthening of the syllable and/or pause before the boundary.

  • PDF

의존문법 기반의 구간 분할법을 활용한 한국어 구문 분석기 (Korean Parser Using Segmentation Based on Dependency Grammar)

  • 박용욱
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1705-1712
    • /
    • 2009
  • 최근 대부분의 한국어 구문분석기는 의존문법(Dependency Grammar)을 사용하고 있는데, 그 이유는 한국어의 특성인 어순이 비교적 자유롭고 생략이 잦은 문장에 대한 처리가 용이하기 때문이다. 하지만 의존문법을 이용한 한국어 구문분석은 많은 중의성을 도출하는 문제점이 대두되고 있다. 본 논문에서는 이러한 중의성을 보다 효과적으로 해결하기 위하여 200개가 넘는 의존문법 규칙과 문장의 구성성분을 이용한 구간분할방법, 관형형어미가 붙은 용언에 대한 처리 및 같은 용언에 중복된 구성성분 결합제한 방법을 사용한 구문분석기를 제안한다. 실험 결과 중의성 제거에 많은 효과가 있음을 보여준다.

구문 제약으로 문형을 사용하는 CFG기반의 한국어 파싱 (CFG based Korean Parsing Using Sentence Patterns as Syntactic Constraint)

  • 박인철
    • 한국산학기술학회논문지
    • /
    • 제9권4호
    • /
    • pp.958-963
    • /
    • 2008
  • 한국어는 용언이 의미적 제약을 통해 문장을 지배하며 대부분의 한국어 문장은 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 한국어에 맞는 구문 문법이나 구문 제약을 기술하는 것은 매우 어렵고 한국어를 파싱 하면 다양한 구문 모호성이 발생한다. 본 논문에서는 구문 제약으로 문형(sentence patterns)을 사용하는 CFG기반의 문법을 기술하여 구문 모호성을 해결하는 방법을 제안한다. 이를 위해 내포문을 포함하는 복문도 문형으로 분류하였으며 44개의 문형을 사용한다. 그러나 한국어 특성상 문형 정보만으로는 모든 구문 모호성을 해결할 수가 없기 때문에 문형에 의미 제약(semantic constraint)을 가한 의미 지표(semantic marker)를 사용하여 파싱을 수행한다. 의미 지표는 보조사의 처리나 공동격 조사에 의해 발생되는 구문 모호성을 해결하는데 이용될 수 있다.

형태소 분석기의 어휘적 중의성 해결에 관한 연구 (A Study on Lexical Ambiguity Resolution of Korean Morphological Analyzer)

  • 박용욱
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.783-787
    • /
    • 2012
  • 한 어절을 중심으로 검사가 이루어지는 맞춤법 검사는 문맥상 어울리지 않는 단어로 인하여 생기는 오류는 찾기 어렵다. 맞춤법 검사기는 현재 어절 단위로 오류 여부를 판단하는 것이기 때문에 어휘적 중의성을 고려하지 않아도 된다. 그러나 문법 검사기는 문장 분석을 해야 하므로 어휘적 중의성을 제거하지 않고는 정확한 검사가 어렵다. 본 논문에서는 어휘적 중의성을 해결하기 위하여 몇 가지 규칙을 만들고 이를 활용하여 문장에 존재하는 어휘적 중의성을 해결할 수 있는 방법을 보인다. 또한 실험을 통하여 그 결과를 분석하였다.

내포문의 단문 분할을 이용한 한국어 구문 분석 (Korean Syntactic Analysis by Using Clausal Segmentation of Embedded Clause)

  • 이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.50-58
    • /
    • 2008
  • 한국어 문장은 대부분 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 복문에 나타나는 하나 이상의 용언으로 인해 구문 분석 과정에서 다양한 구문 애매성이 발생한다. 이들 중 대부분은 내포문의 수식 범위로부터 발생되는 구 부착의 문제 때문이다. 이런 구문 애매성은 내포문의 범위를 정해서 하나의 구문 범주의 기능을 가지도록 하면 해결할 수가 있다. 본 논문에서는 내포문의 범위를 정하기 위해서 문형과 한국어의 구문 특성을 이용한다. 먼저, 내포문에 있는 용언의 문형 정보가 가질 수 있는 필수격을 최대로 부착하여 내포문의 범위를 정하고 이를 이용해서 복문을 내포문과 주절로 분할한다. 그리고 한국어의 구문 특성을 이용해서 분할된 내포문의 기능을 하나의 구문 범주인 체언구나 부사구로 변환한다. 이렇게 함으로써 복합문의 구성 형태가 단문 구조로 변환되기 때문에 내포문의 범위에 의한 구 부착의 문제가 쉽게 해결된다. 이것을 본 논문에서는 내포문의 단문 분할이라고 한다. 본 논문에서 제안한 방법으로 1000 문장을 실험한 결과 문형과 단문 분할을 이용하지 않은 방법보다 구문 애매성이 88.32% 감소되었다.

Ambiguity in the Negative V+bo NP Construction in Taiwanese Southern Min

  • Huang, Hui-Yu
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.163-172
    • /
    • 2007
  • This paper examines some syntactic and semantic properties of the negative construction V+bo NP (VbN) in Taiwanese Southern Min (TSM). It finds out that there are ambiguities between an episode reading and a generic reading in VbN construction which require further investigations and explanations. Therefore, the goal of this paper is to account for the ambiguities lying in the negative VbN construction.

  • PDF

English Syntactic Disambiguation Using Parser's Ambiguity Type Information

  • Lee, Jae-Won;Kim, Sung-Dong;Chae, Jin-Seok;Lee, Jong-Woo;Kim, Do-Hyung
    • ETRI Journal
    • /
    • 제25권4호
    • /
    • pp.219-230
    • /
    • 2003
  • This paper describes a rule-based approach for syntactic disambiguation used by the English sentence parser in E-TRAN 2001, an English-Korean machine translation system. We propose Parser's Ambiguity Type Information (PATI) to automatically identify the types of ambiguities observed in competing candidate trees produced by the parser and synthesize the types into a formal representation. PATI provides an efficient way of encoding knowledge into grammar rules and calculating rule preference scores from a relatively small training corpus. In the overall scoring scheme for sorting the candidate trees, the rule preference scores are combined with other preference functions that are based on statistical information. We compare the enhanced grammar with the initial one in terms of the amount of ambiguity. The experimental results show that the rule preference scores could significantly increase the accuracy of ambiguity resolution.

  • PDF