• Title/Summary/Keyword: syntactic category

검색결과 31건 처리시간 0.023초

영한 기계번역에서 구문 분석 정확성 향상을 위한 구문 범주 예측 (Syntactic Category Prediction for Improving Parsing Accuracy in English-Korean Machine Translation)

  • 김성동
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.345-352
    • /
    • 2006
  • 실용적인 영한 기계번역 시스템은 긴 문장을 빠르고 정확하게 번역할 수 있어야 한다. 보다 빠른 번역을 위해 문장 분할을 이용한 부분 파싱 방법이 제안되어 속도 향상에 기여하였다. 본 논문에서는 보다 정확한 분석을 위해 결정 트리를 이용한 구문 범주 예측 방법을 제안한다. 문장 분할을 적용한 영어 분석에서 각각의 분할된 부분은 개별적으로 분석되며 각 분석 결과들이 결합되어 문장의 구조가 생성된다. 여기서 각 분할의 구문 범주를 미리 예측하여 부분 파싱 후에 보다 정확한 분석 결과를 선정하고 예측된 구문 범주에 근거하여 올바르게 다른 문장의 분할결과와 결합함으로써 문장 분석의 정확도를 향상시키는 것이 본 논문에서 제안한 방법의 목적이다. 본 논문에서는 Wall Street Journal의 파싱된 말뭉치에서 구문 범주 예측에 필요한 특성을 추출하고 결정 트리를 이용하여 구문 범주 예측을 위한 결정 트리를 생성하였다. 실험에서는 사람이 구축한 규칙을 이용한 방법, trigram 확률을 이용한 방법, 신경망을 이용한 방법 등에 의한 구문 범주 예측 성능을 측정, 비교하였으며 제안된 구문 범주 예측이 번역의 품질 향상에 기여한 정도를 제시하였다.

Combinatory Categorial Grammar for Korean

  • 한성국;박찬곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.164-171
    • /
    • 1990
  • A commutative productive category is proposed to the current CCG for the syntactic analysis of free word order languages like Korean. The introduction of this sort of category is quite natural for categorial lexicon and functional operations. We present the theorical basis of productive category and examine the linguistic availability through typical syntactic structures of Korean.

  • PDF

구문 관계 정보를 이용한 한국어 질의-응답 시스템 (Korean Question-Answering System using Syntactic-Relation Information)

  • 신승은;이대연;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위한 동사의 구문 관계 정보를 이용한 한국어 질의-응답 시스템에 대해 기술한다. 구문 관계 정보는 동사의 원형, 사용 패턴, 각 문장 성분들의 의미 속성, 유의 동사 등의 정보를 담고 있다. 문장 및 구에 대한 구문분석은 구문관계 정보에 나타난 동사에 의존적인 문장 성분들의 의미속성과 동사의 일반적인 사용 패턴을 활용한다. 또한 정답후보 문장들의 구문분석을 위해 구문 관계 정보를 사용하고, 질의문의 격 슬롯(case slot)으로부터 정답을 찾기 위해 구문관계 정보를 사용한다. 실험에서 동사의 구문 관계 정보의 이용이 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위해 한국어 질의-응답 시스템에 효율적으로 활용될 수 있음을 보였다.

  • PDF

A Constraint-based Approach to English Gerunds

  • Kim, Yong-Beom
    • 한국언어정보학회지:언어와정보
    • /
    • 제7권2호
    • /
    • pp.117-137
    • /
    • 2003
  • This paper attempts to provide an alternative analysis involving categorical issues related to English gerunds. Especially, this paper rejects Maulof's approach that creates a new syntactic category gerund by mixing nominal and verbal categories. This paper identifies two syntactic structures in English gerunds: nominal gerunds and verbal gerunds. This distinction is based on syntactic and semantic characteristics of each type and is intended to account for the external distribution and endocentricity of the construction. Treating verbal gerunds syntactically as verbal categories, this paper proposes that English verbal gerunds act like other verbal categories such as infinitives whereas nominal gerunds behaves much like derived nominals. This paper proposes a few lexical rules that can take care of the two types of gerunds. The proposal can be extended to prepositional complements as well as sentential subject positions. This proposal not only resolves the issues involving distributional properties of the gerund construction but also captures syntactic parallelism observable between gerunds and other verbal constructions in English.

  • PDF

현대 예술의상에 표현된 조형성의 텍스트 분석 (제1보) - 1980년대 이후 서구작가 작품을 중심으로 - (The Text Analysis of Plasticity Expressed in the Modern Art to Wear (Part I) - Focused on the West Art Works since 1980s -)

  • 서승미;양숙희
    • 한국의류학회지
    • /
    • 제29권6호
    • /
    • pp.793-804
    • /
    • 2005
  • The new paradigm of the 21st century demand an openly different world of formative ideologies in respect to art and design. The purpose of this study is focused on trying to comprehend aesthetic essence of clothing as an, with the investigation of artistic theories manifested by art philosophers. Art to Wear was categorized into style to understand its artistic meaning as well as to analyze its character. Upon the foundation of semiotics theory, the feature of Art to Wear and its analysis category were argued in the context of Charles Morris three dimension of semiotics analysis. The conclusion to the research is like so. The feature and analysis category of Art to Wear upon a semiotics perspective was divided into syntactic dimension, semantic dimension and pragmatic dimension. The analytical categorization upon the perspective of syntactic dimension fell into the category of topology, shape and color. The semantic dimension of Art to Wear was divided into categories of denotation and connotation. In addition, the pragmatic dimension of Art to Wear analytical categorization was divided into a delivering function and common function.

구문 의존 경로에 기반한 단백질의 세포 내 위치 인식 (Detection of Protein Subcellular Localization based on Syntactic Dependency Paths)

  • 김미영
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.375-382
    • /
    • 2008
  • 단백질의 세포 내 위치를 인식하는 것은 생물학 현상의 기술에 있어서 필수적이다. 생물학 문서의 양이 늘어남에 따라, 단백질의 세포 내 위치 정보를 문서 내용으로부터 얻기 위한 연구들이 많이 이루어졌다. 기존의 논문들은 문장의 구문 정보를 이용하여 정보를 얻고자 하였으며, 언어학적 정보가 단백질의 세포 내 위치를 인식하는 데 유용하다고 주장하고 있다. 그러나, 이전의 시스템들은 구문 정보를 얻기 위해 부분 구문분석기만을 사용하였고 재현율이 좋지 못했다. 그러므로 단백질의 세포 내 위치 정보를 얻기 위해 전체 구문분석기를 사용할 필요가 있다. 또한, 더 많은 언어학적 정보를 위해 의미 정보 또한 사용이 가능하다. 단백질의 세포 내 위치 정보를 인식하는 성능을 향상시키기 위하여, 본 논문은 전체 구문분석기와 어휘망(WordNet)을 기반으로 한 방법을 제안한다. 첫 번째 단계에서, 각 단백질 단어로부터 그 단백질의 위치후보에까지 이르는 구문 의존 경로를 구축한다. 두 번째 단계에서, 구문의존 경로의 루트 정보를 추출한다. 마지막으로, 단백질 부분트리와 위치 부분트리의 구문-의미 패턴을 추출한다. 구문 의존 경로의 루트와 부분트리로부터 구문태그와 구문방향을 구문 정보로서 추출하고, 각 노드 단어의 의미태그를 의미 정보로서 추출한다. 의미태그로는 어휘망의 동의어 집합(synset)을 사용한다. 학습데이터에서 추출한 루트 정보와 부분트리의 구문-의미 패턴에 따라서, 실험데이터에서 (단백질, 위치) 쌍들을 추출했다. 어떤 생물학적 지식 없이, 본 논문의 방법은 메드라인(Medline) 요약 데이터를 사용한 실험 결과에서 학습데이터에 대해 74.53%의 조화평균(F-measure), 실험데이터에 대해서는 58.90%의 조화평균을 보였다. 이 실험은 기존의 방법들보다 12-25%의 성능향상을 보였다.

The Role of H Tone of an AP in Korean: The Relation Between Prosody and Morphology

  • Kang, Hyun-Sook
    • 음성과학
    • /
    • 제15권1호
    • /
    • pp.7-23
    • /
    • 2008
  • This paper investigates tonal patterns of the prosodic constituents of an AP and a PWD in Korean and their relation with the morphological/syntactic structure. Specifically, this paper asks the following questions: First, if there are more than one PWD in an AP, how is each PWD specified in terms of tones? Secondly, in case that there is only one PWD in an AP that consists of several morphemes, is there any preference of the association between tones and the morphemes that constitute that PWD? Thirdly, if an AP dominates a PWD and if a PWD contains at least one morpheme of the lexical category, it follows that an AP should contain at least one morpheme of the lexical category. Can this be verified with the experimental data? In order to answer these questions, Experiment I and II were conducted with the target material consisting of a stem and suffixes that varied in length. The results of this preliminary test show that as the number of syllables in the target material increases, the more number of an AP tonal pattern occurs in it and as a result, in some cases, an AP consisting of suffixes only may occur.

  • PDF

한국어 피동문의 구조와 가능(potential)의 의미 해석 -대조적 관점에서- (A Structure of Passive Constructions in Korean and their meaning 'Potential')

  • 목정수;김영중
    • 인문언어
    • /
    • 제8집
    • /
    • pp.369-387
    • /
    • 2006
  • Which syntactic function should we assign to the 'ga-type' constituent which occurs in the morphological passive constructions in Korean, [N0-neun N1-i Vpass-ending]? This problem is very important in two respects. First, a small change of status of the particle 'i/ga' can exert an overall influence on the Korean grammar. Second, the particle '-i/ga' cannot guarantee that 'ga-type' constituents are subject of the sentence, so that the concept of syntactic category should be distinguished from that of syntactic function. This paper claims that the analysis of sentence has long been focused on the structure of proposition, namely the argument structure and that the direction of analysis should be turned to the 'person structure' which can be revealed on the pragmatic level. On the basis of this, this paper suggests that the specific type of the morphological passive constructions in Korean, [N0-neun N1-i Vpass-ending] should be analysed in line with the psych-verb constructions and that the modal meaning 'potential' of the passive constructions is correlated with sentence pattern and 'person structure'.

  • PDF

Is Category P Lexical or Functional?: A Generalized pP-Shell Approach

  • Hong, Sung-Shim;Yang, Xiaodong
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.71-84
    • /
    • 2010
  • The aim of this paper is to propose that a category P is encapsulated within a functional layer above the lexical layer, just like vP containing a lexical VP. As is well known, the category P has long been in the obscure domain of syntactic studies: Marantz (2001) and den Dikken (2003), for example, argue that P is a lexical category, but Emonds (1985), Grimshaw (1991), and Baker (2003), maintain that the category P is functional and is a closed category without its own intrinsic meaning. On the other hand, Zwart (2005) argues that it does have some meaning. Following the works of Svenonius (2003, 2006, 2007), and the spirit of Rizzi's (1997) split CP hypothesis, we elaborate and develop Svenonius' idea of split-pP analysis with detailed schematic representations of the novel examples in English, Korean, and Chinese in this paper. Unlike Svenonius, however, this paper incorporates KP into pP-Shell, which is a substantial simplification. Furthermore, Chinese Localizers that have long been considered as Postpositions are now under the category of Prepositions. This proposal renders an X-bar theoretic consistency over the categorical status of Chinese phrasal structures. In short, the present analysis accounts for inconsistency found in English complex preposition phrase (Quirk, et al, 1972, 1985), Chinese circumposition phrase (Ernst 1988, Liu, 2002) and Korean postposition phrase in a unified and consistent manner. Furthermore, by proposing a finer-grained phrasal architecture for the category P, the controversial status of the category subsides within this analysis.

  • PDF

내포문의 단문 분할을 이용한 한국어 구문 분석 (Korean Syntactic Analysis by Using Clausal Segmentation of Embedded Clause)

  • 이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.50-58
    • /
    • 2008
  • 한국어 문장은 대부분 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 복문에 나타나는 하나 이상의 용언으로 인해 구문 분석 과정에서 다양한 구문 애매성이 발생한다. 이들 중 대부분은 내포문의 수식 범위로부터 발생되는 구 부착의 문제 때문이다. 이런 구문 애매성은 내포문의 범위를 정해서 하나의 구문 범주의 기능을 가지도록 하면 해결할 수가 있다. 본 논문에서는 내포문의 범위를 정하기 위해서 문형과 한국어의 구문 특성을 이용한다. 먼저, 내포문에 있는 용언의 문형 정보가 가질 수 있는 필수격을 최대로 부착하여 내포문의 범위를 정하고 이를 이용해서 복문을 내포문과 주절로 분할한다. 그리고 한국어의 구문 특성을 이용해서 분할된 내포문의 기능을 하나의 구문 범주인 체언구나 부사구로 변환한다. 이렇게 함으로써 복합문의 구성 형태가 단문 구조로 변환되기 때문에 내포문의 범위에 의한 구 부착의 문제가 쉽게 해결된다. 이것을 본 논문에서는 내포문의 단문 분할이라고 한다. 본 논문에서 제안한 방법으로 1000 문장을 실험한 결과 문형과 단문 분할을 이용하지 않은 방법보다 구문 애매성이 88.32% 감소되었다.