• 제목/요약/키워드: syntactic structures

검색결과 92건 처리시간 0.025초

Representing Topic-Comment Structures in Chinese

  • Pan, Haihua;Hu, Jianhua
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.382-390
    • /
    • 2002
  • Shi (2000) claims that topics must be related to a syntactic position in the comment, thus denying the existence of dangling topics in Chinese. Under Shi's analysis, the dangling topic sentences in Chinese are not topic-comment but subject-predicate sentences. However, Shi's arguments are not without problems. In this paper we argue that topics in Chinese can be licensed not only by a syntactic gap but also by a semantic gap/variable without syntactic realization. Under our analysis, all the dangling topics discussed in Shi (2000) are, in fact, not subjects but topics licensed by a semantic gap/variable that can turn the relevant comment into an open predicate, thus licensing dangling topics and deriving well-formed topic-comment constructions. Our analysis fares better than Shi's in not only unifying the licensing mechanism of a topic to an open predicate without considering how the open predicate is derived, but also unifying the treatment of normal and dangling topics in Chinese,

  • PDF

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

프랑스어 억양구조에서 중간구의 음성적 실현 양상 (The Phonetic Realization of intermediate phrase in French Intonation)

  • 유혜옥;이은영
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.185-200
    • /
    • 2002
  • The current study confirmed the existence of an ip prosodic level in French intonation structure, as previously proposed by Sun-Ah Jun & $C\acute{e}cile$cile Fougeron (2000). However, in contrast to the previous suggestion of the plateau realized in an ip in several syntactic structures, the current study supposed that the plateau doesn't come from the different type of syntactic structures but arise from the unspecified syllables without any PA in an ip. Because if we limited ip phrasal tone to the syntactic structure, it would be difficult to find the more general reasons of ip level. Besides /Hi/ and /$H^*$/ we also used /$Hi^*$/ for the focused syllable in the current study. In emphasized sentences, in general, /$Hi^*$/ appeared in the first or second syllable of a leftward AP in an ip and /$H^*$/ in the final syllable of a rightmost AP of an ip, In contrast to these PAs, /$Hi^*$/ might appear in any syllable in an ip, but not to far from /$H^*$/ because the duration time and length t of plateau realized between /$Hi^*$/ and /$H^*$/ or /Hi/ and /$H^*$/ would make an essential harmonious rhythmic unit, Therefore, the current study determined the duration time and the number of syllables realized in each plateau in an ip level composed of more than one AP. As a phrase constituent structure, there is a practical need for intermediate prosodic units to allow for generalization over the many possible combinations of prosodic patterns that can occur. Further evidence is still needed to analyze and relate the different pitch ranges of the plateau of an ip according to the syntactic structure, to identify the considerable character in the French prosodic hierarchy.

  • PDF

A Simple Syntax for Complex Semantics

  • Lee, Kiyong
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.2-27
    • /
    • 2002
  • As pact of a long-ranged project that aims at establishing database-theoretic semantics as a model of computational semantics, this presentation focuses on the development of a syntactic component for processing strings of words or sentences to construct semantic data structures. For design arid modeling purposes, the present treatment will be restricted to the analysis of some problematic constructions of Korean involving semi-free word order, conjunction arid temporal anchoring, and adnominal modification and antecedent binding. The present work heavily relies on Hausser's (1999, 2000) SLIM theory for language that is based on surface compositionality, time-linearity arid two other conditions on natural language processing. Time-linear syntax for natural language has been shown to be conceptually simple and computationally efficient. The associated semantics is complex, however, because it must deal with situated language involving interactive multi-agents. Nevertheless, by processing input word strings in a time-linear mode, the syntax cart incrementally construct the necessary semantic structures for relevant queries and valid inferences. The fragment of Korean syntax will be implemented in Malaga, a C-type implementation language that was enriched for both programming and debugging purposes arid that was particluarly made suitable for implementing in Left-Associative Grammar. This presentation will show how the system of syntactic rules with constraining subrules processes Korean sentences in a step-by-step time-linear manner to incrementally construct semantic data structures that mainly specify relations with their argument, temporal, and binding structures.

  • PDF

통사적 복잡성과 분석적 척도의 언어 사용 점수간의 관계 탐색 (The Relationship between Syntactic Complexity Indices and Scores on Language Use in the Analytic Rating Scale)

  • 이영주
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.229-235
    • /
    • 2023
  • 본 연구는 자동화된 통사 구문 분석 프로그램인 TAASSC를 활용하여 통사적 복잡성 지표와 분석적 척도의 언어 사용 점수 간의 관계를 살펴본다. 본 연구에서는 ICNALE 코퍼스에서 영어를 외국어로 학습하는 EFL 학생이 작성한 에세이 440개를 분석하였고, 언어 사용 점수와 Lu의 전통적인 통사적 복잡성 지표, 구 복잡성 지표, 절 복잡성지표 간의 관계를 탐색하였다. 단계적 회귀분석 결과, 구 복잡성 지표가 분석적 척도의 언어 사용 점수를 가장 잘 예측하는 것으로 나타났으나 선행연구와는 달리 언어 사용 점수를 차지하는 변량은 낮았다. 본 연구결과를 토대로 구수준에서의 통사구문에 대한 지도와 연습이 필요하다는 쓰기 교육의 시사점을 제시한다.

'Because of Doing' and 'Because of Happening': A Corpus-based Analysis of Korean Causal Conjunctives, -nula(ko) and -nun palamey

  • Oh, Sang-Suk
    • 한국언어정보학회지:언어와정보
    • /
    • 제8권2호
    • /
    • pp.131-147
    • /
    • 2004
  • the two Korean causal conjunctive suffixes, -nula(ko) and -nun palamey, based on corpus linguistic analysis. Many of the linguistic accounts available, both in pedagogical reference and in the literature on linguistics, provide incomplete analyses of these suffixes, based on fabricated linguistic data. Using naturally occurring, real linguistic data, this paper examines the syntactic and semantic structures of the two causal suffixes through a consideration of three areas of corpus linguistic analysis: token frequencies, collocations, and semantic prosody. An analysis based on concordance data reveals that the two causal connectives, -nula(ko) and -nun palamey, have more differences than similarities in terms of syntactic and semantic constraints. The idiosyncratic structures of the two suffixes are discussed in terms of same subject condition, verb selection, same agent condition, synchronicity condition, and negative semantic prosody.

  • PDF

노년층의 글쓰기 특성 -이야기문법과 구문구조 (Characteristics of Narrative Writing in Normal Aging: Story Grammar and Syntactic Structure)

  • 김현아;원새롬;이보은;윤지혜
    • 재활복지
    • /
    • 제21권1호
    • /
    • pp.193-212
    • /
    • 2017
  • 노년층은 이야기를 산출하면서 주제로부터 벗어나는 이야기를 하거나 문장구조를 단순화하기도 하며 문법 형태소의 오류를 보일 수 있다. 이야기를 말하는 능력과 글로 쓰는 능력은 서로 다를 수 있는데, 글을 쓰는 능력은 복잡한 인지과정을 필요로 하므로 노화에 더 취약할 수 있다. 이에 본 연구는 정상 노년층 32명과 청년층 32명을 대상으로 이야기 쓰기 능력을 살펴보았다. 과제는 전래동화('흥부놀부')에 대한 그림들을 보고 자유롭게 이야기를 구성하여 써보도록 하였다. 자료 분석 시에는 이야기 구성적 측면과 이야기 구문구조적 측면으로 나누어 그 특성을 확인하였다. 연구결과, 노년층은 청년층에 비하여 이야기 구성적으로는 이야기문법과 완전한 에피소드의 수가 유의하게 적었으며 주제에서 벗어난 문장을 더 많이 산출하였다. 구문구조적으로는 복문의 사용빈도는 청년층과 차이가 없었으나 관형절과 부사절 내포문의 사용이 저하되고 부적절한 결속표지를 많이 산출하였다. 이러한 결과는 노년층이 이야기 글쓰기를 할 때 주제의 유지가 저하되고 수식적으로 꾸며주는 표현의 사용이 부족하게 되면서 전체적인 글의 응집성이 저하되지만 쓰기 활동의 시각적 피드백에 도움을 받을 수 있게 되므로 긴 복문의 사용이 가능할 수 있었음을 시사한다.

의존문법 기반의 구간 분할법을 활용한 한국어 구문 분석기 (Korean Parser Using Segmentation Based on Dependency Grammar)

  • 박용욱
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1705-1712
    • /
    • 2009
  • 최근 대부분의 한국어 구문분석기는 의존문법(Dependency Grammar)을 사용하고 있는데, 그 이유는 한국어의 특성인 어순이 비교적 자유롭고 생략이 잦은 문장에 대한 처리가 용이하기 때문이다. 하지만 의존문법을 이용한 한국어 구문분석은 많은 중의성을 도출하는 문제점이 대두되고 있다. 본 논문에서는 이러한 중의성을 보다 효과적으로 해결하기 위하여 200개가 넘는 의존문법 규칙과 문장의 구성성분을 이용한 구간분할방법, 관형형어미가 붙은 용언에 대한 처리 및 같은 용언에 중복된 구성성분 결합제한 방법을 사용한 구문분석기를 제안한다. 실험 결과 중의성 제거에 많은 효과가 있음을 보여준다.

Probing Sentence Embeddings in L2 Learners' LSTM Neural Language Models Using Adaptation Learning

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.13-23
    • /
    • 2022
  • Prasad et al.는 사전학습(pre-trained)한 신경망 L1 글로다바(Gulordava) 언어모델을 여러 유형의 영어 관계절과 등위절 문장들로 적응 학습(adaptation learning)시켜 문장 간 유사성(sentence similarity)을 평가할 수 있는 통사 프라이밍(syntactic priming)-기반 프로빙 방법((probing method)을 제안했다. 본 논문에서는 한국인 영어학습자가 배우는 영어 자료를 바탕으로 훈련된 L2 LSTM 신경망 언어 모델의 영어 관계절 혹은 등위절 구조의 문장들에 대한 임베딩 표현 방식을 평가하기 위하여 프로빙 방법을 적용한다. 프로빙 실험은 사전 학습한 LSTM 언어 모델을 기반으로 추가로 적응 학습을 시킨 LSTM 언어 모델을 사용하여 문장 임베딩 벡터 표현의 통사적 속성을 추적한다. 이 프로빙 실험을 위한 데이터셋은 문장의 통사 구조를 생성하는 템플릿을 사용하여 자동으로 구축했다. 특히, 프로빙 과제별 문장의 통사적 속성을 분류하기 위해 통사 프라이밍을 이용한 언어 모델의 적응 효과(adaptation effect)를 측정했다. 영어 문장에 대한 언어 모델의 적응 효과와 통사적 속성 관계를 복합적으로 통계분석하기 위해 선형 혼합효과 모형(linear mixed-effects model) 분석을 수행했다. 제안한 L2 LSTM 언어 모델이 베이스라인 L1 글로다바 언어 모델과 비교했을 때, 프로빙 과제별 동일한 양상을 공유함을 확인했다. 또한 L2 LSTM 언어 모델은 다양한 관계절 혹은 등위절이 있는 문장들을 임베딩 표현할 때 관계절 혹은 등위절 세부 유형별로 통사적 속성에 따라 계층 구조로 구분하고 있음을 확인했다.

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF