• Title/Summary/Keyword: 통사적 특징

Search Result 43, Processing Time 0.023 seconds

Korean Surface Realizer Based on Topic-Comment Structure (토픽-코멘트 구조에 기반한 한국어 표층 생성기)

  • Kim, Jung-Eun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.503-508
    • /
    • 2001
  • 본 논문은 자연언어생성 기술을 이용하여 질병에 대한 기술문을 생성해 내는 시스템에서 사용되는 표층 생성기에 대해서 다루고 있다. 표층 생성기는 문장의 추상적인 표현으로부터 통사적으로, 형태론적으로 올바른 텍스트로 생성하여 내는 것을 목표로 한다. 질병에 관한 기술문에 있는 문장들은 두가지 특징을 가지고 있다. 첫번째로, 질병 기술문의 문장들은 토픽-코멘트 구조로 나타내어질 수 있다. 두번째로, 같은 의미 범주에 속하는 문장들은 같은 토픽을 가진다. 따라서, 토픽은 의미범주로부터 유추될 수 있으므로 표층 생성기의 입력인 구 명세 (phrase specification)에 표현될 필요가 없다. 본 논문에서는 이런 특징을 이용하여 효율적인 표층 생성기를 만들기 위하여 표층 생성의 단계를 내부 표현 생성과 외부 문장 생성의 두 단계로 나누었다. 내부 표현 생성 단계에서는 코멘트에 해당하는 부분을 생성하고 외부 문장 생성 단계에서 의미범주 태그에 따라 토픽을 첨가하여 최종 문장으로 생성하였다. 이런 방법으로 실험한 결과, 본 표층 생성기는 문법에 맞으면서 자연스러운 텍스트를 생성해 낸다는 것을 알 수 있었다.

  • PDF

Studies on the linguistic properties of the IT-People documents for an efficient Information Retrieval (IT 인물 관련 텍스트 정보의 효율적인 검색을 위한 Sub-language의 속성 연구)

  • Koh, Seung-Hui;Kim, So-Yeon;Cheon, Seung-Mi;Nam, Jee-Sun;Kim, Kweon-Yang;Park, Se-Young;Berlocher, Ivan
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.241-249
    • /
    • 2007
  • 본 연구는 IT 인물 관련 텍스트 정보의 효율적인 검색을 위하여 문서 내에서 인물과 관련된 정보를 담고 있는 문장들이 어떠한 특징을 가지고 실현되는가를 살펴보고 언어적 속성을 어떻게 구조화하고 형식화할 것인가를 논의하는 것을 목적으로 한다. 언어적 속성 분석을 위해서 전자신문 내에서 인물 관련 코퍼스를 수집하고 이들의 분석을 통해 다음과 같이 문제가 되는 특징들을 확인하였다. 즉 외래어 음차 표기문제, 복합명사 및 명사구 그리고 서술 명사적 표현의 문제 등으로 요약된다. IT라는 특정 영역에 대해 텍스트 내에서의 어휘-통사적 패턴을 분석하고 언어적 특징에 대한 효율적 기술을 위해서는 LGG 부분 문법 그래프 모델을 활용하도록 한다. 본 연구는 특정 영역인 IT 관련 문서에서 자연언어 텍스트를 대상으로 정보 검색할 때 문제가 되는 다양한 언어학적 현상들을 다루며, 향후보다 확장된 영역에서의 효율적 언어 처리에 대한 방법론적 대안을 제시할 수 있을 것으로 기대된다.

  • PDF

Prosodic Realization of Korean Focus (국어 초점의 운율적 실현)

  • Kim Sunh
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.317-320
    • /
    • 2002
  • 본 논문에서는 초점 연구를 위해 통사-의미론적인 검증을 거친 질의-응답문 각각 120쌍을 녹취한 음성 자료를, K-ToBI를 이용하여 분절 표기(segmentation & labeling)한 것을 토대로 초점이 실제로 강세를 가지고 실현되는지, 강세를 가지고 실현되는 경우와 그렇지 않은 경우 그 액센트구는 어떤 유형인지, 그리고 초점이 나타나는 경우에 강세 외의 다른 운율적 특징이 나타나는지와 그러한 경우에 그 특징이 무엇인지 등의 문제를 중심으로 하여 국어 초점의 운율적 실현에 관하여 살펴 보았다.

  • PDF

The semantic of Korean Reiprocal Expressions (한국어 상호 표현(Reciprocal Expressions)의 의미 상호성 술어와 배분적 양화사의 의미 기여를 중심으로)

  • 조지은;남승호;이정민
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.121-127
    • /
    • 2000
  • 지금까지 상호 표현(reciprocal expressions)이나 상호성(reciprocity)의 개념에 대한 연구는 영어의 'each other'를 중심으로 이뤄졌다. 그런데 한국어의 상호 대명사 '서로'는 'each other'와 달리, 그 자체로 배분성(distributivity)을 갖지 않는다. 오히려 다양한 배분 표현들과 공기함으로써 상호성을 구체화한다. 특히, 배분적 양화사는 상호 표현이 쓰인 문장에 강한 상호성(strong reciprocity)을 부여한다. 이외에도 한국어의 상호성 실현에는 함께 쓰인 술어가 중요한 역할을 한다. 우선, 술어가 대칭적(symmetric)이거나, 상호 대명사(reciprocal)'서로'를 논항으로 취하면, 문장은 일차적으로 상호성을 갖게된다. 또한, 술어가 반가법(anti-additive)함수로서의 의미 특성을 갖는 경우는, 논항이 복수 연접 명사구로 구성되었을 때, 논항을 그룹(group)으로 해석하는 것을 선호한다. 본고는 상호성 술어(reciprocated predicates)와 배분적 양화사의 의미 기여를 중심으로, 한국어 상호 표현의 다양한 의미·통사적 특징을 밝히는 것을 목표로 하며, 이를 통해 상호성의 개념이 고정적이거나 문맥에 따라, 임의로 정해지는 무질서한 것이 아니라, 함께 쓰인 배분적 양화사나 술어의 의미 특성에 따라 합성적으로(compositionally) 실현되는 것임을 보이고자 하였다.

  • PDF

Topic Continuity in Korean Narrative (한국 설화문에서 주제표현의 연속성)

  • Chong, Hi-Ja
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.288-295
    • /
    • 1989
  • 언어사용 목적이 효율적인 정보교환에 있다. 정보교환에 필요한 의미는 하나의 문에서보다는 담화에서 전달되기 때문에 담화분석을 토대로 의미, 형식, 기능의 관계를 검토하여 언어의 한 현상을 기술하는 것이 보다 중요하다. 본 연구는 자료분석을 토대로 한국 설화문에서 주제표현의 방식과 연속성의 정도를 살펴보았다. 측정된 구문들은 영조응, 인칭대명사, 지시대명사, 지시사 뒤에 오는 명사, 소유격을 따르는 명사, 한정적 명사. 비한정적 명사, 조건절, 모두 8개 구조들이다. 이들은 주제표현의 연속성 정도의 차이를 보여 준다. 이는 이들의 통사적 특징이외에 다른 화용상의 요인들이 작용함으로 생기는 현상이다.

  • PDF

Combinatory Categorial Grammar and Parsing (결합범주문법과 구문분석)

  • Cho, Hyung-Joon;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.223-230
    • /
    • 1999
  • 본 논문에서는 결합범주문법으로 한국어를 처리할 때 구문분석과정에서 복잡도를 높이는 역할을 하는 spurious ambiguity와 구조적 모호성이 있는 명사구 접속에 대해서 논한다. 통사적 처리와 의미적 처리가 동시에 수행되는 결합범주문법의 특징을 사용해서 spurious ambiguity로 인해 발생하는 복잡도를 줄이는 방안을 제시하고 접속항에서 접속의 중심이 되는 명사들 간의 공기유사도를 이용해서 접속항 선정에서 발생하는 복잡도와 오분석을 줄이는 방안을 제시한 뒤 이의 개선방안을 논의한다.

  • PDF

대중역사서 어떻게 자리매김할까

  • Kim, Yeon-Su
    • The Korean Publising Journal, Monthly
    • /
    • s.245
    • /
    • pp.19-19
    • /
    • 1998
  • 대중역사서를 둘러싸고 학계와 출판계에서 '소설이다', '학계가 못한 일을 했다'는 평가가 엇갈리고 있다. 최근 대중역사서 시장에 조금씩 변화가 일면서 '학계에서 소외된 필자, 이야기체의 통사'라는 대중역사서의 특징도 '전공자.특정 분야'로 바뀌어간다. 학계가 자신의 연구성과를 대중적으로 풀어내는 일이 과제로 남는다.

  • PDF

Building Korean Multi-word Expression Lexicons and Grammars Represented by Finite-State Graphs for FbSA of Cosmetic Reviews (화장품 후기글의 자질기반 감성분석을 위한 다단어 표현의 유한그래프 사전 및 문법 구축)

  • Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Choi, Seong-Yong;Shin, Dong-Heouk;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.400-405
    • /
    • 2018
  • 본 연구는 한국어 화장품 리뷰 코퍼스의 자질기반 감성 분석을 위하여, 이 도메인에서 실현되는 중요한 다단어 표현(MWE)의 유한상태 그래프 사전과 문법을 구축하는 방법론을 제시하고, 실제 구축된 사전과 문법의 성능을 평가하는 것을 목표로 한다. 본 연구에서는 자연어처리(NLP)에서 중요한 화두로 논의되어 온 MWE의 어휘-통사적 특징을 부분문법 그래프(LGG)로 형식화하였다. 화장품 리뷰 코퍼스에 DECO 한국어 전자사전을 적용하여 어휘 빈도 통계를 획득하고 이에 대한 언어학적 분석을 통해 극성 MWE(Polarity-MWE)와 화제 MWE(Topic MWE)의 전체 네 가지 하위 범주를 분류하였다. 또한 각 모듈간의 상호관계에 대한 어휘-통사적 속성을 반복적으로 적용하는 이중 증식(double-propagation)을 통해 자원을 확장하였다. 이 과정을 통해 구축된 대용량 MWE 유한그래프 사전 DECO-MWE의 성능을 테스트한 결과 각각 0.844(Pol-MWE), 0.742(Top-MWE)의 조화평균을 보였다. 이를 통해 본 연구에서 제안하는 MWE 언어자원 구축 방법론이 다양한 도메인에서 활용될 수 있고 향후 자질기반 감성 분석에 중요한 자원이 될 것임을 확인하였다.

  • PDF

Syntactic Ambiguities and their Resolution in Prosody in Japanese (일본어 유악센트 방언과 무악센트 방언의 통사적 애매성의 해소와 운율적 특징)

  • Choi, Young-Sook
    • Speech Sciences
    • /
    • v.9 no.3
    • /
    • pp.211-221
    • /
    • 2002
  • The prosody can play a crucial role in differentiating ambiguous sentences to correctly reflect their intended syntactic structures. In what way do the speakers in Tokyo and Sendai dialects of Japanese use prosodic elements to differentiate syntactic ambiguities? Acoustic measurement was made of utterances of ambiguous sentences in Japanese to observe prosodic strategies for disambiguation. Materials were sentences of the type ADV-VP1-NP-VP2, ADV-NP1-NP2-VP2, where the ambiguity lies in locative adverbial modification, ADV modifying either VP1 or VP2. For this construction the Japanese create the same ambiguities. After defining the depth of a syntactic boundary, F0 of the phrase before and after the boundary, and duration of the syllable and pause before the boundary were measured. The results show that Tokyo dialects speakers use F0 after syntactic boundary, and Sendai dialects speakers use of the syllable and/or pause before the boundary.

  • PDF

중국 황도화(黃島話)의 'NP1+VP+기(起)+NP2'구문에 관한 초보적 고찰

  • Chae, Chun-Ok
    • 중국학논총
    • /
    • no.63
    • /
    • pp.65-90
    • /
    • 2019
  • In Huangdao Dialect, the "NP1+VP+起+NP2" sentence structure can not only be used with monosyllabic and bisyllabic adjectives and active adjectives, but also with passive adjectives. The usage of the VP is broader in Huangdao Dialect than in Qingdao dialect in case it is a verb phrase. The negative of "NP1+VP+起+NP2" sentence structure uses "不" or "沒有." If common comparative element can be found between NP1 and NP2, the negative particles are used at the beginning of the sentence in general to generate topic sentences. NP1 is often a common noun, modifying phrase, and quantifying phrase, while it can also be a verb-object phrase or modifying phrase. Huangdao Dialect may exhibit specific quantifying phrases that express comparative differences. The inquisitive style of "NP1+VP+起+NP2" sentence structure include appending a question mark at the end of the sentence, combining the positive and negative forms of the adjective, and appending "'是沒" or "是不是" in the front of the adjective.