• Title/Summary/Keyword: 한국어 의미 분석

Search Result 480, Processing Time 0.022 seconds

Implementation of Dependency Parser using Argument Information based on Korean WordNet (한국어 어휘의미망에 기반한 논항 정보를 이용한 의존문법 구문분석기의 구현)

  • Im, Gyeong-Eop;Jung, Youngim;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.158-164
    • /
    • 2007
  • 한국어는 한 어절이 한 개 이상의 형태소로 이루어졌으며, 이 때문에 지역 중의성이 발생한다. 대부분의 선행 연구에서는 이러한 지역 중의성을 배제하거나, 태거를 사용하여 지역 중의성을 제거해왔다. 본 연구에서는 문장의 모든 형태소 분석에 대해 구문분석을 시도하며, 중의성을 제거하고자 적용된 의존문법 규칙과 구 묶음, 부사 하위범주화, 논항 정보 사전 이용 등의 다양한 기법을 설명하고, 구문분석 성능을 실험으로 나타낸다. 특히, 말뭉치마다 논항 정보 사전을 따로 구축하는 번거로움을 피하고자 한국어 어휘의미망을 사용한다.

  • PDF

An Analysis on Noun Phrases in Situation Semantics (상황의미론에 의한 명사구의 의미분석)

  • Kyong, Chung-Sook
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.261-267
    • /
    • 1993
  • Barwise & Cooper (1991)는 Hans Kamp(1981)의 DRS(Discourse Representation structure)를 기초로 EKN(Extended Kamp Notation)을 개발하였다. 본 논문은 EKN을 통해 실제 자연언어의 의미를 분석하는 데 그 목적이었다. 특히 이 논문은 양화사 의미해석의 기본개념이 되는 자원상황(resource situation), 치역(range), 사건(event) 등의 개념을 구체화하여 영어나 한국어 명사구의 누적성과 의존성에 관련된 의미를 분석한다. '세명의 학생이 (비디오 가게에서) 영화 일곱편을 빌렸다'라는 표현은 '학생'과 '영화'의 배분성 ${\pm}$ 과 집합성 ${\pm}$ 에 의한 일곱가지 해석 이외에 '세명의 학생이 각자 빌린 영화들이 일곱가지'라는 누적적 해석도 가능하다. 이러한 명사구의 누적적 해석에 대하여 분석하고, 'John always wears a tie,. They, were all silk,'에서 'a tie'와 'they'가 공지표화(i) 되기 위한 통사적 요건(성, 수의 일치)을 충족하지 않는 의존적 복수에 대하여도 분석한다.

  • PDF

Representing & Analyzing QLFs for Korean ATIS Queries (한국어 ATIS 질의문의 QLF 표현과 분석방법에 관한 고찰)

  • 박현석
    • Korean Journal of Cognitive Science
    • /
    • v.10 no.2
    • /
    • pp.17-25
    • /
    • 1999
  • In developing a Korean database interfacing system exist many difficult problems which are not usually pointed out in developing an English version. Basically the difficulty in implementing deep level Korean database interfacing system lies in the fact that Korean has fewer syntactic restrictions. This means that while less burden will be placed on semantic analysis more burden will be placed on contextual processing for Korean when compared to English. This paper discusses various difficulties which we came across while developing a prototype Korean DB interfacing system (the Korean Core L Language Engine) especially focusing on issues of representing and resolving Quasi Logical Forms.

  • PDF

Semantic Role Assignment for Korean Adverbial Case Using Sejong Electronic Dictionary (세종전자사전을 이용한 한국어 부사격의 의미역 결정)

  • Shin, Myung-Chul;Lee, Yong-Hun;Kim, Mi-Young;Chung, You-Jin;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.120-126
    • /
    • 2005
  • 세종전자사전의 용언사전과 체언사전에 기재된 용언의 격틀과 명사의 의미부류는 문장의 의미분석을 위한 핵심적인 언어자원이다. 본 논문에서는 용언사전을 전산처리가 용이한 격틀사전으로 변형한 다음 이를 이용한 의미역 결정 시스템을 구축하였고 기계학습 방법에 기반한 의미역 결정 시스템과 혼합하여 한국어에 있어 '에, 로'를 격표지로 하는 부사격에 대한 의미역 결정 방법에 대해 다루고 있다.

  • PDF

Word Sense Disambiguation using Word2Vec (Word2Vec를 이용한 단어 의미 모호성 해소)

  • Kang, Myung Yun;Kim, Bogyum;Lee, Jae Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.81-84
    • /
    • 2015
  • 자연어 문서에 출현하는 단어에는 중의적 단어가 있으며, 이 단어에서 발생되는 의미 모호성은 대개 그 문맥에 따라 해소된다. 의미 모호성 해소 연구 중, 한국어 단어 공간 모델 방법은 의미 태그 부착 말뭉치를 이용하여 단어의 문맥 정보를 구축하고 이를 이용하여 모호성을 해결하는 연구로서 비교적 좋은 성능을 보였다. 본 연구에서는 Word2Vec를 이용하여 기존 연구인 한국어 단어 공간 모델의 단어 벡터를 효과적으로 축소할 수 있는 방법을 제안한다. 세종 형태 의미 분석 말뭉치로 실험한 결과, 제안한 방법이 기존 성능인 93.99%와 유사한 93.32%의 정확률을 보이면서도 약 7.6배의 속도 향상이 있었다.

  • PDF

Optional features for speeding up UTagger (UTagger의 속도 향상을 위한 선택적 기능제한)

  • Shin, Joon-Choul;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.113-116
    • /
    • 2012
  • UTagger는 한국어 의미 처리를 위해 개발된 형태소분석기이며 의미 분열 기능도 가지고 있다. 정확률이 매우 높고 다앙한 기능을 갖추고 있으나 이전에 개발된 다른 형태소 분석기에 비하여 속도가 느리다는 단점을 가지고 있었다. 형태소 분석기의 빠른 속도는 많은 분야에서 요구되고 있기 때문에 본 논문에서는 UTagger의 정확률을 유지하면서 속도를 향상시키는 캐시(Cache) 방법과, 정확률을 조금 낮추면서 향상시키는 다앙한 방법들을 제시한다. 또한 상황에 따라 적합한 방법을 선택할 때 참조가 되도록 하기 위해 각 방법들 실험 결과를 정리한다.

  • PDF

A Conjunctive Generation of Korean Subordinating Adverb Clause using Feature Information In English-Korean Machine Translation (영한기계번역에서 자질정보를 이용한 한국어 종속부사절의 연결어미 생성)

  • Lee, Young-Woo;Ahn, Dong-Un;Chung, Sung-Jong
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.110-114
    • /
    • 1999
  • 영한기계번역에서 영문의 복합문중 종속부사절이 한국어로 생성될 때, 종속절의 주절에 대한 의미에 따라 다양한 한국어 연결어미를 생성하게 된다. 주절의 의미를 보완하는 종속절은 그 연결어미에 의해 그 역할이 결정되는 것이다. 종속부사절을 이끄는 부사어는 연결어미로 재현되는데 기존의 사전을 기반으로 하는 기계번역시스템에서 사전에 있는 부사어의 표층어만을 이용하였기 때문에 그 생성결과가 만족스럽지 않았다. 영문의 부사어중의 일부는 한국어로 생성될 때 의미적 구분에 따라 여러 가지의 연결어미로 생성이 되어야 하는데 영어 해석에서 종속절의 의미 정보를 충분히 분석하지 못하는 경우가 많다. 본 연구에서는 종속부사절을 이끄는 영어의 부사어와 각 부사어가 생성될 때 필요한 한국어 연결어미를 정리하였다. 또한, 형태소와 구문 자질정보를 이용하여 여러 연결어미를 갖는 부사어의 경우에 하나의 연결어미를 선택한다.

  • PDF

Syllables-based Named Entity Extraction and Automatic Corpus Construction using Bidirectional Dynamic LSTM (Bidirectional Dynamic LSTM을 이용한 음절 단위 개체명 추출 및 자동화된 말뭉치 구축)

  • Oh, Sungsik;Lim, Changdae;Ahn, Keeho;Park, Weijin
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.317-320
    • /
    • 2017
  • 개체명 인식은 자연어 문장에서 장소, 제작물, 사람 등 분류를 통한 의미 부여가 가능한 단어를 파악하는 기술로서 의미 분석을 위한 핵심 기술이다. 현재 많은 개체명 분석 관련 연구들은 형태소 분석 결과에 의존적인 형태를 갖고 있어서, 형태소 분석 결과의 정확성이 개체명 분석 결과의 성능에 영향을 미치고 있다. 본 연구에서는 형태소 분석 과정을 거치지 않는 음절 기반의 개체명 분석 기술을 제안하여 형태소 분석의 정확도가 낮은 통신어, 신조어 분석 성능을 향상하였다. 또한, 자동화된 방법으로 음절 단위 개체명 말뭉치 및 개체명 사전을 구축하는 프로세스를 정의하여 개체명 분석의 정확도 향상 및 인지 범주의 확대를 도모하였다. 본 연구에서 제안한 개체명 인식 기술은 한국어 개체명 표준에 기반한 129가지의 개체명 분류가 가능하며, 이는 자연어 처리 기술이 필요한 산업계에서 상용화하는데 큰 기여를 할 것으로 판단된다.

  • PDF

Lexical Ambiguity Resolution System of Korean Language using Dependency Grammar and Collative Semantics (의존 문법과 대조 의미론을 이용한 한국어의 어휘적 중의성 해결 시스템)

  • 윤근수;권혁철
    • Korean Journal of Cognitive Science
    • /
    • v.3 no.1
    • /
    • pp.1-24
    • /
    • 1991
  • This paper presents the Lexical Ambiguity Resolution System of Korean Language. This system uses Dependency grammar and Collative Semantics. Dependency grammar is used to analyze Korean syntactic dependency. A robust way to analyze a sentence is to establish links between individual words. Collative Semantics investigates the interplay between lexical ambiguity and semantics relations. Collative Semantics consists of sense-frame, semantic vector, collation, and screening. Our system was implemented by C programming language. This system analyzes sentences, discriminates the kinds of semantic relation between pairs of words senses in those sentences, and resolves lexical ambiguity.