• Title/Summary/Keyword: 대용어

Search Result 148, Processing Time 0.023 seconds

Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique (무형대용어 해결 기술을 이용한 백과사전 표제어 복원)

  • Hwang, Min-Kook;Kim, Young-Tae;Ra, Dongyul;Lim, Soojong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

Building a Korean Zero-Anaphora Detection and Resolution Corpus in Korean Discourse Using UWordMap (담화에서의 어휘지도를 이용한 한국어 무형대용어 탐지 및 해결 말뭉치 생성)

  • Yoon, Ho;Namgoong, Young;Park, Hyuk-Ro;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.591-594
    • /
    • 2020
  • 담화에서 의미를 전달하는 데 문제가 없을 경우에는 문장성분을 생략하여 표현한다. 생략된 문장성분을 무형대용어(zero anaphora)라고 한다. 무형대용어를 복원하기 위해서는 무형대용어 탐지와 무형대용어 해결이 필요하다. 무형대용어 탐지란 문장 내에서 생략된 필수성분을 찾는 것이고, 무형대용어 해결이란 무형대용어에 알맞은 문장성분을 찾아내는 것이다. 본 논문에서는 담화에서의 무형대용어 탐지 및 해결을 위한 말뭉치 생성 방법을 제안한다. 먼저 기존의 세종 구어 말뭉치에서 어휘지도를 이용하여 무형대용어를 복원한다. 이를 위해 본 논문에서는 동형이의어 부착과 어휘지도를 이용해서 무형대용어를 복원하고 복원된 무형대용어에 대한 오류를 수정하고 그 선행어(antecedent)를 수동으로 결정함으로써 무형대용어 해결 말뭉치를 생성한다. 총 58,896 문장에서 126,720개의 무형대용어를 복원하였으며, 약 90%의 정확률을 보였다. 앞으로 심층학습 등의 방법을 활용하여 성능을 개선할 계획이다.

  • PDF

The Anaphoric Theory of Reference and Objections Against It (지칭의 대용어 이론과 이에 대한 비판들)

  • Lee, Byeongdeok
    • Korean Journal of Logic
    • /
    • v.18 no.2
    • /
    • pp.217-241
    • /
    • 2015
  • Brandom upholds the anaphoric theory of reference. On this theory, reference is a relation of anaphoric dependence between linguistic items rather than a substantial relation between linguistic items and non-linguistic objects. In addition, 'refers' is a pronoun-forming operator, which is used to form anaphorically indirect descriptions such as 'the one referred to as "Leibniz"'. Recently, Arbid $B{\aa}ve$ raises three objections against this theory. First, the anaphoric theory distinguishes between ordinary descriptions and anaphorically indirect descriptions in terms of iterability. But this condition is not an adequate ground for asserting that anaphorically indirect descriptions form a distinctive semantic category. Second, sentences containing a pronoun such as 'he' and sentences containing an anaphorically indirect description such as 'the one referred to as "Leibniz"' have different modal statuses. Consequently, indirect descriptions are semantically different from paradigmatic anaphors. Third, on the anaphoric theory, expressions of the form 'a' and the corresponding indirect descriptions of the form 'the one referred to as "a"' are intersubstitutable. But we can make an equivalent claim by using the more general semantic concepts such as equivalence and intersubstitutability, instead of using notions such as 'anaphor' and 'antecedent'. So the anaphoric theory is explanatorily idle. In this paper I argue that these objections do not pose a serious problem for the anaphoric theory of reference. I argue thereby that the anaphoric theory of reference is a promising theory which provides us with the right understanding of the expression 'refers'.

  • PDF

A Resolution of Text Anaphora using Unidirection Chart Parsing in HPSG (중심어 주도 단방향 차트 파싱을 이용한 문맥 대용어 해결)

  • Kim, Jung-Hae;Jo, Jun-Mo;Lee, Sang-Kook;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.386-392
    • /
    • 1996
  • 대용어(anaphor)는 한 문장이나 문장과 문장간에 같은 요소가 되풀이될 때 언어 사용의 경제성(language economy)을 위하여 잉여적 표현을 제거하는 방법으로, 좀 더 간략한 언어 표현으로 대치하여 쓰는 현상이다. 따라서 본 논문에서는 중심어 주도의 단방향 활성 차트 파싱을 이용하여 한국어 문장내에서 야기되는 문맥 대용어의 해결 방안에 대해 제안한다. 이는 자연어를 입력으로 하는 실용목적의 자연어처리 시스템 구축에 있어 필수적으로 요구되는 부분이다. 대용어 해결을 위해 먼저 전산학적인 대용어 정의를 내리고, 대용어와 선행어사이의 의미 분류 및 대용어 해결 과정에 필요한 처리 조건등을 설정하였다 또한 파서내에 대용어 처리를 위해 사전내 자질구조로 ANAPMAJ, ANAPMIN, PERSON, NUM, INDEX자질을 추가하였고, 대용어 해결을 위한 알고리즘을 제안하였으며, 기존에 개발된 HPSG 파서가 처리하는 모든 문장에서 야기된 문맥 대용을 해결하여 파서이후의 응용 시스템에서 이용할 수 있는 내적 표현을 보다 분명하게 형식화하였다.

  • PDF

Resolution of Anaphoric Noun Phrases using a Centering Algorithm with a Dual Cache Model in a Multimodal Dialogue System (다중모드 대화 시스템에서 이중 캐시 모델의 센터링 알고리즘을 이용한 명사 대용어구 처리)

  • Kim, Hak-Su;Seo, Jeong-Yeon
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.11
    • /
    • pp.1133-1140
    • /
    • 2000
  • 다중모드 대화에서 나타나는 대용어는 언어만을 사용하는 대화에서 나타나는 것과 비교하여 매우 다른 형태와 특징을 가진다. 그것은 행위나 시각이 대용 행위로 사용될 수 있기 때문이다. 본 논문에서는 터치스크린 인터페이스를 이용한 홈쇼핑 가구점 영역의 다중모드 대화 시스템에서 나타나는 다양한 대용어의 처리 방법을 알아본다. 먼저, 화면 대용어와 참조 대용어를 정의하여 다양한 형태의 대용어를 분류한다. 그리고 각 대용어를 처리할 수 있는 두 가지의 일반적인 방법을 제안한다. 하나는 지시 행위를 수반하거나 생략한 채 발화되어 현재 화면에 나타나 있는 아이템을 참조하는 대용어를 처리하는 단순한 매핑 알고리즘이다. 다른 하나는 다중 모드 대화 시스템을 위해 워커(Walker)의 센터링 알고리즘을 확장한 이중 캐시 구조의 센터링 알고리즘이다. 확장된 센터링 알고리즘은 발화와시각 정보 그리고 화면 전환 시간을 유지할 수 있기 때문에 다중모드 대화에서 발생하는 다양한 대용어를 처리하기에 적합하다. 실험에서 제안된 시스템은 40개의 대화에서 나타난 402개의 대용어(발화당 0.54)중에서 387개를 처리하여 96.3%의 정확도를 보였다.

  • PDF

Zero Anaphora Resolution in Korean Complex Sentences (한국어 복합문의 영 대용어 해결)

  • 김미진;강보영;구상옥;박미성;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.694-696
    • /
    • 2002
  • 본 논문은 한국어 복합문에서의 영 대용어 해결을 위해 복합문 분해 알고리즘과 영 대용어 복원규칙을 제안하고, 해결 방법을 제시한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 활용 어미들을 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.

  • PDF

Resolution of Deictic Anaphora in Real Multimodal Environments (실제 멀티모달 환경에서의 지시 대용어 처리)

  • Choi, Maengsik;Lee, Sehee;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.151-155
    • /
    • 2008
  • 언어기반 대화 시스템에서는 시스템과 사용자의 대화가 발화 자체만으로 이루어지기 때문에 사용자가 사람과 대화하는 것처럼 지시 대용어를 사용할 수 없어서 불편하다. 그리고 사용자의 발화 의미를 시스템이 정확하게 해석하기가 어렵다. 하지만 이런 언어기반 대화 시스템과는 달리 멀티모달 대화 시스템에서는 발화 자체의 정보뿐만이 아닌 제스처와 같은 발화 이외의 행위 정보들이 포함되는데 이 정보를 이용하면 지시 대용어의 처리가 가능해짐으로 시스템과의 대화가 좀 더 자연스러워진다. 본 논문에서는 군집화와 격틀을 이용하여 여러 사물들 중에서 지시 대용어가 될 가능성이 있는 지시 후보 선정을 한다. 그리고 특출성 점수와 엔트로피를 이용하여 후보 사물들 중에서 지시 대용어가 될 수 있는 대상을 선택하는 알고리즘을 제안한다. 시뮬레이션 환경에서의 실험결과 평균 2.8번의 상호작용으로 지시 대용어를 처리할 수 있었다.

  • PDF

Anaphoric Reference Resolution in Expository Text: The Effects of Ellipsis (설명문의 대용어 참조해결과정: 대용어와 지시사 생략 효과)

  • Lee, Jae-Ho
    • Korean Journal of Cognitive Science
    • /
    • v.21 no.2
    • /
    • pp.253-282
    • /
    • 2010
  • Two experiments were conducted to explore the effects of anaphora and demonstrative ellipsis on reference resolution. This study assumed that two type of ellipsis could be sensitive to antecedents' saliency: the reverse typicality and mention order of antecedents. The muti-task approach measured the antecedent's activation level and processing load for the conflict resolution of theories of anaphoric resolution. In Experiment 1, using ellipsis for anaphora, participants read a series of sentence pairs by self-paced and performed a probe recognition test. The results showed the main effects of antecedent's typicality and mention order in both tasks. In Experiment 2, using noun phrase without demonstrative for anaphora, participants read a series of sentence pairs by self-paced and performed a probe recognition test. The results showed main effects of mention order of antecedents for probe recognition task only. The first antecedent was recognized faster than the second one. The results of two experiments suggested that anaphora type and antecedent's saliency were dynamically interact in reference resolution for Korean.

  • PDF

Discourse Analysis for Robust Spoken Dialogue System (강건한 음성 대화 시스템을 위한 담화분석 기술)

  • Lee, Chung-Hee;Jang, Myung-Gil;Oh, Hyo-Jung;Seo, Young-Hoon
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.10
    • /
    • pp.1005-1009
    • /
    • 2010
  • Elliptical and anaphoric utterances occur frequently during spoken dialogue. Because discourse analysis rests on the basic premise that linguistic items cannot be understood without reference to the context, ellipsis and anaphora resolution plays an important role in discourse analysis. In this paper, we present a spoken dialogue system improving the robustness at dialogue level based on discourse analysis, such as anaphora and ellipsis resolution. The applicability and effectiveness of the proposed method is evaluated in the TV domain.

Comprehension skill and the efficiency in suppression mechanism in anaphoric reference (이해능력에 따른 대용어 처리시 억압기제의 효율성 차이)

  • Kim, Sun-Joo;Lee, Mahn-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.435-443
    • /
    • 1992
  • 본 연구에서는 이해능력수준에 따른 억압기제의 효율성 차이를 대용어 참조 과정을 통해 검증하였다. 실험 1에서는 단어재인과제를 사용하여 이해능력에 따른 가능한 참조어의 활성화 차이를 살펴 보았다. 그 결과 낮은 수준의 이해자는 높은 수준의 이해자에 비해 가능한 참조어 중 문장맥락에 맞는 적절한 참조어와 함께 맥락에 맞지 않는 부적절한 참조어의 활성화도 유지하고 있는 경향이 있었다. 실험 2에서는 검사단어의 맥락적절성 판단과제를 실시하였는데 낮은 수준의 이해자는 높은 수준의 이해자에 비해 부적절한 참조어를 부정하는데 반응시간이 오래 걸렸다. 이 결과들은 낮은 수준의 이해자가 덜 효율적인 억압기제를 가졌다는 가설을 지지하는 결과로 논의되었다.

  • PDF