• 제목/요약/키워드: 대용어

검색결과 148건 처리시간 0.023초

무형대용어 해결 기술을 이용한 백과사전 표제어 복원 (Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique)

  • 황민국;김영태;나동열;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

담화에서의 어휘지도를 이용한 한국어 무형대용어 탐지 및 해결 말뭉치 생성 (Building a Korean Zero-Anaphora Detection and Resolution Corpus in Korean Discourse Using UWordMap)

  • 윤호;남궁영;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.591-594
    • /
    • 2020
  • 담화에서 의미를 전달하는 데 문제가 없을 경우에는 문장성분을 생략하여 표현한다. 생략된 문장성분을 무형대용어(zero anaphora)라고 한다. 무형대용어를 복원하기 위해서는 무형대용어 탐지와 무형대용어 해결이 필요하다. 무형대용어 탐지란 문장 내에서 생략된 필수성분을 찾는 것이고, 무형대용어 해결이란 무형대용어에 알맞은 문장성분을 찾아내는 것이다. 본 논문에서는 담화에서의 무형대용어 탐지 및 해결을 위한 말뭉치 생성 방법을 제안한다. 먼저 기존의 세종 구어 말뭉치에서 어휘지도를 이용하여 무형대용어를 복원한다. 이를 위해 본 논문에서는 동형이의어 부착과 어휘지도를 이용해서 무형대용어를 복원하고 복원된 무형대용어에 대한 오류를 수정하고 그 선행어(antecedent)를 수동으로 결정함으로써 무형대용어 해결 말뭉치를 생성한다. 총 58,896 문장에서 126,720개의 무형대용어를 복원하였으며, 약 90%의 정확률을 보였다. 앞으로 심층학습 등의 방법을 활용하여 성능을 개선할 계획이다.

  • PDF

지칭의 대용어 이론과 이에 대한 비판들 (The Anaphoric Theory of Reference and Objections Against It)

  • 이병덕
    • 논리연구
    • /
    • 제18권2호
    • /
    • pp.217-241
    • /
    • 2015
  • 브랜덤은 지칭의 대용어 이론을 주장한다. 이 이론에 따르면 지칭은 언어적인 것들 사이의 대용어적 의존관계이지 결코 언어적인 것과 비언어적인 것 사이의 실질적 관계가 아니다. 또한 '지칭한다'는 '''라이프니츠"라고 지칭된 사람'과 같은 대용어적 간접 기술어구를 형성하기 위해 사용되는 대명사형성 조작어이다. 그런데 최근 보베는 이 이론에 대해 세 가지 비판들을 제기한다. 첫째, 대용어 이론은 일상적 기술어구와 대용어적 간접 기술어구를 반복 가능성 조건으로 구분한다. 그러나 이 조건은 대용어적 간접 기술어구들이 고유한 의미론적 범주를 형성한다고 주장할 수 있는 적절한 근거가 아니다. 둘째, '그'와 같은 대명사를 포함한 문장과 '''라이프니츠"라고 지칭된 사람'과 같은 대용어적 간접 기술어구를 포함한 문장은 양상적 위상에서 차이가 있다. 따라서 대용어적 간접 기술구들은 의미론적으로 전형적인 대용어들과 다르다. 셋째, 대용어 이론에 따르면 'a' 형태의 표현들과 이에 대응하는 '''a"에 의해 지칭되는 것'은 서로 대체될 수 있다. 그런데 대용어, 선행어 등과 같은 개념들 대신 동등함, 대체가능성 등과 같이 보다 일반적인 의미론적 개념들을 사용함으로써 동등한 주장을 할 수 있기 때문에 대용어 이론은 설명적으로 공허하다. 이 논문에서 필자는 보베의 비판들이 지칭의 대용어 이론에 큰 문젯거리가 아님을 주장한다. 이를 통해 지칭의 대용어 이론이 '지칭한다'에 관해 옳은 통찰을 주는 유망한 이론이라고 주장한다.

  • PDF

중심어 주도 단방향 차트 파싱을 이용한 문맥 대용어 해결 (A Resolution of Text Anaphora using Unidirection Chart Parsing in HPSG)

  • 김정해;조준모;이상국;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.386-392
    • /
    • 1996
  • 대용어(anaphor)는 한 문장이나 문장과 문장간에 같은 요소가 되풀이될 때 언어 사용의 경제성(language economy)을 위하여 잉여적 표현을 제거하는 방법으로, 좀 더 간략한 언어 표현으로 대치하여 쓰는 현상이다. 따라서 본 논문에서는 중심어 주도의 단방향 활성 차트 파싱을 이용하여 한국어 문장내에서 야기되는 문맥 대용어의 해결 방안에 대해 제안한다. 이는 자연어를 입력으로 하는 실용목적의 자연어처리 시스템 구축에 있어 필수적으로 요구되는 부분이다. 대용어 해결을 위해 먼저 전산학적인 대용어 정의를 내리고, 대용어와 선행어사이의 의미 분류 및 대용어 해결 과정에 필요한 처리 조건등을 설정하였다 또한 파서내에 대용어 처리를 위해 사전내 자질구조로 ANAPMAJ, ANAPMIN, PERSON, NUM, INDEX자질을 추가하였고, 대용어 해결을 위한 알고리즘을 제안하였으며, 기존에 개발된 HPSG 파서가 처리하는 모든 문장에서 야기된 문맥 대용을 해결하여 파서이후의 응용 시스템에서 이용할 수 있는 내적 표현을 보다 분명하게 형식화하였다.

  • PDF

다중모드 대화 시스템에서 이중 캐시 모델의 센터링 알고리즘을 이용한 명사 대용어구 처리 (Resolution of Anaphoric Noun Phrases using a Centering Algorithm with a Dual Cache Model in a Multimodal Dialogue System)

  • 김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권11호
    • /
    • pp.1133-1140
    • /
    • 2000
  • 다중모드 대화에서 나타나는 대용어는 언어만을 사용하는 대화에서 나타나는 것과 비교하여 매우 다른 형태와 특징을 가진다. 그것은 행위나 시각이 대용 행위로 사용될 수 있기 때문이다. 본 논문에서는 터치스크린 인터페이스를 이용한 홈쇼핑 가구점 영역의 다중모드 대화 시스템에서 나타나는 다양한 대용어의 처리 방법을 알아본다. 먼저, 화면 대용어와 참조 대용어를 정의하여 다양한 형태의 대용어를 분류한다. 그리고 각 대용어를 처리할 수 있는 두 가지의 일반적인 방법을 제안한다. 하나는 지시 행위를 수반하거나 생략한 채 발화되어 현재 화면에 나타나 있는 아이템을 참조하는 대용어를 처리하는 단순한 매핑 알고리즘이다. 다른 하나는 다중 모드 대화 시스템을 위해 워커(Walker)의 센터링 알고리즘을 확장한 이중 캐시 구조의 센터링 알고리즘이다. 확장된 센터링 알고리즘은 발화와시각 정보 그리고 화면 전환 시간을 유지할 수 있기 때문에 다중모드 대화에서 발생하는 다양한 대용어를 처리하기에 적합하다. 실험에서 제안된 시스템은 40개의 대화에서 나타난 402개의 대용어(발화당 0.54)중에서 387개를 처리하여 96.3%의 정확도를 보였다.

  • PDF

한국어 복합문의 영 대용어 해결 (Zero Anaphora Resolution in Korean Complex Sentences)

  • 김미진;강보영;구상옥;박미성;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.694-696
    • /
    • 2002
  • 본 논문은 한국어 복합문에서의 영 대용어 해결을 위해 복합문 분해 알고리즘과 영 대용어 복원규칙을 제안하고, 해결 방법을 제시한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 활용 어미들을 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.

  • PDF

실제 멀티모달 환경에서의 지시 대용어 처리 (Resolution of Deictic Anaphora in Real Multimodal Environments)

  • 최맹식;이세희;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.151-155
    • /
    • 2008
  • 언어기반 대화 시스템에서는 시스템과 사용자의 대화가 발화 자체만으로 이루어지기 때문에 사용자가 사람과 대화하는 것처럼 지시 대용어를 사용할 수 없어서 불편하다. 그리고 사용자의 발화 의미를 시스템이 정확하게 해석하기가 어렵다. 하지만 이런 언어기반 대화 시스템과는 달리 멀티모달 대화 시스템에서는 발화 자체의 정보뿐만이 아닌 제스처와 같은 발화 이외의 행위 정보들이 포함되는데 이 정보를 이용하면 지시 대용어의 처리가 가능해짐으로 시스템과의 대화가 좀 더 자연스러워진다. 본 논문에서는 군집화와 격틀을 이용하여 여러 사물들 중에서 지시 대용어가 될 가능성이 있는 지시 후보 선정을 한다. 그리고 특출성 점수와 엔트로피를 이용하여 후보 사물들 중에서 지시 대용어가 될 수 있는 대상을 선택하는 알고리즘을 제안한다. 시뮬레이션 환경에서의 실험결과 평균 2.8번의 상호작용으로 지시 대용어를 처리할 수 있었다.

  • PDF

설명문의 대용어 참조해결과정: 대용어와 지시사 생략 효과 (Anaphoric Reference Resolution in Expository Text: The Effects of Ellipsis)

  • 이재호
    • 인지과학
    • /
    • 제21권2호
    • /
    • pp.253-282
    • /
    • 2010
  • 이 연구는 대용어나 지시사가 생략된 조건에서 선행어의 전형성과 언급순서가 참조해결에 작용하는 효과를 살펴보기 위해서 2개의 실험을 실시하였다. 실험 1은 대용어 생략과 대명사 조건을 비교하였다. 대용어 생략은 전형성과 언급순서가 읽기과제에 반영되었고, 언급순서 효과가 탐사재인과제에 반영되었다. 반면에 대명사는 전형성과 언급순서 효과가 탐사재인과제에만 반영되었다. 실험 2에서는 지시사가 생략된 명사반복과 대명사 조건을 비교하였다. 명사반복이 대명사에 비해서 읽기시간이 길었으며, 언급순서 효과가 탐사재인과제에 반영되었다. 반면에 대명사는 전형성과 언급순서가 탐사재인과제에서 반영되었다. 이는 선행어와 대용어의 참조해결이 직선적이기보다는 역동적일 가능성을 시사하였다.

  • PDF

강건한 음성 대화 시스템을 위한 담화분석 기술 (Discourse Analysis for Robust Spoken Dialogue System)

  • 이충희;오효정;장명길;서영훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1005-1009
    • /
    • 2010
  • 지시대명사와 같은 조응어(anaphora)의 본래 단어나 구를 선행사라고 지칭하며, 음성 대화 중에는 선행사에 대한 생략과 대용어 사용이 빈번히 발생한다. 또한 언어 현상들은 문맥을 보지 않으면 이해될 수 없는 것들이 많다는 것이 담화분석의 기본 가정이므로, 생략 및 대용어 복원은 담화분석에서 매우 중요한 역할을 한다. 본 논문에서는 대용어와 생략어 복원에 기반해서 대화 레벨에서의 강건성을 향상시킨 음성 기반 대화 시스템을 제안한다. 제안된 항법의 적절성과 효과는 TV 도메인에서 평가되었다.

이해능력에 따른 대용어 처리시 억압기제의 효율성 차이 (Comprehension skill and the efficiency in suppression mechanism in anaphoric reference)

  • 김선주;이만영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.435-443
    • /
    • 1992
  • 본 연구에서는 이해능력수준에 따른 억압기제의 효율성 차이를 대용어 참조 과정을 통해 검증하였다. 실험 1에서는 단어재인과제를 사용하여 이해능력에 따른 가능한 참조어의 활성화 차이를 살펴 보았다. 그 결과 낮은 수준의 이해자는 높은 수준의 이해자에 비해 가능한 참조어 중 문장맥락에 맞는 적절한 참조어와 함께 맥락에 맞지 않는 부적절한 참조어의 활성화도 유지하고 있는 경향이 있었다. 실험 2에서는 검사단어의 맥락적절성 판단과제를 실시하였는데 낮은 수준의 이해자는 높은 수준의 이해자에 비해 부적절한 참조어를 부정하는데 반응시간이 오래 걸렸다. 이 결과들은 낮은 수준의 이해자가 덜 효율적인 억압기제를 가졌다는 가설을 지지하는 결과로 논의되었다.

  • PDF