• 제목/요약/키워드: 문맥정보

검색결과 660건 처리시간 0.032초

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

계층적 정보유형과 문맥정보를 사용한 항공여행대화시스템에서의 예약정보 추출 (Information Extraction for Air Travel Dialogue System Using Hierarchical Information Types and Contextual Features)

  • 김세종;나승훈;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.204-208
    • /
    • 2007
  • 대화시스템은 사용자가 자연언어를 사용하여 해당 시스템과 필요한 정보를 주고받는 목적 지향적 에이전트로서 활용되어 왔다. 이러한 대화형 에이전트는 사용자의 입력으로부터 필요한 정보를 정확하게 추출함으로써 이후 처리단계에서의 결과를 향상시킬 수 있다. 본 논문에서는 항공여행관련 대화에서 발생하는 예약정보들 중에서 경유정보, 특히 경유하는 시간 및 날짜에 대한 정보를 효과적으로 추출하는 방법에 대해서 다룬다. 출발 도착정보와 경유정보를 계층적으로 분류하고, 현재 발화되고 있는 문장보다 선행되고 있는 문장들의 예약정보들을 문맥정보로 사용하여 현재 문장에서 추출하고자 하는 정보들을 학습하고 평가하였다. 이를 통해서 얻어진 결과는 출발.도착 및 경유정보를 동시에 고려했을 때보다 효과적인 학습 성능을 보였으며 실제로 시간정보에 대해서는 81.5%, 날짜정보에 대해서는 92.0%의 정확도를 보였다.

  • PDF

커뮤니티 컴퓨팅을 위한 문맥적 요구사항 (Contextual Requirements for Community Computing)

  • 지경환;양정진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.748-750
    • /
    • 2005
  • 본 논문에서는 능동적인 상호협력으로 목적에 맞는 서비스를 제공하는 컴퓨팅 환경에서 가장 중요한 역할을 하게 될 문맥(Context)을 중점적으로 설명한다. 문맥은 정보를 주고받는 기본 단위가 될 것이며 이를 위한 표준이 갖추어야 할 요구사항과 이것을 수용할 수 있는 기술적 토대(XML, XML Schema, RDF, Ontology Language)를 소개 한다.

  • PDF

영어초점구문에 나타나는 초점발화의 음향음성학적 특성

  • 김기호
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.129-225
    • /
    • 2003
  • 초점에 대한 언급이 Halliday(1967)에 의해 처음으로 시작된 이래로 초점의 개념에 대한 다양한 접근과 많은 논의가 이루어져 왔다. 일반적으로, 초점은 다음과 같이 정의할 수 있다. 첫째, 초점은 문맥에서 복구가 불가능한 요소를 가리킨다. 초점이라는 용어를 최초로 언급한 Halliday (1967)에 따르면, 초점이란 신정보를 가리키며 이전 담화 문맥에서 복구할 수 없는 정보가 곧 초점이다. 둘째, 초점은 전제 (presupposition)와 대응되는 개념이다. Jackendoff(1972)에 따르면, 담화 문맥에서 이루어지는 발화는 화자와 청자 사이에 공유된 정보와 그렇지 않은 정보로 나뉘며, 그 중 공유된 정보가 전제이고 이에 상보적으로 대응되는 비전제 (non-presupposed)가 곧 초점이다. 셋째, 초점은 화제(topic)와 대응되는 개념이다. Sgall(1973)과 Gundel(1974)에 따르면, 하나의 발화는 문맥상 화제와 초점으로 나뉘며 화제는 흔히 문장에서 무엇에 대해 말하려고 하는가'인 반면, 초점은 발화에서 화제를 제외한 나머지 부분으로서 담화에서 '화제에 대해서 서술되고 있는 바'를 나타낸다고 본다. (중략)

  • PDF

상품 리뷰 요약에서의 문맥 정보를 이용한 의견 분류 방법 (A Sentiment Classification Method Using Context Information in Product Review Summarization)

  • 양정연;명재석;이상구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.254-262
    • /
    • 2009
  • e비즈니스가 활발히 이루어지면서 소비자들은 온라인 쇼핑몰올 통해 수많은 상품을 접할 수 있게 되었고, 상품구매 시 다른 사람들의 리뷰를 참고하게 되었다. 하지만, 리뷰의 수도 많아짐에 따라 소비자가 모든 리뷰들을 살펴보기가 힘들다는 문제점이 대두되었으며 이를 해결하기 위해서 리뷰의 상품에 대한 평가를 요약하고 성향을 파악하는 오피니언 마이닝 연구가 나타나게 되었다. 본 논문에서는 상품리뷰를 대상으로 오피니언 마이닝을 수행하는 경우 어휘의 의견 성향을 파악할 때, 문맥정보를 활용하여 기존의 의견분류방법 보다 좀 더 정확한 의견 판단이 가능한 방법에 대해 다루고 있다. 이를 위해, 어휘가 사용될 때의 문맥정보를 정의하고 이를 의견분류에 적용하는 방법을 제안하였으며, 실험을 통하여 기존 연구 보다 상황별 알맞은 의견분류가 가능함을 보였다. 또한 수작업으로 말뭉치의 핵심 어휘들을 정의했던 기존 연구들에서의 방식에서 벗어나, 리뷰본문과 리뷰점수를 활용하여 자동으로 상황에 맞는 말뭉치를 구축하는 방법도 제안하였다. 이를 통해 상품리뷰에 나타난 어휘들의 문맥에 맞는 의미 성향을 정확하고 쉽게 판별해 낼 수 있게 되었다.

문맥 표현과 음절 표현 기반 포인터 네트워크를 이용한 한국어 상호참조해결 (Contextualized Embedding- and Character Embedding-based Pointer Network for Korean Coreference Resolution)

  • 박천음;이창기;류지희;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-242
    • /
    • 2018
  • 문맥 표현은 Recurrent neural network (RNN)에 기반한 언어 모델을 학습하여 얻은 여러 층의 히든 스테이트(hidden state)를 가중치 합(weighted sum)을 하여 얻어낸 벡터이다. Convolution neural network (CNN)를 이용하여 음절 표현을 학습하는 경우, 데이터 내에서 발생하는 미등록어를 처리할 수 있다. 본 논문에서는 음절 표현 CNN 기반의 포인터 네트워크와 문맥 표현을 함께 이용하는 방법을 제안하고, 이를 상호참조해결에 적용한다. 실험 결과, 질의응답 데이터셋에서 CoNLL F1 57.88%로 규칙기반에 비하여 11.09% 더 좋은 성능을 보였다.

  • PDF

한국어 특수조사 '도'의 의미, 문맥적 기능 분석 (An Analysis of the Semantic and Discourse Functions of the Korean Special Marker '-to')

  • 박준경;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-331
    • /
    • 1999
  • 본 논문은 한국어의 특수조사, 특히 '도'의 의미, 문맥적 기능에 대하여 다루고 있다. '도'는 문맥의 자연스러운 연결에 있어서 중요한 역할을 수행한다. '도'가 쓰인 문장의 배경에는 반드시 일정한 전제가 존재한다. 전제는 그 문장의 의미 뿐만 아니라 기존 문맥과도 직접적으로 연관된다. 본 논문에서는 '같음', '유사함', '극한', '첨가' 및 병렬문에서 쓰이는 다섯 가지 '도'의 기능에 대하여 설명하고, alternatives semantics를 이용하여 이를 결합범주문법(CCG)에서 구현하는 방법을 제시한다.

  • PDF

개체명 문맥의미표현 학습을 통한 기계 요약의 사실 불일치 교정 (Learning Contextual Meaning Representations of Named Entities for Correcting Factual Inconsistent Summary)

  • 박준모;노윤석;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.54-59
    • /
    • 2020
  • 사실 불일치 교정은 기계 요약 시스템이 요약한 결과를 실제 사실과 일치하도록 만드는 작업이다. 실제 요약 생성연구에서 가장 공통적인 문제점은 요약을 생성할 때 잘못된 사실을 생성하는 것이다. 이는 요약 모델이 실제 서비스로 상용화 하는데 큰 걸림돌이 되는 부분 중 하나이다. 본 논문에서는 원문으로부터 개체명을 가져와 사실과 일치하는 문장으로 고치는 방법을 제안한다. 이를 위해서 언어 모델이 개체명에 대한 문맥적 표현을 잘 생성할 수 있도록 학습시킨다. 그리고 학습된 모델을 이용하여 원문과 요약문에 등장한 개체명들의 문맥적 표현 비교를 통해 적절한 단어로 교체함으로써 요약문의 사실 불일치를 해소한다. 제안 모델을 평가하기 위해 추상 요약 데이터를 이용해 학습데이터를 만들어 학습하고, 실제 시나리오에서 적용가능성을 검증하기 위해 모델이 요약한 요약문을 이용해 실험을 수행했다. 실험 결과, 자동 평가와 사람 평가에서 제안 모델이 비교 모델보다 높은 성능을 보여주었다.

  • PDF

다형적 객체 타입 기술을 위한 메커니즘 (A Mechanism for the Expression of Polymorphic Object Type)

  • 이민규;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.436-438
    • /
    • 1999
  • 객체지향 프로그래밍에서 다형성이란 객체가 하나 이상의 객체 타입을 가질 수 있다는 것을 말한다. 이처럼 객체가 하나 이상의 타입을 가지게 되면 다양한 문맥에서 객체를 사용할 수 있게 되어 재사용성을 달성 할 수 있게 된다. 그러나 이러한 객체의 다형성은 정적인 타입 검사를 어렵게 하여 실행시 타입 오류를 유발할 가능성을 높이는 원인으로 작용한다. 본 논문에서는 객체 타입을 기술하기 위한 문맥에서 당일 타입만을 기술했던 것이 제약에서 벗어나 여러 타입의 조합으로 다형적 타입을 기술할 수 있게 함으로써 문맥에 맞는 객체 타입을 기술할 수 있도록 하는 메커니즘을 제안한다. 그리고 이 메커니즘이 어떻게 사용될 수 있는가에 대한 예제들도 함께 소개한다.

  • PDF

자연어 질의 문맥 구조 기반 개인형 메타 검색 에이전트 (A Personalizable Meta-Search Agent Based on Natural Query Context Structure)

  • 박기선;이덕남;김우주;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.688-690
    • /
    • 2002
  • 인터넷과 웹의 팽창과 함께 가용 정보의 양이 폭발적으로 증가하고 있으나 이에 대응되는 효과적이고 효율적인 정보 검색능력의 지원이 없다면 이와 같은 방대한 정보들은 정보 이용자들에 있어 이용 가치가 없으며 이는 곧 정보 범람(information overflow)을 의미한다. 본 논문에서는 이에 대한 해결 방안으로써 사용자의 편이성과 정보검색 능력을 극대화할 수 있는 자연어 질의 문맥 구조 기반 개인형 메타 정보검색 엔진을 제안하고자 한다.본 방법론은 자연어 질의를 기본 입력 형태로 하여 자연어 질의의 문맥 구조(context structure) 및 기타 정보 평가 요소들을 이용하는 다척도(multi-criteria)의사 결정 기법 및 개인형 메타 정보 평가(information rating) 방법론으로 구성되어 있으며 이를 위한 시스템 설계를 제안한다.

  • PDF