• 제목/요약/키워드: Question Retrieval System

검색결과 40건 처리시간 0.023초

ExoTime: Temporal Information Extraction from Korean Texts Using Knowledge Base

  • Jeong, Young-Seob;Lim, Chae-Gyun;Choi, Ho-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권12호
    • /
    • pp.35-48
    • /
    • 2017
  • Extracting temporal information from documents is becoming more important, because it can be used to various applications such as Question-Answering (QA) systems, Recommendation systems, or Information Retrieval (IR) systems. Most previous studies only focus on English documents, and they are not applicable to the other languages due to the inherent characteristics of languages. In this paper, we propose a new system, named ExoTime, designed to extract temporal information from Korean documents. The ExoTime adopts an external Knowledge Base (KB) in order to achieve better prediction performance, and it also applies a bagging method to the temporal relation prediction. We show that the effectiveness of the proposed approaches by empirical results using Korean TimeBank. The ExoTime system works as a part of ExoBrain that is an artificial intelligent QA system.

Survey of Temporal Information Extraction

  • Lim, Chae-Gyun;Jeong, Young-Seob;Choi, Ho-Jin
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.931-956
    • /
    • 2019
  • Documents contain information that can be used for various applications, such as question answering (QA) system, information retrieval (IR) system, and recommendation system. To use the information, it is necessary to develop a method of extracting such information from the documents written in a form of natural language. There are several kinds of the information (e.g., temporal information, spatial information, semantic role information), where different kinds of information will be extracted with different methods. In this paper, the existing studies about the methods of extracting the temporal information are reported and several related issues are discussed. The issues are about the task boundary of the temporal information extraction, the history of the annotation languages and shared tasks, the research issues, the applications using the temporal information, and evaluation metrics. Although the history of the tasks of temporal information extraction is not long, there have been many studies that tried various methods. This paper gives which approach is known to be the better way of extracting a particular part of the temporal information, and also provides a future research direction.

Question Similarity Measurement of Chinese Crop Diseases and Insect Pests Based on Mixed Information Extraction

  • Zhou, Han;Guo, Xuchao;Liu, Chengqi;Tang, Zhan;Lu, Shuhan;Li, Lin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.3991-4010
    • /
    • 2021
  • The Question Similarity Measurement of Chinese Crop Diseases and Insect Pests (QSM-CCD&IP) aims to judge the user's tendency to ask questions regarding input problems. The measurement is the basis of the Agricultural Knowledge Question and Answering (Q & A) system, information retrieval, and other tasks. However, the corpus and measurement methods available in this field have some deficiencies. In addition, error propagation may occur when the word boundary features and local context information are ignored when the general method embeds sentences. Hence, these factors make the task challenging. To solve the above problems and tackle the Question Similarity Measurement task in this work, a corpus on Chinese crop diseases and insect pests(CCDIP), which contains 13 categories, was established. Then, taking the CCDIP as the research object, this study proposes a Chinese agricultural text similarity matching model, namely, the AgrCQS. This model is based on mixed information extraction. Specifically, the hybrid embedding layer can enrich character information and improve the recognition ability of the model on the word boundary. The multi-scale local information can be extracted by multi-core convolutional neural network based on multi-weight (MM-CNN). The self-attention mechanism can enhance the fusion ability of the model on global information. In this research, the performance of the AgrCQS on the CCDIP is verified, and three benchmark datasets, namely, AFQMC, LCQMC, and BQ, are used. The accuracy rates are 93.92%, 74.42%, 86.35%, and 83.05%, respectively, which are higher than that of baseline systems without using any external knowledge. Additionally, the proposed method module can be extracted separately and applied to other models, thus providing reference for related research.

XML을 이용한 문제은행 시스템 설계 및 구현 (The Design and Implementation of Item pool System using XML)

  • 하명희;박남숙
    • 한국컴퓨터정보학회지
    • /
    • 제8권2호
    • /
    • pp.33-42
    • /
    • 2001
  • 본 논문에서는 웹과 XML을 이용하여 학습자가 원하는 문항만을 검색하고 평가할 수 있는 문제은행 시스템을 구현하였다. 문항의 구성은 4지선다형, 5지선다형, 단답형으로 구성하였고 난이도 및 출제빈도를 고려하여 변별력을 가지도록 문제은행화 하였다. 문항검색은 데이터베이스에 저장된 정보를 단순히 검색하는 것이 아니라 저장된 정보를 XML문서로 변환한 후 XML 데이터에 대하여 Xpath를 이용하여 검색하였다 검색된 결과는 XSL을 이용하여 브라우저상에 나타나도록 하였다. 문항평가는 학습자가 원하는 과목. 단원에 대해서 난이도 및 출제빈도 그리고 문항유형별로 문항수를 입력하여 평가 문항을 생성하였다. 또한 실시간으로 학습자에게 학습결과를 제공하였고 학습자가 오답으로 응답한 문항에 대해서는 반복학습을 할 수 있도록 하였다.

  • PDF

워드프로세서 자격증 시험을 위한 웹 기반 자기 주도적 학습 시스템 설계 및 구현 (Design and Implementation of Web-Based Self-directed Learning System for Word Processor Qualifying Exams)

  • 양윤정;김창석
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.43-48
    • /
    • 2006
  • 인터넷에서 가장 활발하게 사용되고 있는 웹은 특성상 구성주의 학습원리를 실현하는데 적절한 환경을 제공하고 있으며, 교육 시스템의 변화를 가져오고 있다. WBI(Web Based Instruction)는 웹을 매체로 활용하여 원거리에 있는 학습자를 교육시키는 형태로서 교수자와 학습자간 상호작용을 가능하게 하고, 다양한 형태의 학습 자료를 제공하며, 시간과 장소의 제약을 극복할 수 있는 장점이 있다. 본 논문은 문제은행 방식의 모의시험을 제공하는 웹 기반 학습 시스템의 설계 및 구현을 통하여 학습자 중심의 능동적인 학습활동이 이루어 질 수 있는 학습 환경을 구축하고 그 효과를 분석하는데 목적이 있다. 본 논문의 워드프로세서 자격증 시험을 위한 웹 기반 자기 주도적 학습 시스템은 교수자가 매번 새로운 문제를 출제하는 것이 아니라 문제은행에 저장되어 있는 문제를 검색하여 재 사용할 수 있고, 단원별로 원하는 문제 수를 지정하여 시험지를 출제한 수 있도록 구현하여 진정한 의미의 문제은행이라 할 수 있다. 학습자 웹 기반 학습을 하는 과정에 평가를 한 수 있도록 하였으며 즉각적인 피드백의 제공으로 학습자가 자기 주도적인 학습을 하는데 도움을 주었다. 또한, 시험 응시 후 단원별로 유사문제 검색을 할 수 있는 기회를 제공하였고, 학습자 문제은행 초기화면에서 키워드 검색으로 문제를 검색할 수 있게 함으로써 학습 효율을 더욱 증대시켰다.

Biaffine 한국어 의존파서 (Biaffine Dependency Parser for Korean)

  • ;민태홍;윤준영;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.678-681
    • /
    • 2018
  • Dependency parsing is an important task in natural language processing whose results are used in many downstream tasks such as machine translation, information retrieval, relation extraction, question answering and many others. Most of the dependency parsing literature focuses on using end-to-end and sequence-to-sequence neural architectures as the core of the system. One such system, namely Biaffine dependency parser is explored in the current paper for effective dependency parsing of Korean language.

  • PDF

지인 기반의 스마트 지식공유 시스템에 관한 연구 (A Study on Smart Knowledge Sharing System with Friends)

  • 윤원범;박기남;임희석
    • 디지털융복합연구
    • /
    • 제11권2호
    • /
    • pp.279-285
    • /
    • 2013
  • 정보통신망과 컴퓨터 기술의 발전은 수많은 정보 및 지식을 생산해 내는 기반이 되었고, 최근 대중화가 가속화 되고 있는 스마트디바이스는 사용자가 원하는 정보와 지식을 쉽게 획득할 수 있는 도구로 사용되고 있다. 이에 본 논문에서는 인터넷 정보와 소셜네트워크를 활용한 스마트 디바이스 기반의 지식공유 시스템을 제안한다. 제안하는 시스템은 사용자 질의에 대해 인터넷 정보 검색, 축적된 지식 검색, 소셜네트워크 상의 지인 답변 기능으로 구성된다. 제안한 시스템의 효용성 분석을 위하여 사용자 만족도 평가를 실시하였다. 실험결과 스마트디바이스를 이용한 지식공유 시스템이 일반 정보검색엔진에 비해 통계적으로 유의미한 만족도를 나타냈다.

의문의 초점을 고려한 자연어 기반의 정보검색 시스템 (Natural language based Information Retrieval System considering the focus of the question)

  • 박홍원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.37-43
    • /
    • 1997
  • 본 논문에서는 기존의 키워드 검색 시스템의 불편함과 비효율성을 지적하고 이를 극복하기 위해 한국어 의문문 자체를 질의어로 채택하여 정보를 검색하는 자연어 기반의 정보검색 시스템을 제안하였다. 본 시스템은 주격 주제어와 서술격 주제어는 물론 의문의 초점과 초점 관련 어구에 대해서도 질의어 분석단계에서 분석하여 검색자의 요구에 부응하는 응답문 검색이 가능하도록 설계하였다. 본 논문에서는 의문문 질의 시스템에 적합하도록 의문사를 5형태로 분류하고 실제 한국어 문장에서 이들 각각에 대한 처리를 규칙화시켜 질의어의 체계적인 분석을 시도하였다. 한편, 후보 문장 검색을 위한 색인어로 사용되는 주격 주제어와 서술격 주제어를 정해진 규칙을 통해 추출함으로써 체계적이고 정확도 높은 질의어 분석이 이루어지도록 했다. 뿐만 아니라 의문의 초점과 초점 관련 어구또한 정해진 규칙을 통해 분석 추출함으로써 응답문 검색의 정확성을 높였다.

  • PDF

딥러닝과 정보검색을 결합한 질의응답 시스템 (Question Answering System that Combines Deep Learning and Information Retrieval)

  • 이현구;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.134-138
    • /
    • 2016
  • 정보의 양이 빠르게 증가함으로 인해 필요한 정보만을 효율적으로 얻기 위한 질의응답 시스템의 중요도가 늘어나고 있다. 그 중에서도 질의 문장에서 주어와 관계를 추출하여 정답을 찾는 지식베이스 기반 질의응답 시스템이 활발히 연구되고 있다. 그러나 기존 지식베이스 기반 질의응답 시스템은 하나의 질의 문장만을 사용하므로 정보가 부족한 단점이 있다. 본 논문에서는 이러한 단점을 해결하고자 정보검색을 통해 질의와 유사한 문장을 찾고 Recurrent Neural Encoder-Decoder에 검색된 문장과 질의를 함께 활용하여 주어와 관계를 찾는 모델을 제안한다. bAbI SimpleQuestions v2 데이터를 이용한 실험에서 제안 모델은 질의만 사용하여 주어와 관계를 찾는 모델보다 좋은 성능(정확도 주어:33.2%, 관계:56.4%)을 보였다.

  • PDF

딥러닝과 정보검색을 결합한 질의응답 시스템 (Question Answering System that Combines Deep Learning and Information Retrieval)

  • 이현구;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.134-138
    • /
    • 2016
  • 정보의 양이 빠르게 증가함으로 인해 필요한 정보만을 효율적으로 얻기 위한 질의응답 시스템의 중요도가 늘어나고 있다. 그 중에서도 질의 문장에서 주어와 관계를 추출하여 정답을 찾는 지식베이스 기반 질의응답 시스템이 활발히 연구되고 있다. 그러나 기존 지식베이스 기반 질의응답 시스템은 하나의 질의 문장만을 사용하므로 정보가 부족한 단점이 있다. 본 논문에서는 이러한 단점을 해결하고자 정보검색을 통해 질의와 유사한 문장을 찾고 Recurrent Neural Encoder-Decoder에 검색된 문장과 질의를 함께 활용하여 주어와 관계를 찾는 모델을 제안한다. bAbI SimpleQuestions v2 데이터를 이용한 실험에서 제안 모델은 질의만 사용하여 주어와 관계를 찾는 모델보다 좋은 성능(정확도 주어:33.2%, 관계:56.4%)을 보였다.

  • PDF