• Title/Summary/Keyword: 질의 유형 분류

Search Result 200, Processing Time 0.043 seconds

Design of a QA System based on Information Retrieval (정보검색기반 질의응답 시스템 설계)

  • Kim, MinKyoung;Ahn, HyeokJu;Kim, Harksoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.816-818
    • /
    • 2015
  • 본 논문에서는 질의유형을 통한 검색기반 질의응답 시스템을 구현하기 위한 설계방법을 제안한다. 이를 위해 위키피디아 문서의 링크 데이터를 이용하여 색인 대상문서와 데이터베이스를 구축하는 색인 모델과 2-포아송 모델을 이용하여 얻은 문서들을 색인 데이터베이스를 통해 필터링하여 정답 후보문장을 추출하는 검색모델, 키워드 패턴 매칭 기반 질의유형 분류 모델을 설계하였다.

Efficient Model-based Form Processing Methods for Various Kinds of Form Documents (다양한 유형의 서식문서 처리를 위한 효과적인 모형 기반 방법에 관한 연구)

  • 변영철;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.420-422
    • /
    • 1998
  • 본 논문에서는 여러 가지 유형의 서식문서를 효과적으로 처리하기 위한 방법을 제안하고 모형 기반 서식 처리 시스템을 위한 프레임워크를 구현한다. 이를 위해서 서식문서의 모형으로 등록되는 정보로서 네가지 유형의 서식문서에 관한 지식을 정의하고, 이를 기술하기 위한 서식 기술 언어를 정의한다. 먼저, 서식 등록 과정에서 서식에 관한 네가지 유형의 지식을 서식 모형으로 등록한다. 그리고 서식 처리 과정에서 시스템에 등록되어 있는 서식 모형을 이용하여 서식을 분류함으로써 계산 시간을 줄일 수 있다. 실험결과 8개의 서식 모형이 등록되어 있을 경우에는 평균 서식 분류 시간은 0.74초였으며, 5개 혹은 6개의 항목을 추출하는데 걸리는 시간은 평균 0.45초였다. 본 방법은 서식 영상의 질이 좋지 않을 경우에도 잘 동작함은 물론 서식 모형만 추가함으로써 다른 서식 문서도 쉽게 처리할 수 있다.

  • PDF

A Topic Classification System Based on Clue Expressions for Person-Related Questions and Passages (단서표현 기반의 인물관련 질의-응답문 문장 주제 분류 시스템)

  • Lee, Gyoung Ho;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.4 no.12
    • /
    • pp.577-584
    • /
    • 2015
  • In general, Q&A system retrieves passages by matching terms of a question in order to find an answer to the question. However it is difficult for Q&A system to find a correct answer because too many passages are retrieved and matching using terms is not enough to rank them according to their relevancy to a question. To alleviate this problem, we introduce a topic for a sentence, and adopt it for ranking in Q&A system. We define a set of person-related topic class and a clue expression which can indicate a topic of a sentence. A topic classification system proposed in this paper can determine a target topic for an input sentence by using clue expressions, which are manually collected from a corpus. We explain an architecture of the topic classification system and evaluate the performance of the components of this system.

Storing Scheme based on Graph Data Model for Managing RDF/S Data (RDF/S 데이터의 관리를 위한 그래프 데이터 모델 기반 저장 기법)

  • Kim, Youn-Hee;Choi, Jae-Yeon;Lim, Hae-Chull
    • Journal of Digital Contents Society
    • /
    • v.9 no.2
    • /
    • pp.285-293
    • /
    • 2008
  • In Semantic Web, metadata and ontology for representing semantics and conceptual relationships of information resources are essential factors. RDF and RDF Schema are W3C standard models for describing metadata and ontology. Therefore, many studies to store and retrieve RDF and RDF Schema documents are required. In this paper, we focus on some results of analyzing available query patterns considering both RDF and RDF Schema and classify queries on RDF and RDF Schema into the three patterns. RDF and RDF Schema can be represented as graph models. So, we proposed some strategies to store and retrieve using the graph models of RDF and RDF Schema. We can retrieve entities that can be arrived from a certain class or property in RDF and RDF Schema without a loss of performance on account of multiple joins with tables.

  • PDF

고령사회를 대비한 정보격차해소 정책방안 고찰

  • Son, Yeon-Gi
    • Information and Communications Magazine
    • /
    • v.25 no.1
    • /
    • pp.32-43
    • /
    • 2008
  • 본 연구는 고령사회 도래에 따른 고령층 정보격차해소 방안에 관한 연구이다. 먼저 정보격차에 관한 이론적 쟁점을 살펴본 후 해외 주요국들의 고령층 정보격차해소 현황을 소개하고, 고령사회 도래에 따라 고령층의 정보사회 참여를 촉진하기 위한 고령층 정보격차해소 방안을 고찰하고 있다. 향후 빠르게 진행될 고령사회에 대응하기 위한 고령층 정보격차해소 정책방안으로서 정보격차 진화의 단계별로 제1유형, 제2유형, 제3유형으로 분류하여 정책방안을 제시하였다. 제1유형에서는 정보의 접근성, 제2유형에서는 정보의 활용성, 그리고 제3유형에서는 정보의 수용성을 기준으로 정보격차가 분화된다. 이 유형들은 그 일부가 정책방안을 구상함에 있어 중복 고려될 수 있다. 제1유형에서는 보편적 접근 및 서비스를 지향하는 입장에서 정보기기에 대한 균등한 접근기회 보장 및 인적 네트워크 강화를 중요하게 고려해야 할 것이다. 제2유형과 제3유형에서는 고령층의 사회참여 역량을 강화함으로써 궁극적으로 삶의 질 향상에 기여할 수 있는 방향으로 나아갈 수 있도록 하기 위하여 정보활용 능력 및 세대 간 의사 소통 능력의 증진이 중요하게 고려되어야하겠다. 이와 같은 대응방안을 체계적이고 지속적인 대책으로 접근해 나갈 필요가 있다.

Weight Assignments on Keyfacts for Enhancing Precision in Information Retrieval (정보검색에서 정확률의 향상을 위한 키팩트의 가중치 부여)

  • Kim, Su-Hui;Nam, Hyo-Don
    • Journal of KIISE:Databases
    • /
    • v.27 no.4
    • /
    • pp.627-636
    • /
    • 2000
  • 정보검색에서 궁극적으로 지향하는 바는 질의에 대한 정확률과 재현률을 동시에 높이는 것이다. 이 논문에서는 [중심어, 종속어]로 이루어지는 키팩트를 그 유형에 따라 9가지 형태로 분류하였으며. 이 유형들의 주요도를 반영하여 키팩트의 가중치를 계산하는 방법을 개발하였다. 키팩트 유형들에 주요도 값들을 할당한 방법을 검증하기 위한 실험은 질의문들을 이용하여 평균 재현률을 계산함으로써 수행되었다. 9개의 키팩트 타입에 9가지의 주요도 값을 할당하는 방법을 실험하였고 그 결과를 분석하였다. 이 논문의 결과는 기존의 키워드 기반 정보검색에서 문제시되고 있는 정확률을 키팩트 기반 정보 검색에서 향상할 수 있는 가능성을 시사하고 있다.

  • PDF

Open-domain Question Answering Using Lexico-Semantic Patterns (Lexico-Semantic Pattern을 이용한 오픈 도메인 질의 응답 시스템)

  • Lee, Seung-Woo;Jung, Han-Min;Kwak, Byung-Kwan;Kim, Dong-Seok;Cha, Jeong-Won;An, Joo-Hui;Lee, Gary Geun-Bae;Kim, Hark-Soo;Kim, Kyung-Sun;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.538-545
    • /
    • 2001
  • 본 연구에서는 오픈 도메인에서 동작할 수 있는 질의 응답 시스템(Open-domain Question Answer ing System)을 구현하고 영어권 TREC에 참가한 결과를 기술하였다. 정답 유형을 18개의 상위 노드를 갖는 계층구조로 분류하였고, 질문 처리에서는 LSP(Lexico-Semantic Pattern)으로 표현된 문법을 사용하여 질문의 정답 유형을 결정하고, lemma 형태와 WordNet 의미, stem 형태의 3가지 유형의 키워드로 구성된 질의를 생성한다. 이 질의를 바탕으로, 패시지 선택에서는 문서검색 엔진에 의해 검색된 문서들을 문장단위로 나눠 정수를 계산하고, 어휘체인(Lexical Chain)을 고려하여 인접한 문장을 결합하여 패시지를 구성하고 순위를 결정한다. 상위 랭크의 패시지를 대상으로, 정답 처리에서는 질문의 정답 유형에 따라 품사와 어휘, 의미 정보로 기술된 LSP 매칭과 AAO (Abbreviation-Appositive-Definition) 처리를 통해 정답을 추출하고 정수를 계산하여 순위를 결정한다. 구현된 시스템의 성능을 평가하기 위해 TREC10 QA Track의 main task의 질문들 중, 200개의 질문에 대해 TRIC 방식으로 자체 평가를 한 결과, MRR(Mean Reciprocal Rank)은 0.341로 TREC9의 상위 시스템들과 견줄 만한 성능을 보였다.

  • PDF

Normalization of XQuery Queries for Efficient XML Query Processing (효율적인 XML질의 처리를 위한 XQuery 질의의 정규화)

  • 김서영;이기훈;황규영
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.10 no.5
    • /
    • pp.419-433
    • /
    • 2004
  • As XML becomes a standard for data representation, integration, and exchange on the Web, several XML query languages have been proposed. World Wide Web Consortium(W3C) has proposed XQuery as a standard for the XML query language. Like SQL, XQuery allows nested queries. Thus, normalization rules have been proposed to transform nested XQuery queries to semantically equivalent ones that could be executed more efficiently. However, previous normalization rules are applicable only to restricted forms of nested XQuery queries. Specifically, they can not handle FLWR expressions having nested expressions in the where clause. In this paper, we propose normalization rules for XQuery queries by extending those for SQL queries. Our proposed rules can handle FLWR expressions haying nested expressions in every clause. The major contributions of this paper are as follows. First, we classily nesting types of XQuery queries according to the existence of correlation and aggregation. We then propose normalization rules for each nesting type. Second, we propose detailed algorithms that apply the normalization rules to nested XQuery queries.

Answer Recommendation for Knowledge Search using Term Frequency (어휘 빈도를 활용한 지식 검색에서의 답변 추천 시스템)

  • Lee, Ho-Chang;Tak, Hyun-Ki;Lee, Hyun-Ah
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.315-317
    • /
    • 2012
  • 지식iN 등의 지식검색 서비스는 잘못된 답변으로 인한 낮은 신뢰성과 다수의 중복 답변 등의 문제점을 가진다. 질의문 '세상에서 가장 큰 나라'에 대해서 관련된 모든 질문과 답변을 제시하지 않고 질의문과 관련된 다수의 답변을 분석하여 답변 '러시아'를 추천하여 제시할 수 있다면 지식검색의 효용성과 신뢰성이 크게 향상될 수 있다. 본 논문에서는 질문-답변의 유형을 단어, 글, 도표, 목록의 네가지로 분류하고, 그 중 단어 유형에 대한 답변 추천 방법을 제시한다. 질의문에 대해 검색된 질문을 군집화하고, 질문에 대한 답변들에 대해서 TF, IDF, 어휘간 거리 정보를 다양하게 결합하여 어휘의 점수를 계산한다. 각 군집에서 가장 높은 점수를 가지는 어휘를 해당 군집에서 가장 중요한 어휘로 보고 추천 정답으로 제시한다. 단어 유형인 질문 100개에 대한 네이버 지식iN에 대한 시스템 평가에서 추천된 상위 1위에 대해서는 68%의 정답률을, 상위 5위까지에 대해서는 89%의 정답률을 보였다.

Object-Oriented Modeling of Metadata for Content-based Retrieval on News On Demand (News On Demand의 내용기반 검색을 위한 메타데이타의 객체지향 모델링)

  • 김용걸;이훈순;진성일;최동훈
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.463-471
    • /
    • 1997
  • 비디오 데이타는 다양하고 방대한 양의 의미를 포함하고 있어 효율적인 내용기반 검색을 지원하기 위해서는 비디오 데이타를 기술하는 구조적이고 체계화된 형태의 메타데이타가 요구된다. 이러한 메타데이타는 검색 시 색인과 같은 역할을 수행하게 되므로 내용 기반검색의 가장 기본적이고 필수적인 데이타이다. 본 논문에서는 뉴스 응용 분야(News On Demand:NOD)를 적용한 비디오 데이터베이스 시스템의 효율적인 내용 기반 검색을 위한 메타데이타를 분류하고, Rambaugh의 OMT기법을 이용하여 메타데이타를 모델링한 후 질의 유형에 따라 모델의 접근 경로를 검사하여 모델을 검증하였다.

  • PDF