• Title/Summary/Keyword: 질의 생성

Search Result 2,127, Processing Time 0.035 seconds

Efficient Time-Series Subsequence Matching Using Index Interpolation (인덱스 보간법을 이용한 효율적인 시계열 서브시퀀스 매칭)

  • Lim Seung-Hwan;Ko Hyun-Gil;Loh Woong-Kee;Kim Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.31-34
    • /
    • 2004
  • 서브시퀀스 매칭은 시계열 데이터베이스에서 질의 시퀀스와 유사한 서브시퀀스틀 찾아내는 연산이다. 기존의 서브시퀀스 매칭 알고리즘들은 하나의 인덱스만을 사용하여 검색을 수행하기 때문에, 인덱스를 생성하기 위하여 데이터 시퀀스로부터 추출한 윈도우의 크기와 질의 시퀀스의 길이 간의 차이가 커질수록 검색 성능이 급격히 저하되는 문제점을 갖고 있다. 본 논문에서는 이러한 기존 알고리즘의 문제점을 해결하기 위하여 인덱스 보간법에 기반한 새로운 서브시퀀스 매칭 기법을 제안한다. 인덱스 보간법이란 하나 이상의 인덱스를 구축하고 주어진 질의 시퀀스의 길이에 따라 적절한 인덱스를 선택하여 검색을 수행하는 기법이다. 본 논문에서는 서브시퀀스 매칭 비용 공식을 산출하고, 이 비용 공식에 기반하여 제안된 기법의 성능을 최적화 하도록 다수의 인덱스를 구성하는 알고리즘을 제시한다. 마지막으로, 실제 데이터를 이용한 여러 가지 실험을 통하여 제안된 기법의 우수성을 정량적으로 검증한다.

  • PDF

Design of Multimedia Database Class and Query Processing Model for Dynamic Contents (동적 컨텐츠 제공을 위한 멀티미디어 데이터베이스 클래스 및 질의 처리 모델 설계)

  • Kim, Kwang-Myoung;Bok, Joong-Hyo;Kim, Kwang-Jong;Lee, Yon-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.179-182
    • /
    • 2001
  • 본 논문은 웹 상에서 사용자에게 동적 컨텐츠를 제공하기 위한 멀티미디어 데이터베이스 관리 시스템의 일부로써 시스템의 하부 구조 및 기본 API 를 제공하는 멀티미디어 데이터베이스 클래스를 설계하고, 이를 기반으로 사용자 요구에 대한 멀티미디어 객체를 추출하는 질의 처리 모텔을 제시한다. 멀티미디어 데이터베이스 클래스는 다양한 형태의 멀티미디어 데이터에 대한 분류 지원 및 관련 객체를 집합으로 관리하는 기능과 멀티미디어 메타데이터 생성 및 관리 기능을 제공하며, 질의 처리 모델은 이러한 멀티미디어 데이터베이스 클래스에서 관리되는 멀티미디어 객체 및 메타 객체를 효율적으로 추출한다.

  • PDF

Query-Based Automatic Text Summarization Using MMR (MMR을 이용한 질의기반 자동 문서요약)

  • Kim, Gum-Young;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.615-618
    • /
    • 2002
  • 정보검색 엔진들은 주어진 질의에 대해 방대한 양의 문서들을 검색해주며, 이 문서들은 질의와의 관련성에 따라 랭킹(Ranting)된다. 질색된 문서들중에 어떤것들은 그 내용이 서로 유사하여 사용자에게 필요 이상의 정보를 제공한다. 이는 질의와의 관련성(Relevance)만을 적용하고, 검색된 정보들간의 차별성을 고려하지 않은데서 비롯된다. MMR(Maximal Marginal Relevance)은 유사한 문서를 검색결과에서 배제할 수 있게 해주는 기법이다. MMR을 자동에 적용하면, 유사한 문장을 배제하여 상이한 정보들을 전달하는 질 높은 요약문을 생성할 수 있다. 본 논문에서는 MMR을 이용한 질의기반 자동 문서요약 시스템을 구현한다. 또한, MMR과 가중치 수식에 다양한 수치를 적용하고, 최적의 결과를 산출하는 수식을 제안한다.

  • PDF

Filtering Unauthorized SQL Query By uniting DB Application Firewall with Web Application Firewall (DB Application Firewall과 Web Application Firewall의 연동을 통한 불법적인 SQL 질의 차단기법)

  • 김수용;남건우;김상천
    • Proceedings of the Korea Institutes of Information Security and Cryptology Conference
    • /
    • 2003.12a
    • /
    • pp.686-690
    • /
    • 2003
  • 웹 응용프로그램에 대한 위협이 점차 확산되면서 오늘날 많은 Web Application Firewall들이 등장하고 있다. 하지만, 대부분의 기관에서 웹 서버 자체의 변조는 기관의 미지 실추를 제외하면 업무상 큰 문제를 유발하지 않는다. 웹 서버에 대한 보안을 고려하는 이유는 웹 서버가 침입을 당할 경우 DB 서버의 내용에 손상이 가해질 수 있기 때문이다. 본 고에서는 Web Application Firewall과 연동하여 허용되는 SQL 질의패턴을 자동으로 생성하여 불법적인 SQL 질의를 차단하는 DB Application Firewall을 제안한다. 이를 통해 웹 응용프로그램의 취약점으로 인해 SQL 질의가 변조되더라도 DB 서버에 해당SQL질의가 전달되는 것을 차단할 수 있다.

  • PDF

Efficient XML Information Search through DTD Filtering and Query Expansion (DTD 여과 및 질의 확장에 의한 효율적인 XML 문서의 정보 검색)

  • Kim, Myoung Sook;Lee, Kyeung Soo;Kong, Yong Hae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.499-502
    • /
    • 2004
  • 본 논문은 정보검색의 대상이 되는 XML 문서를 효율적으로 선별하기 위해 온톨로지를 기반으로 XML 문서를 여과하였으며, 여과된 XML 문서를 대상으로 문서에 내재한 정보를 효과적으로 검색하도록 XML 질의를 확장하였다. 이를 위해, 온톨로지로부터 포괄적 DTD를 생성하는 알고리즘을 개발하였고, XML 문서의 효과적인 정보 검색을 위해 온톨로지의 개념 구조와 연관 관계를 분석하여 XML 질의를 확장하는 알고리즘을 개발하였다. 제안한 문서 여과와 질의 확장 알고리즘의 효과를 샘플 XML 문서에 적용하였다.

  • PDF

k-oATY for considering Obstacles in Continuous Queries (연속적인 질의에서 장애물을 고려한 k-oATY)

  • Song, Doo-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.233-235
    • /
    • 2022
  • 서비스 제공자는 사용자의 위치를 기반으로 용이한 정보를 제공한다. 과거에는 사용자가 질의를 요청하는 순간(snapshot)에 대해 사용자의 위치를 보호하는 기법들이 주를 이루었다면 최근에는 연속적인 질의를 요청할 때 사용자의 위치를 보호하는 기법들이 연구되고 있다. 그러나 연속적인 질의처리는 시간별로 요청되는 질의의 묶음으로서 영역을 보호할 수 있으나 영역을 연결할 경우 사용자의 궤적이 노출되는 문제가 발생할 수 있다. 가장 최근 연속적인 질의에서 이동 궤적을 보호하는 k-ATY가 제안되었지만 사용자와 동일한 이동 속도와 일정한 방향을 기준으로 더미를 생성하기 때문에 장애물(다리, 건물 등)이 있을 경우 더미의 위치가 노출될 수 있다. 본 논문에서는 이러한 문제점을 개선하기 위하여 장애물을 고려한 k-oATY 기법을 제안하고 기존기법과 비교한다.

Natural Langugae Inference as Re-ranking for Multiple Question Answering (질의응답 결과 재순위화를 위한 자연어 추론 모델)

  • Lee, Jihyung;Lee, Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.405-409
    • /
    • 2021
  • 자연어 추론은 전제가 주어졌을때 특정 가설이 전제에 기반해 합당한지 검증하는 자연어 처리의 하위 과제이다. 우리는 질의응답 시스템이 도출한 정답 및 근거 문서를 자연어 추론 모델로 검증할 수 있다는 점에 착안하여, HotpotQA 질의응답 데이터셋을 자연어 추론 데이터 형식으로 변환한뒤 자연어 추론 모델을 학습하여 여러 질의응답 시스템이 생성한 결과물을 재순위화하고자 하였다. 그 결과로, 자연어 추론 모델에 의해 재순위화된 결과물은 기존 단일 질의응답 시스템의 결과물보다 대체로 향상된 성능을 보여주었다.

  • PDF

Deep Prompt Tuning based Machine Comprehension on Korean Question Answering (Deep Prompt Tuning 기반 한국어 질의응답 기계 독해)

  • Juhyeong Kim;Sang-Woo Kang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.269-274
    • /
    • 2023
  • 질의응답 (Question Answering)은 주어진 질문을 이해하여 그에 맞는 답변을 생성하는 자연어 처리 분야의 핵심적인 기계 독해 작업이다. 현재 대다수의 자연어 이해 작업은 사전학습 언어 모델에 미세 조정 (finetuning)하는 방식으로 학습되고, 질의응답 역시 이러한 방법으로 진행된다. 하지만 미세 조정을 통한 전이학습은 사전학습 모델의 크기가 커질수록 전이학습이 잘 이루어지지 않는다는 단점이 있다. 게다가 많은 양의 파라미터를 갱신한 후 새로운 가중치들을 저장하여야 한다는 용량의 부담이 존재한다. 본 연구는 최근 대두되는 deep prompt tuning 방법론을 한국어 추출형 질의응답에 적용하여, 미세 조정에 비해 학습시간을 단축시키고 적은 양의 파라미터를 활용하여 성능을 개선했다. 또한 한국어 추출형 질의응답에 최적의 prompt 길이를 최적화하였으며 오류 분석을 통한 정성적인 평가로 deep prompt tuning이 모델 예측에 미치는 영향을 조사하였다.

  • PDF

Improving Table Question Answering Using Prompt (프롬프트를 이용한 표 질의응답의 성능향상)

  • Jeongyeon Park;Donghyeok Lee;Hyeong Jin Shin;Kyungbeen Cho;Jae Sung Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.395-398
    • /
    • 2023
  • 표 질의응답이란, 주어진 표에서 질의문에 대한 답변을 자동으로 추출하거나 생성하는 기술을 말한다. 최근 언어모델을 사용한 연구들은 정답을 유도할 수 있는 명령문인 프롬프트를 활용하여 더 높은 성능을 보이고 있다. 본 연구에서는 표 질의응답의 성능을 향상시키기 위해, 프롬프트를 효과적으로 사용할 수 있는 모델을 제안한다. 이와 함께, 다양한 형태의 프롬프트를 사용하여 모델을 평가한다. 실험 결과, 기본 모델에 단순 질의문만 입력으로 사용했을 때의 성능 F1 67.5%에 비해, 다양한 프롬프트를 입력으로 사용한 경우 1.6%p 향상된 F1 69.1%을 보였다. 또한, 다양한 프롬프트와 함께 제안 모델을 사용했을 때에는 기본 모델보다 2.2%p 높은 F1 69.7%을 달성했다.

  • PDF

Design of a Question-Answering System based on RAG Model for Domestic Companies

  • Gwang-Wu Yi;Soo Kyun Kim
    • Journal of the Korea Society of Computer and Information
    • /
    • v.29 no.7
    • /
    • pp.81-88
    • /
    • 2024
  • Despite the rapid growth of the generative AI market and significant interest from domestic companies and institutions, concerns about the provision of inaccurate information and potential information leaks have emerged as major factors hindering the adoption of generative AI. To address these issues, this paper designs and implements a question-answering system based on the Retrieval-Augmented Generation (RAG) architecture. The proposed method constructs a knowledge database using Korean sentence embeddings and retrieves information relevant to queries through optimized searches, which is then provided to the generative language model. Additionally, it allows users to directly manage the knowledge database to efficiently update changing business information, and it is designed to operate in a private network to reduce the risk of corporate confidential information leakage. This study aims to serve as a useful reference for domestic companies seeking to adopt and utilize generative AI.