• Title/Summary/Keyword: 질의 전달

Search Result 665, Processing Time 0.029 seconds

A Design of HTML Tag Stack and HTML Embedding Method to Improve Web Document Question Answering Performance of BERT (BERT 의 웹 문서 질의 응답 성능 향상을 위한 HTML 태그 스택 및 HTML 임베딩 기법 설계)

  • Mok, Jin-Wang;Lee, Hyun-Seob
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.583-585
    • /
    • 2022
  • 최근 기술의 발전으로 인해 자연어 처리 모델의 성능이 증가하고 있다. 그에 따라 평문 지문이 아닌 KorQuAD 2.0 과 같은 웹 문서를 지문으로 하는 기계 독해 과제를 해결하려는 연구가 증가하고 있다. 최근 기계 독해 과제의 대부분의 모델은 트랜스포머를 기반으로 하는 추세를 보인다. 그 중 대표적인 모델인 BERT 는 문자열의 순서에 대한 정보를 임베딩 과정에서 전달받는다. 한편 웹 문서는 태그 구조가 존재하므로 문서를 이해하는데 위치 정보 외에도 태그 정보도 유용하게 사용될 수 있다. 그러나 BERT 의 기존 임베딩은 웹 문서의 태그 정보를 추가적으로 모델에 전달하지 않는다는 문제가 있었다. 본 논문에서는 BERT 에 웹 문서 태그 정보를 효과적으로 전달할 수 있는 HTML 임베딩 기법 및 이를 위한 전처리 기법으로 HTML 태그 스택을 소개한다. HTML 태그 스택은 HTML 태그의 정보들을 추출할 수 있고 HTML 임베딩 기법은 이 정보들을 BERT 의 임베딩 과정에 입력으로 추가함으로써 웹 문서 질의 응답 과제의 성능 향상을 기대할 수 있다.

An Efficient Range Search and Nearest Neighbor Search Algorithm for Action Parts of Active Systems in Sparse Area (능동 시스템에서 위치관련 액션 수행을 위한 희소공간 공간객체의 효율적인 영역질의와 최근접질의)

  • Kim, Jung-Il;Hong, Dong-Kweon
    • The KIPS Transactions:PartD
    • /
    • v.8D no.2
    • /
    • pp.125-131
    • /
    • 2001
  • Various kind of disasters happens in our society. Most of them require immediate treatment to save life or to protect valuable products. When an accident happens in a place, it is reported to the headquarter of emergency measures system. According to the nature of accident several treatments orders are transmitted to the related authorities. In this paper, we introduce an intelligent emergency measures system that uses trigger mechanism of active databases. The system responds to various events spontaneously without intervention of mankind by triggering proper rules. The most important part of an action in the system is the capability of searching places to apply adequate treatments quickly. We have developed a new method for range queries and nearest neighbor queries which utilize the z-ordering technique to get fast responses. Those new methods are further extended to handle more realistic actual distance of road among positions.

  • PDF

A XML-Based Approach to Integrate Heterogeneous Information (XML 기반의 이질 정보의 통합 방법론)

  • 이경하;이강찬;이규철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.96-98
    • /
    • 1999
  • 현재의 인터넷은 HTML 뿐만 아니라 다양한 멀티미디어 문서 포맷 및 질의 가능한 정보를 제공할 수 있도록 발전함에 따라 단순한 정보 전달만이 아닌 하나의 통신 수단으로써 활용되는 양상을 띄고 있다. 또한, XML의 등장으로 인하여 구조적 문서 정보를 전달할 수 있도록 발전하고 있다. 인터넷의 비약적인 발전에 따라 기존의 정보 시스템들은 인터넷을 통하여 기존에 존재하던 데이터들을 서비스할 수 있도록 새로 작성되거나 재구축되어 왔다. 이런 경우 기존의 정보시스템들이 제공하는 데이터들은 질의 형식 및 데이터 모델, 스키마 구조, 사용하는 시스템에서 이질적인 특성을 가지고 있으며, 서로 자치적인 시스템으로써 분산되어 존재한다는 특성을 지니고 있다. 본 논문에서는 이런 이질적으로 분산되어 있는 인터넷 데이터들을 XML을 공통 데이터 모델로 이용하는 미디에이터 방식을 방식을 이용하여 통합하는 방법(XMF: XML-Based Mediation Framework)을 제시한다.

  • PDF

Load Balancing Method for Query Processing Based on Cache Management in the Grid Database (그리드 데이터베이스에서 질의 처리를 위한 캐쉬 관리 기반의 부하분산 기법)

  • Shin, Soong-Sun;Back, Sung-Ha;Eo, Sang-Hun;Lee, Dong-Wook;Kim, Gyoung-Bae;Chung, Weon-Il;Bae, Hae-Young
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.7
    • /
    • pp.914-927
    • /
    • 2008
  • Grid database management systems are used for large data processing, high availability and data integration in grid computing. Furthermore the grid database management systems are in the use of manipulating the queries that are sent to distributed nodes for efficient query processing. However, when the query processing is concentrated in a random node, it will be occurred with imbalance workload and decreased query processing. In this paper we propose a load balancing method for query processing based on cache Management in grid databases. This proposed method focuses on managing a cache in nodes by cache manager. The cache manager connects a node to area group and then the cache manager maintains a cached meta information in node. A node is used for caching the efficient meta information which is propagated to other node using cache manager. The workload of node is distributed by using caching meta information of node. This paper shows that there is an obvious improvement compared with existing methods, through adopting the proposed algorithm.

  • PDF

Data Dissemination Protocol for Supporting Both Sink Mobility and Event Mobility in Wireless Sensor Networks (무선 센서 네트워크에서 싱크 이동성과 이벤트 이동성을 지원하는 데이타 전달 프로토콜)

  • Choi, Young-Hwan;Lee, Dong-Hun;Ye, Tian;Jin, Min-Sook;Kim, Sang-Ha
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.3
    • /
    • pp.316-320
    • /
    • 2008
  • Data dissemination schemes for wireless sensor networks, where sinks and event targets might be mobile, has been one of the active research fields. For doing that, stationary nodes gathered data on behalf of mobile sinks and the relayed data in previous studies. their schemes, however, lead to frequent query flooding and report congestion problems over sink moving. We propose a data dissemination protocol to solve both the query flooding and the report congestion problem. Our scheme improves the two shortcomings through sink location management. Finally, we prove effectiveness of our protocol through computer simulations.

Load Balancing Method Using Proximity of Query Region in Web GIS Clustering System (Web GIS 클러스터링 시스템에서 질의 영역의 인접성을 이용한 로드 밸런싱 기법)

  • 장용일;이찬구;이충호;이재동;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.214-216
    • /
    • 2001
  • 웹 GIS에서의 인터넷 서비스 이용자의 집중 현상으로 발생하는 서버의 과부하 현상을 막고 안정적인 서비스 제공을 위해서는 웹 클러스터링 기술의 도입이 필요하다. 공간 질의는 웹 데이터와는 달리 인접 영역에 대한 질의가 매우 잣으며, 질의 처리 결과가 대용량이라는 특성을 가지고 있다. 이러한 공간 질의의 특성을 고려하지 않을 경우, 서버에서 처리되는 질의들의 지역적 인접성이 낮아지고 낮은 버퍼 재 사용율은 디스크로의 접근 빈도를 높여 질의 처리 비용을 증가시키는 원인이 된다. 본 논문에서는 웹 GIS 클러스터링 시스템을 위한 질의 영역의 인접성을 이용한 로드 밸런싱 기법을 제안한다. 제안하는 기법은 공간 데이터를 타일을 기반으로 인접한 타일의 그룹을 생성하여 각 서버에 할당하여, 질의 영역 및 공간 연산을 고려하여 서버에서 질의가 처리되는 동안 버퍼 재사용율이 최대가 되도록 클라이언트의 질의 요청을 적절한 서버에 전달한다. 제안하는 기법은 서버의 버퍼를 공간 인덱스 탐색에 최적화함으로써 서버의 버퍼 재상용율을 높이고, 클러스터링 시스템에서 디스크의 접근 횟수를 낮추어, 전체적인 서버 시스템의 처리 능력을 형상시킨다.

  • PDF

Poly-encoder based COVID-19 Question and Answering with Task Adaptation (Poly-encoder기반의 COVID-19 질의 응답 태스크)

  • Lee, Seolhwa;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.188-191
    • /
    • 2020
  • 본 연구는 COVID-19 질의 응답 태스크를 위한 Poly-encoder 기반의 태스크를 제안하였다. COVID-19 질의 응답 시스템은 사람들에게 최신 정보에 대해 빠르고 신뢰성이 높은 정보를 전달하는 특성을 가져야한다. 검색 기반 질의 응답 시스템은 pairwise 연산을 기반으로 수행되는데, Poly-encoder는 사전 학습된 트랜스포머(transformer)기반의 pairwise 연산 방법론 중 기존 Cross-encoder와 Bi-encoder보다 실사용 및 성능이 뛰어남을 보였다 [1]. 특히, Poly-encoder는 정확도가 높으면서도 빠른 응답속도를 가지며 검색기반의 각종 태스크에서 좋은 성능을 보였다. 따라서 본 연구는 COVID-19를 위한 Poly-encoder기반의 질의 응답 태스크를 위하여 기존 질의 응답 태스크와 페르소나 기반의 질의 응답 태스크로 두 가지 유형의 태스크를 생성하여 모델을 학습하였다. 또한 신뢰성 있는 리소스정보로부터 모델에 최신 정보 반영을 위하여 자동 크롤러를 구축하여 데이터를 수집하였다. 마지막으로 전문가를 통한 데이터셋을 구축하여 질문-응답과 질의어-질문에 대한 모델 검증을 수행하였다.

  • PDF

역삼투막에서 물질전달에 영향을 주는 인자들에 대한 고찰

  • 이동진;민병렬
    • Proceedings of the Membrane Society of Korea Conference
    • /
    • 1996.04a
    • /
    • pp.44-45
    • /
    • 1996
  • 역삼투막을 통한 물질전달에 대해서는 많은 모델식이 제안되어 왔으며, 이들을 통해 막의 특성을 규정하여 왔다. 역삼투막을 통한 물질전달에는 많은 변수가 있으며, 이들 가운데 일부는 정량적으로 측정할 수 없는 부분이 포함되어 있으며, 기존의 방법은 이들을 실험을 통해 정해지는 막이나 공정에 의존하는 특성값으로 고려하였다. 본 연구논문은 이와 같은 막특성값으로 간주되어온 분배계수의 고찰을 토대로 막분리 과정에서 일어나는 물질전달현상을 막물질의 특성과 연계하여 설명하고 이로부터 막분리에 유리한 막물질형태의 제안을 목적으로 하고 있다.

  • PDF

Energy-Efficient Routing for Data Collection in Sensor Networks (센서 네트워크에서의 데이타 수집을 위한 라우팅 기법)

  • Song, In-Chul;Roh, Yo-Han;Hyun, Dong-Joon;Kim, Myoung-Ho
    • Journal of KIISE:Databases
    • /
    • v.33 no.2
    • /
    • pp.188-200
    • /
    • 2006
  • Once a continuous query, which is commonly used in sensor networks, is issued, the query is executed many times with a certain interval and the results of those query executions are collected to the base station. Since this comes many communication messages continuously, it is important to reduce communication cost for collecting data to the base station. In sensor networks, in-network processing reduces the number of message transmissions by partially aggregating results of an aggregate query in intermediate nodes, or merging the results in one message, resulting in reduction of communication cost. In this paper, we propose a routing tree for sensor nodes that qualify the given query predicate, called the query specific routing tree(QSRT). The idea of the QSRT is to maximize in-network processing opportunity. A QSRT is created seperately for each query during dissemination of the query. It is constructed in such a way that during the collection of query results partial aggregation and packet merging of intermediate results can be fully utilized. Our experimental results show that our proposed method can reduce message transmissions more than 18% compared to the existing one.

Design and Implementation of Scaling-Invariant Boundary Image Matching System (스케일링-불변 윤곽선 이미지 매칭 시스템의 설계 및 구현)

  • Kim, Bum-Soo;Kim, Sang-Pil;Moon, Yang-Sae;Choi, Mi-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.28-30
    • /
    • 2012
  • 본 논문에서는 시계열 매칭 기술을 활용한 스케일링-불변 윤곽선 이미지 매칭 시스템을 설계 및 구현한다. 윤곽선 이미지를 시계열로 나타낼 경우, 스케일된 유사 이미지들을 찾는데 거리 계산이 용이해지고, 인덱스 사용이 가능하여 대용량 데이터베이스 대상의 빠른 검색이 가능해지게 된다. 이를 위해, 기존연구 내용을 기반으로 사용자의 편의를 위해 GUI 환경의 클라이언트-서버 시스템으로 설계 및 구현한다. 먼저, 클라이언트에서는 사용자의 질의 이미지를 시계열로 변환하여 가로 및 세로의 스케일링 팩터구간과 허용치 ${\varepsilon}$과 함께 서버에 전달한다. 서버에서는 클라이언트에서 전달한 값들을 이용하여 범위 질의를 구성하여 이미 구축해놓은 이미지 시계열 데이터베이스의 인덱스를 통해 유사 이미지들을 찾은 후 그 결과 이미지들을 클라이언트로 전달한다. 구현 결과, 스케일링-불변 윤곽선 이미지 매칭은 직관적이고 정확한 매칭을 수행하는 것으로 나타났다.