• 제목/요약/키워드: Query process

검색결과 526건 처리시간 0.032초

비순서화된 스트림 처리를 위한 슬라이딩 윈도우 기법 (Processing Sliding Windows over Disordered Streams)

  • 김현규;김철기;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.590-599
    • /
    • 2006
  • 비순서화된 스트림은 슬라이딩 윈도우의 생성에 있어서 두 가지 문제점을 야기한다. 첫째는 스트림을 효율적으로 정렬하는 문제이며, 둘째는 정렬된 스트림으로부터 윈도우를 언제 생성할지 결정하는 문제이다. 본 논문에서는 이러한 문제를 해결하기 위한 윈도우 오퍼레이터의 구조와 방법에 대해 제안한다. 먼저 입력 튜플을 효율적으로 정렬하고 저장하기 위해 인덱스를 이용한 오퍼레이터의 구조를 소개한다. 그리고 윈도우의 생성 시점을 결정하기 위한 평균-기반 추정 방식을 제안한다. 제안하는 기법에서는 추정에 필요한 매개변수를 질외문에서 정의할 수 있으며, 이를 통해 사용자가 어플리케이션의 요구사항에 따라 정확성이나 응답 시간과 같은 질의 결과의 특성을 조절할 수 있도록 지원한다. 본 논문의 실험 결과는 제안한 평균-기반 방식이 기존의 연구에서 이용한 방식보다 적응성과 안정성이 우수하다는 것을 보인다.

오픈소스 기반의 하수 시설물 데이터베이스의 효율적 구축 (Efficient Construction of Open Source-based Sewage Facility Database)

  • 고정상;徐春旭;윤희천
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.393-402
    • /
    • 2022
  • 지하시설물의 효과적인 데이터의 관리는 인간 삶 측면에서 매우 중요하다. 여기에는 최신성의 정확도 높은 데이터의 입력이 선행되어야 한다. 그래서 효율적인 데이터를 입력을 위한 방법이 중요하다. 본 연구에서는 오픈소스(open source) 소프트웨어를 활용하여 하수 시설물 현장조사 프로그램을 개발함으로써 종이도면을 태블릿PC로 대체할 수 있도록 하였다. 태블릿PC를 활용하여 현장에서 취득하는 도형 및 속성정보를 데이터베이스 서버를 통해 실시간으로 전송하도록 하였으며, PostGIS 쿼리(query)를 개발하여 구조화편집 자동화로 하수 시설물 GIS (Geographic Information System) 데이터베이스 구축에 수작업을 최소화하였다. 또한, 하수 시설물 GIS 데이터베이스 구축 프로그램을 활용하여 데이터베이스 구축을 하였고, 이를 기존방식의 하수 시설물 데이터베이스 구축과 작업공정, 작업시간을 비교·분석한 결과 작업공정이 단순화되었고 작업시간이 단축되었다. 아울러 오픈소스 소프트웨어의 간단한 커스터마이징을 통해 타 분야의 현장조사 및 데이터베이스 구축에 활용할 수 있을 것이다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

웹 서비스 발견을 위해 프로세스 정보를 기술하는 온톨로지 (Ontology describing Process Information for Web Services Discovery)

  • 유정연;이규철
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.151-175
    • /
    • 2007
  • 지금까지 시맨틱 웹 서비스 발견은 WSMO나 OWL-S의 프로파일을 이용하여 수행되어 왔다. 그러나 이 연구들은 서비스의 이름과 input/output만을 이용하여 검색함으로써, 배송 후 지불을 하는 도서 판매 서비스를 찾아라.' 와 같이 서비스의 내부 정보에 대한 질의를 수행할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 TM-S 온톨로지와 TMS-QL을 제시한다. TM-S 온톨로지는 프로세스 정보를 이용하여 서비스의 행동을 기술하며, 3가지 하위 온톨로지인 프로세스 시그니처 온톨로지, 프로세스 구조 온톨로지, 프로세스개념 온톨로지로 구성되어 있다. TMS-QL은 사용자가 TM-S 온톨로지에 대해 질의 요구를 기술할 수 있는 언어를 제공한다.

  • PDF

A Novel Query-by-Singing/Humming Method by Estimating Matching Positions Based on Multi-layered Perceptron

  • Pham, Tuyen Danh;Nam, Gi Pyo;Shin, Kwang Yong;Park, Kang Ryoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권7호
    • /
    • pp.1657-1670
    • /
    • 2013
  • The increase in the number of music files in smart phone and MP3 player makes it difficult to find the music files which people want. So, Query-by-Singing/Humming (QbSH) systems have been developed to retrieve music from a user's humming or singing without having to know detailed information about the title or singer of song. Most previous researches on QbSH have been conducted using musical instrument digital interface (MIDI) files as reference songs. However, the production of MIDI files is a time-consuming process. In addition, more and more music files are newly published with the development of music market. Consequently, the method of using the more common MPEG-1 audio layer 3 (MP3) files for reference songs is considered as an alternative. However, there is little previous research on QbSH with MP3 files because an MP3 file has a different waveform due to background music and multiple (polyphonic) melodies compared to the humming/singing query. To overcome these problems, we propose a new QbSH method using MP3 files on mobile device. This research is novel in four ways. First, this is the first research on QbSH using MP3 files as reference songs. Second, the start and end positions on the MP3 file to be matched are estimated by using multi-layered perceptron (MLP) prior to performing the matching with humming/singing query file. Third, for more accurate results, four MLPs are used, which produce the start and end positions for dynamic time warping (DTW) matching algorithm, and those for chroma-based DTW algorithm, respectively. Fourth, two matching scores by the DTW and chroma-based DTW algorithms are combined by using PRODUCT rule, through which a higher matching accuracy is obtained. Experimental results with AFA MP3 database show that the accuracy (Top 1 accuracy of 98%, with an MRR of 0.989) of the proposed method is much higher than that of other methods. We also showed the effectiveness of the proposed system on consumer mobile device.

n-gram/2L: 공간 및 시간 효율적인 2단계 n-gram 역색인 구조 (n-Gram/2L: A Space and Time Efficient Two-Level n-Gram Inverted Index Structure)

  • 김민수;황규영;이재길;이민재
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권1호
    • /
    • pp.12-31
    • /
    • 2006
  • n-gram 기반 역색인 구조는 언어 중립적이고 에러 허용적인 장점들로 인해 일부 아시아권 언어에 대한 정보 검색이나 단백질과 DNA의 sequence의 근사 문자열 매칭에 유용하게 사용되고 있다. 그러나, n-gram 기반의 역색인 구조는 색인의 크기가 크고 질의 처리 시간이 오래 걸린다는 단점들을 가지고 있다. 이에 본 논문에서는 n-gram 기반 역색인의 장점을 그대로 유지하면서 색인의 크기를 줄이고 질의 처리 성능을 향상시킨 2단계 n-gram 역색인(간단히 n-gram/2L 역색인이라 부른다)을 제안한다. n-gram/2L 역색인은 n-gram 기반 역색인에 존재하던 위치 정보의 중복을 제거한다. 이를 위해 문서로부터 길이 m의 m-subsequence들을 추출하고, 그 m-subsequence들로부터 n-gram을 추출하여 2단계로 역색인을 구성한다. 이러한 2단계 구성 방법은 이론적으로 의미 있는 다치 종속성이 존재하는 릴레이션을 정규화하여 중복을 제거하는 것과 동일하며, 이를 본문에서 정형적으로 증명한다. n-gram/2L 역색인은 데이타의 크기가 커질 수록 n-gram 역색인에 비해 색인 크기가 줄어들며 질의 처리 성능이 향상되고, 질의 문자열의 길이가 길어져도 질의 처리 시간이 거의 증가하지 않는 좋은 특성을 가진다. 1GByte 크기의 데이타에 대한 실험을 통하여, n-gram/2L 역색인은 n-gram 기반 역색인에 비해 최대 1.9${\~}$2.7배 더 작은 크기를 가지면서, 동시에 질의 처리 성능은 3${\~}$18 범위의 길이를 가지는 질의들에 대해 최대 13.1배 향상됨을 보였다.

이동체 데이터베이스를 위한 디클러스터링 정책 (Declustering Method for Moving Object Database)

  • 서영덕;홍은석;홍봉희
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1399-1408
    • /
    • 2004
  • 이동체 데이터베이스에서 이동체 궤적의 양은 엄청나게 많아서 기존의 단일 디스크 기반에서는 특정 영역의 질의에 대한 빠른 응답과 처리율의 향상을 볼 수 없다. 따라서 고성능 질의 처리를 위한 시스템의 성능 향상을 위해서는 병렬 처리 기법의 도입이 필요하다. 기존의 디클러스터링 방법에서는 시간이 지남에 따라 연속적으로 보고되는 이동체 특성을 고려하지 않고 있다. 그러므로 대용량 이동체 데이터에 대하여 고성능 질의 처리를 위한 새로운 디클러스터링 방법이 필요하다. 이 논문에서는 대용량 이동체 데이테베이스에 대한 고성능 질의 처리를 위한 새로운 디클러스터링 정책을 제시하였다. 이동체 데이터의 MBB(Minimum Bounding Box) 중 공간 좌표에 대한 근접성만을 고려하여 하나의 SD(SemiAllocation Disk)값을 설정하고 그 값과 시간 도메인을 다시 고려하여 근접성을 계산함으로써 디클러스터링을 한다. 또한 디스크 별 부하 균등하를 고려하여 보다 정확한 디클러스터링 효과를 가지도록 하였다. 이와 같이 이동체의 시공간 특성을 고려한 새로운 디클러스터링 정책으로 시스템의 성능을 향상 시킬 수 있다. 성능평가를 통해서 기존의 Round-Robin 방법보다는 $5\%,\;10\$ 영역 질의에서 평균 $15\%$ 정도의 성능향상을 보였으며 Spatial Proximity 방법보다는 평균 $5\%$의 성능향상을 보였다.

문서 확장을 이용한 표제어 검색시스템 (Headword Finding System Using Document Expansion)

  • 김재훈;김형철
    • 정보관리연구
    • /
    • 제42권4호
    • /
    • pp.137-154
    • /
    • 2011
  • 표제어 검색시스템은 뜻풀이를 질의로 간주하는 정보검색 시스템이다. 이러한 시스템을 구축하기 위한 가장 간단한 방법으로 사전의 표제어 뜻풀이(사전 뜻풀이)를 문서로 간주하는 정보검색 시스템을 구축하는 것이다. 이 문서의 길이가 너무 짧아 사용자 질의(사용자 뜻풀이)에 대한 적절한 표제어를 검색하기 어렵다. 이 문제를 완화하기 위해서 본 논문에서는 정보검색에서 사용되는 질의 확장 개념을 문서 확장에 적용한다. 본 논문에서는 문서 확장 방법으로는 뜻풀이 확장과 유의어 확장을 사용한다. 뜻풀이 확장은 주어진 단어의 사전 뜻풀이에 속하는 단어의 뜻풀이를 문서에 포함시키는 방법이고, 유의어 확장은 무자질 군집화 알고리즘을 통해서 유의어를 찾고, 찾아진 유의어를 문서에 포함시키는 방법이다. 제안된 표제어 검색시스템은 사전 뜻풀이 그 자체를 입력으로 할 때, 16-포함률이 거의 100%에 달하였다. 또한 사용자 뜻풀이를 입력으로 할 때, 20-포함률이 66.9%였다. 사용자 뜻풀이가 단어의 의미를 충분히 전달할 수 없는 것으로 관찰되었으며 앞으로 정확하고 객관적인 평가를 위해서 평가 집합에 대한 연구가 추가적으로 필요한 실정이다.

Using Skylines on Wavelet Synopses for CKNN Queries over Distributed Streams Processing

  • Wang, Ling;Zhou, TieHua;Kim, Kwang-Deuk;Lee, Yang-Koo;Ryu, Keun-Ho
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.7-12
    • /
    • 2009
  • In this paper, we discuss the problem of continuous k.nearest neighbors (CKNN) monitoring over distributed streams wavelet synopses, which also considered sliding window structure under stream based kNN query. We developed traditional skylines techniques and propose a new method which called DR.skylines to process CKNN queries as a bandwidth.efficient approach. It tries to process CKNN queries on synopses for optimized sliding window time and space computation.

  • PDF

A Representation Model for Reusable Assets To Support User Context

  • Hadji, Hend Ben;Choi, Ho-Jin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (A)
    • /
    • pp.55-59
    • /
    • 2008
  • In the field of software reuse, several methods for storage and retrieval of assets abound. However, these methods often find their limits; they fail to turn up the suitable reusable assets that satisfy the needs of a particular software system under development. Two problems are the root cause of this situation. One is the lack of accurate semantics for describing software assets. The other is the ignorance of the user query context. In such a context, this paper presents an XML-based asset representation model for describing all kinds of software asset that can be reused within software development process. The proposed model provides semantic metadata for describing assets oriented user context in order to build the foundation for semantic reasoning in the retrieval process.

  • PDF