• 제목/요약/키워드: Query Patterns

검색결과 104건 처리시간 0.024초

질의 감성 표시자와 유사도 피드백을 이용한 감성 영상 검색 (Emotion Image Retrieval through Query Emotion Descriptor and Relevance Feedback)

  • 유헌우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.141-152
    • /
    • 2005
  • 본 논문에서는 새로운 감성기반 영상검색방법을 제안한다. 서로 다른 색상, 명도, 도트크기를 나타내는 30개의 랜덤 패턴이 제시될 때 인간이 느끼는13가지 감성("like", "beautiful", "natural", "dynamic", "warm", "gay", "cheerful", "unstable", "light", "strong", "gaudy", "hard", "heavy") 평가 데이타로부터 질의 칼라코드와 질의 그레이코드로 명명한 질의 감성 표시자를 설계한다. 감성영상검색을 위해서 질의 감성을 선택하면 질의를 표현하는 칼라코드와 그레이코드가 선택되고 데이타베이스의 영상의 색상 정보를 나타내는 DB 칼라코드와 명도와 도트크기 정보를 나타내는 DB그레이코드값을 추출하여, 칼라코드간의 매칭과 그레이 코드간의 매칭을 통해 유사도를 판단한다. 또한 검색과정에 사용자의 의도를 반영하여 질의 칼라코드와 질의 그레이코드사이의 가중치와 칼라코드내의 가중치를 자동적으로 갱신하는 새로운 유사도 피드백 방법을 제안한다. 430개의 영상에 대해 실험한 결과 최초 질의에 대해 적합한 영상이 부적합한 영상보다 많았으며 유사도 피드백을 사용함에 따라 적합한 영상의 개수가 증가하였다.

이동 객체 환경에서 거리 관계 패턴 기반 k-최근접 질의 처리 기법 (A k-NN Query Processing Method based on Distance Relation Patterns in Moving Object Environments)

  • 박용훈;서동민;복경수;이병엽;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.215-225
    • /
    • 2009
  • 최근 유클리드 공간 상에서 효율적인 k-최근접(k-Nearest Neighbors) 질의 처리를 위해 그리드 구조 기반의 많은 색인 기법들이 연구되었다. 하지만 기존 기법들은 k-최근접 객체들을 연산하기 위해 불필요한 셀을 접근하여 연산 자원을 낭비하거나 근접한 셀을 알아내는데 매우 큰 연산 비용을 초래한다. 그래서 본 논문에서는 한 셀과 주변 셀과의 거리 관계를 나타내는 거리 관계 패턴을 이용하여 k-최근접 질의 처리시 적은 연산 비용과 적은 저장 공간을 사용하는 새로운 k-최근접 질의 처리 기법을 제안한다. 본 논문에서는 k-최근접 질의 처리의 대표적인 기법인 CPM과 성능을 비교하여 제안하는 기법의 우수성을 입증한다.

Multitier 웹 어플리케이션 환경에서 악의적인 SQL Query 탐지를 위한 HTTP Request - SQL Query 매핑 기법 (HTTP Request - SQL Query Mapping Scheme for Malicious SQL Query Detection in Multitier Web Applications)

  • 서영웅;박승영
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지속적으로 증가하는 인터넷 서비스 요구사항을 만족하기 위하여 인터넷 서비스를 제공하는 시스템은 웹 서버와 DB(database) 서버로 구성된 multitier 구조로 변화되어왔다. 이러한 multitier 웹 어플리케이션 환경에서 기존의 IDS(intrusion detection system)는 웹 서버와 DB 서버에서 misused traffic pattern들이나 signature들을 매칭하여 이미 알려진 공격을 검출하고 해당 접속을 차단하는 방식으로 동작한다. 하지만 이러한 방식의 IDS는 정상적인 HTTP(hypertext transfer protocol) request를 이용하여 악의적으로 DB 서버의 내용의 변조를 시도하는 attacker의 공격을 DB 서버단에서 제대로 검출하지 못한다. 그 이유는 DB 서버는 웹 서버로부터 받은 SQL(structured query language) query가 어떤 사용자의 HTTP request에 의해 발생한 것인지 알지 못하는 상태에서 처리하며, 웹 서버는 SQL query 처리 결과 중 어떤 것이 악의적으로 DB 서버 변조를 시도한 SQL query에 의한 결과인지 알 수 없기 때문이다. 이런 공격을 검출하기 위해서는 HTTP request와 SQL query 사이의 상호작용관계를 명확히 파악하고, 이를 이용하여 악의적인 SQL query를 발생시킨 사용자를 추적해야 한다. 이를 위해서는 해당 시스템의 소스코드를 분석하거나 application logic을 완벽하게 파악해야 하므로 현실적으로 불가능하다. 본 논문에서는 웹 서버와 DB 서버에서 제공하는 로그만을 이용하여 모든 HTTP request와 SQL query간의 mapping 관계를 찾아내고, 이를 이용하여 특정 SQL query를 발생시킨 HTTP request를 추정하는 기법을 제안한다. 모의실험을 통하여 94%의 정확도로 HTTP request를 추정할 수 있음을 확인하였다.

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

DRAZ : 이기종 메타 데이터 소스를 위한 SPARQL 쿼리 엔진 (DRAZ: SPARQL Query Engine for heterogeneous metadata sources)

  • 우메이르 쿠두스;엠디 이브라힘 호세인;이창주;키파야트 울아 칸;원희선;이영구
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.69-85
    • /
    • 2018
  • 최근 DCAT, CKAN 같은 동종 데이터 집합에 대해 질의를 동시에 수행하여 쿼리 결과의 품질을 크게 향상하는 페더레이션 쿼리 엔진이 활발하게 연구되고 있다. 하지만 기존 연구는 비표준 쿼리를 사용하며 정적 바인딩을 적용한 몇 가지 이기종 데이터 집합 또는 동종 데이터 집합에 대해서만 질의 할 수 있다. 본 논문에서는 SPARQL을 사용하여 여러 데이터 소스에 질의하는 페더레이티드 엔진 (DRAZ)을 제안한다. 제안하는 시스템에서는 주어진 SPARQL 쿼리의 모든 트리플 패턴을 API 호출로 변환하여 해당 데이터셋에 접근한다. 마지막으로 모든 API 호출 결과를 N-트리플로 변환하고 모든 트리플 패턴을 고려한 최종 결과를 요약한다. 우리는 제안하는 DRAZ를 DCAT 및 DOI와 같은 이기종 메타 데이터 표준을 고려하여 수정된 Fedbench 벤치 마크 질의를 사용하여 평가하였다. 제안하는 시스템인 DRAZ가 JOIN 작업을 사용할 수 없음에도 불구하고 결과의 70-100 % 정확도를 달성 할 수 있음을 실험을 통해 확인하였다.

Multi-Feature Clustering을 이용한 강인한 내용 기반 음악 장르 분류 시스템에 관한 연구 (A Study on the Robust Content-Based Musical Genre Classification System Using Multi-Feature Clustering)

  • 윤원중;이강규;박규식
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.115-120
    • /
    • 2005
  • 본 논문에서는 multi-feature clustering(MFC) 방법을 이용한 강인한 내용 기반 음악 장르 분류 알고리즘을 제안한다. 기존 연구와 비교하여 본 논문에서는 입력 질의 패턴(또는 구간)과 입력 질의 길이의 변화에 따라 나타나는 불안정한 시스템 성능을 개선하는데 노력하였고, k-means clustering 기법에 기반한 multi-feature clustering(MFC)이라는 새로운 알고리즘을 제안하였다. 제안된 시스템의 성능을 검증하기 위해 질의 음악 파일의 서로 다른 여러 구간에서 질의 길이를 다변화하여 음악 특징 계수를 추출하였고, MFC 방법을 사용한 시스템과 MFC 방법을 사용하지 않은 시스템에 대한 장르 분류 성공률을 비교하여 제안 알고리즘의 성능을 비교${\cdot}$분석하였다. 모의실험 결과 MFC 방법을 사용한 시스템의 장르 분류 성공률이 높게 나타났고, 시스템의 안정성 역시 높게 나타났다.

질의어 패턴 자동분석을 통한 커뮤니티 기반 개인화 검색 (Personalized Search based on Community through Automatic Analysis of Query Patterns)

  • 박건우;이상훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.321-326
    • /
    • 2009
  • 기존의 웹 검색 엔진들은 사용자의 검색 의도를 충분히 반영하지 못하기 때문에 사용자가 원하는 정확한 정보를 찾기가 어렵다. 따라서 최근에는 개인의 검색 패턴을 분석하여 검색에 반영함으로써 검색 결과에 대한 만족도를 높이기 위한 많은 연구들이 진행되고 있다. 이러한 개인화 검색을 통해 사용자는 방대한 웹상의 정보들 중 자신의 검색 의도에 보다 적합하고 정확한 정보를 획득할 수 있다. 본 논문에서는 웹 사용자들의 질의어 사용 빈도수(Frequency)에 대한 랭킹 정보를 통해 최근 주요 관심사(Interest)를 파악하고, 주요 관심사 별로 형성된 커뮤니티(Community)를 기반으로 수행되는 개인화 검색 방안을 제안한다. 실험결과 질의어 빈도수, 관심사 및 커뮤니티를 검색에 반영할 경우 개인의 검색 의도에 보다 적합한 검색 결과가 제공되는 것을 확인할 수 있다.

A Pattern-based Query Strategy in Wireless Sensor Network

  • Ding, Yanhong;Qiu, Tie;Jiang, He;Sun, Weifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권6호
    • /
    • pp.1546-1564
    • /
    • 2012
  • Pattern-based query processing has not attracted much attention in wireless sensor network though its counterpart has been studied extensively in data stream. The methods used for data stream usually consume large memory and much energy. This conflicts with the fact that wireless sensor networks are heavily constrained by their hardware resources. In this paper, we use piece wise representation to represent sensor nodes' collected data to save sensor nodes' memory and to reduce the energy consumption for query. After getting data stream's and patterns' approximated line segments, we record each line's slope. We do similar matching on slope sequences. We compute the dynamic time warping distance between slope sequences. If the distance is less than user defined threshold, we say that the subsequence is similar to the pattern. We do experiments on STM32W108 processor to evaluate our strategy's performance compared with naive method. The results show that our strategy's matching precision is less than that of naive method, but our method's energy consumption is much better than that of naive approach. The strategy proposed in this paper can be used in wireless sensor network to process pattern-based queries.

공간 순서화 곡선을 이용한 다차원 영역 질의 처리 (A Multi-dimensional Range Query Processing using Space Filling Curves)

  • 백현;원정임;윤지희
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권2호
    • /
    • pp.13-38
    • /
    • 2006
  • 다차원 공간 객체를 위한 영역 질의는 다차원 공간상에서 질의 영역과 교차 또는 포함되는 객체들을 검색하는 가장 기본적인 공간 연산이다. 영역 질의 처리를 위한 인덱스 기법으로서 공간 순서화 곡선을 이용하여 다차원 공간 객체의 MBR 정보를 1차원 값으로 변환하여 저장하는 DOT(DOuble Transformation) 인덱스 기법이 알려져 있다. 이 기법은 데이터베이스 시스템의 주색인 기법을 그대로 적용할 수 있는 장점을 갖으나, 중간 공간에 설정된 다차원 질의 영역을 최종 공간상의 1차원 값의 집합으로 변환하는 공간 변환 연산에 대한 오버헤드가 매우 크다는 문제점이 있으며, 원 공간을 2차원 이상으로 확장하여 적용할 수 있는 구체적인 영역 질의 방법이 연구된 바 없다. 본 논문에서는 다차원 공간 질의 영역 상의 공간 순서화 곡선의 규칙성을 분석함으로써 공간 변환 연산의 횟수를 대폭 감소시킨 효율적인 다차원 공간 영역 질의 처리 기법을 제안한다. 제안된 기법에서는 공간 변환 연산의 비용을 감소시키기 위하여 질의 영역을 공간 순서화 곡선이 연속 운행되는 최대 크기의 쿼터로 분할하는 쿼터 분할 기법을 사용한다. 제안된 기법에 의한 다차원 영역 질의 처리 과정을 시각적으로 확인할 수 있는 시뮬레이터를 구현하였으며, 이를 이용한 성능평가 결과를 보였다.

  • PDF

시맨틱 웹 기반의 분산 시스템을 위한 질의 변환 및 인덱싱 기법 (Query Rewriting and Indexing Schemes for Distributed Systems based on the Semantic Web)

  • 채광주;김연희;임해철
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.718-722
    • /
    • 2008
  • 시맨틱 웹의 기반이 되는 온톨로지는 기술 언어로 OWL이 발표되면서, 웹 리소스의 의미를 더욱 다양하게 기술할 수 있는 강한 표현력을 갖추어 가고 있다. 그리고, 시맨틱 웹의 개념이 널리 인식되면서 정보의 양이 더욱 많아지고 온톨로지가 지역적으로 분산되어 구축됨에 따라, 분산 환경에서 원하는 데이타를 포함하고 있는 지역 저장소를 빠르게 검색하는 것이 전체 시스템의 성능에 중요한 영향을 미치게 되었다. 따라서 본 논문에서는 첫째, 분산된 온톨로지 환경에서 사용자가 원하는 데이타가 위치하고 있는 지역 저장소를 빠르게 검색하기 위한 인덱스 구조를 제안한다. 둘째, 분산 환경을 지원할 수 있는 OWL의 다양한 표현을 이용하여 질의를 확장하기 위한 질의 변환 기법을 제안한다. 본 논문에서 제안한 기법을 통해 OWL의 다양한 표현을 활용하는 것이 가능하고, 시맨틱 웹 환경의 모든 질의 유형에 대해 데이타가 존재하는 지역 저장소를 빠르게 파악할 수 있다.