• 제목/요약/키워드: top-k 질의처리

검색결과 44건 처리시간 0.041초

그리드 인덱스 기반 뷰 선택 기법을 이용한 효율적인 Top-k 질의처리 알고리즘 (Efficient Top-k Query Processing Algorithm Using Grid Index-based View Selection Method)

  • 홍승태;윤들녁;장재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.76-81
    • /
    • 2015
  • 최근 대용량 데이터의 분석을 위한 top-k 질의처리 알고리즘에 대한 관심이 고조되고 있다. 그러나 기존 top-k 질의처리 알고리즘은 효율적인 인덱스 구조를 제공하지 않기 때문에, 높은 탐색 비용을 야기하며, 아울러 다양한 질의 유형을 지원하지 못하는 문제점이 존재한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 그리드 인덱스 기반 뷰 선택 기법을 이용한 top-k 질의처리 알고리즘을 제안한다. 제안하는 기법은 그리드 인덱스 기반의 뷰 선택 기법을 통해 주어진 질의 영역에 대하여 최소한의 그리드 셀만을 탐색함으로써 질의처리 시간을 감소시킨다. 마지막으로, 성능 평가를 통해 제안하는 top-k 질의처리 알고리즘이 기존 알고리즘에 비해 질의처리 시간 및 질의 결과 정확도 측면에서 우수함을 나타낸다.

Reverse Top-k 질의 처리 방법 비교 및 문제점 분석 (A Comparison and Study among Reverse Top-k Query Methods)

  • 임선영;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1162-1164
    • /
    • 2013
  • Top-k 질의 처리가 사용자가 원하는 데이터를 검색하는 방법인 반면에, Reverse Top-k 질의 처리는 데이터의 관점에서 특정 데이터를 가장 선호할 만한 사용자를 검색하는 방법으로 생산자의 입장에서 매우 중요한 연구이다. 본 논문에서는 Reverse Top-k 질의 처리 방법들을 소개하고 비교 및 문제점을 분석한다.

Convex hull을 사용하는 Top-k 질의처리 방법에 관한 분석 (An Survey on Top-k Query Processing using Convex Hulls)

  • 이지현;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1073-1074
    • /
    • 2012
  • 최근 인터넷의 발달과 사용량의 증가로 데이터의 양이 급증함에 따라 대용량 데이터를 효율적으로 검색하는 top k 질의 처리가 중요시 되고 있다. Layer 기반 방법은 가장 잘 알려진 top k 질의처리 방법이며, 객체의 모든 속성의 값들을 이용하여 객체들을 layer들의 리스트로 구성하는 방법이다. 본 논문에서는 그 중에서 convex hull을 사용하여 layer list를 생성하는 기존 연구를 조사하고 문제점을 파악한다.

무선 센서 네트워크에서 클러스터 기반의 Top-k 질의 처리 (A Cluster-Based Top-k Query Processing Algorithm in Wireless Sensor Networks)

  • 여명호;성동욱;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.306-313
    • /
    • 2009
  • 센서 네트워크 응용 분야에서 Top-k 질의는 가장 높은 혹은 가장 낮은 k개의 센서에 대한 유용한 정보를 제공한다. Top-k 질의 처리 시 에너지 소모를 줄이기 위한 많은 연구들이 진행되었다. FILA의 경우, 필터를 이용하여 불필요한 결과의 갱신을 제거하였으며, PRIM의 경우, 센싱된 데이타의 우선 순위를 부여하여 센서 데이타의 전송을 최소화하는 방법을 제안한다. 하지만, 같은 데이타 범위(프레임)에 속한 모든 데이타를 수집하기 때문에 데이타의 집중이 발생하면 많은 False Positive 데이타를 전송하는 문제가 발생한다. 본 논문에서는 Top-k 결과의 False Positive 데이타를 효과적으로 제거하기 위한 클러스터 기반의 새로운 Top-k 질의 처리 기법을 제안한다. 질의 처리 과정은 클러스터 레벨과 트리 레벨로 나누어지며, 각 레벨의 네트워크 토폴로지의 특성을 활용하여 False Positive 데이타를 효과적으로 필터링 한다. 성능 평가 결과, 기존 Top-k 질의 처리 기법에 비해 False Positive 데이타의 수가 70% 감소하고, 네트워크 수명이 약 105% 연장된다.

센서 네트워크를 위한 데이터 인지 우선순위 기반의 에너지 효율적인 Top-k 질의 처리 (Data-Aware Priority-Based Energy Efficient Top-k Query Processing in Sensor Networks)

  • 여명호;성동욱;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.189-197
    • /
    • 2009
  • Top-k 질의는 많은 센서 네트워크 응용 분야에서 중요하게 사용된다. 기존에 제안된 필터 기반의 Top-k 질의 처리 기법은 질의 결과에 영향을 미치는 값만을 수신하기 위해 각 센서 노드의 측정 허용 범위를 필터로 설정함으로써 센서 데이타의 전송 횟수를 줄인다. 하지만, 센서 데이타의 재검증과 필터의 재배포 과정에서 추가적인 에너지를 소모한다. 또한, 질의 결과값이 빈번히 변경될수록 필터의 재배포 횟수가 증가하여 에너지의 소모가 더욱 증가한다. 본 논문에서는 Top-k 질의를 처리하기 위해서 측정한 데이타를 기반으로 우선 순위를 결정하고, 우선 순위에 따라 최소한의 센서 데이타를 수집하는 새로운 Top-k 질의 처리 기법을 제안한다. 제안하는 기법의 우수성을 보이기 위해서 시뮬레이션을 통한 성능 평가를 수행하였으며, 그 결과 기존 필터 기반의 기법에 비해 네트워크의 수명이 크게 향상되었다.

요약된 Partitioned-Layer Index: Partitioned-Layer Index의 임의 접근 횟수를 줄이는 Top-k 질의 처리 방법 (Abstracted Partitioned-Layer Index: A Top-k Query Processing Method Reducing the Number of Random Accesses of the Partitioned-Layer Index)

  • 허준석
    • 한국멀티미디어학회논문지
    • /
    • 제13권9호
    • /
    • pp.1299-1313
    • /
    • 2010
  • Top-k 질의는 데이터베이스에서 사용자가 가장 원하는 k개의 객체를 구하는 질의이다. Top-k 질의를 효율적으로 처리하는 대표적인 연구로 Partitioned-Layer Index (간단히, PL-index) 방법이 있다. PL-index는 데이터베이스를 여러 개의 더 작은 데이터베이스로 분할하고 각 분할된 데이터베이스에 대해 sublayer들의 list (간단히, sublayer list)를 구성한다. 이때, 분할된 데이터베이스에 대해서 top-i 결과가 될 수 있는 객체들을 그 분할된 데이터베이스에 대한 i번째 sublayer로 구성한다. 그리고 주어진 질의에 맞춰 그 sublayer list들을 병합함으로써 질의 결과를 구한다. PL-index는 질의 처리 시 데이터베이스로부터 읽어 들이는 객체의 개수가 매우 작다는 장점을 가지지만, sublayer list들을 병합할 때에 임의 접근(random access)이 많이 발생하기 때문에 디스크 기반의 데이터베이스 환경에서 질의 처리 성능이 저하된다. 이에 본 논문에서는 임의 접근 횟수를 줄임으로써 디스크 기반의 데이터베이스 환경에서 PL-index의 질의 처리 성능을 크게 향상시키는 요약된(Abstracted) Partitioned-Layer Index (간단히, APL一index)를 제안한다. 먼저, PL-index의 각 sublayer를 가상의 (점) 객체로 요약함으로써 sublayer list들을 이러한 점 객체들의 list들(즉, APL-index)로 변형한다. 그리고 APL-index에 대해 질의 처리를 가상으로 수행하여 실제 질의 처리 시 접근할 sublayer를 예측한다, 그리고 예측된 sublayer들을 sublayer list별로 한꺼번에 읽어 들임으로 PL-index에서 발생하는 임의 접근 횟수를 줄인다. 합성 데이터와 실제 데이터에 대한 실험을 통하여 제안한 APL-index가 PL-index의 임의 접근 횟수를 크게 줄일 수 있음을 보인다.

List 기반의 접근법을 사용하는 Top-k 질의 처리 연구 (A Study on Top-k Query Processing using List-based Approach)

  • 임선영;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1249-1252
    • /
    • 2011
  • 최근 인터넷의 발달과 사용량의 증가로 데이터의 양이 급증하고 있다. 사용자들은 빠른 시간 내에 원하는 검색 결과를 얻기를 원한다. 또한 사용자 마다 모두 다른 선호도를 가지기 때문에 사용자 질의에 기반 하여 검색되어야 한다. 따라서 본 논문에서는 사용자 질의에 따라 빠른 시간 내에 효율적으로 List 기반의 접근법을 사용하여 top k 질의를 하는 기존의 연구를 소개 및 분석하고 문제점을 파악한다.

불완전 데이터를 위한 효율적 Top-k(g) 스카이라인 그룹 질의 처리 기법 (An Efficient Processing Method of Top-k(g) Skyline Group Queries for Incomplete Data)

  • 박미라;민준기
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.17-24
    • /
    • 2010
  • 최근에 스카이라인 질의에 대한 관심이 점차 증가하고 있다. 대부분의 스카이라인 질의에 대한 연구는 데이터들이 널 값을 가지지 않는다는 가정에서 이루어진다. 그러나 우리가 웹이나 다른 도구로 데이터베이스에 자료를 입력할 때는 널 값을 가지는 불완전한 데이터가 존재한다. 따라서 불완전한 데이터를 위한 다양한 스카이라인 처리 기법들이 제안되었다. 그러나 기존의 불완전한 데이터를 위한 스카이라인 질의 처리 기법은 불완전한 데이터만을 고려함으로써 완전한 데이터와 불완전한 데이터가 공존하는 환경을 고려하지 않았다. 본 논문에서는 완전한 데이터를 위한 스카이라인 질의와 불완전한 데이터를 위한 스카이라인 질의를 모두 처리 하는 스카이라인 그룹 질의 처리 기법을 제안한다. 이를 위하여, 사용자 정의에 의한 차원의 선호도에 따라서 g개의 스카이라인 그룹을 검색하는 top-k(g) 스카이라인 그룹 질의를 도입하고, 이를 질의 처리하는 기법을 제안한다. 그리고 모의실험을 통하여 제안한 방식의 성능을 보인다.

아웃소싱 암호화 데이터에 대한 효율적인 Top-k 질의 처리 알고리즘 (An Efficient Top-k Query Processing Algorithm over Encrypted Outsourced-Data in the Cloud)

  • 김종욱;서영균
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.543-548
    • /
    • 2015
  • 최근 다양한 분야에서 생산되는 데이터의 양이 폭발적으로 증가함에 따라 사용자가 가장 관심 있어 하는 몇 개의 데이터를 검색하는 top-k 질의에 대한 관심이 고조되고 있다. Top-k 질의는 사용자의 점수 함수를 이용하여, 사용자가 원하는 모든 조건을 만족시키는 데이터들 중에서 최상위 (또는 최하위) 점수를 가지는 k개의 데이터를 사용자에게 반환한다. 최근 들어 클라우드 컴퓨팅 서비스의 대중화로 인하여 사용자의 대용량 데이터를 클라우드에 아웃소싱하여 경제적으로 저장 및 관리하는 데이터 아웃소싱이 크게 주목받고 있다. 그러나 데이터 아웃소싱으로 인하여 사용자의 민감한 데이터가 클라우드 서비스 제공자에게 노출될 수 있다는 위험이 존재하며, 이러한 문제를 방지하기 위해서는 사용자의 민감한 데이터를 암호화하여 클라우드에 저장하는 것이 필수적으로 요구된다. 본 논문은 클라우드 컴퓨팅 환경에서 암호화된 데이터에 대한 top-k 질의를 효율적으로 처리하는 알고리즘을 제안한다. 제안되는 알고리즘은 순서보존 암호화 기법을 이용하여, 암호화된 데이터만을 대상으로 top-k 질의 결과에 포함되지 않을 것으로 예상되는 중간 결과들을 클라우드 내에서 미리 제거함으로써 효율적인 top-k 질의 처리가 가능하게 한다. 논문의 실험 결과는 제안된 top-k 질의 처리 알고리즘이 단순 방법과 비교하여 사용자 시스템의 부하를 10배~10000배 줄일 수 있음을 증명한다.

선호 차원과 배척 차원을 모두 고려한 top-k 질의 처리 연구 조사 (Survey on Top-k Query Processing Considering Attractive and Repulsive Dimensions)

  • 이준영;서인;최동준;김경민;김동원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.804-807
    • /
    • 2017
  • Top-k 질의란 주어진 조건을 만족하면서 높은 점수를 가진 상위 k개의 레코드를 요청하는 질의이다. 개체의 점수를 계산하는 랭킹함수가 단조함수가 아닐 경우 발생하는 기술적 어려움을 해결하기 위한 여러 연구가 있었다. 본 논문에서는 이들 중 각 차원이 선호 차원과 배척 차원으로 나뉘는 비단조 랭킹함수를 효율적으로 처리하는 기존의 top-k 질의 처리 기법들을 소개하고 비교한다.