• 제목/요약/키워드: 선택율 추정

검색결과 196건 처리시간 0.022초

이동객체의 현재 질의에 대한 선택율 추정 기법 (A Selectivity Estimation Technique for Current Query of Moving Object)

  • 최병갑;지정희;류근호
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2006년도 GIS/RS 공동춘계학술대회
    • /
    • pp.78-83
    • /
    • 2006
  • 선택율 추정은 질의 최적화를 위한 기법중의 하나이다. 이동객체에 대한 기존 선택율 추정 기법은 시간에 따른 빈번한 이동객체의 위치 변화를 요약 정보에 반영하지 못함으로써 선택 율 추정시 많은 에러를 발생시키고 있다. 따라서 이 논문에서는 이동객체의 질의에 대한 선택율 추정을 위한 색인 기반의 히스토그램 기법을 제안하였다. 또한 제안된 기법의 구현과 평가를 통 해 제안된 기법의 성능을 분석하였다. 이 논문에서 제안된 기법은 차량 추적 시스템, 위치 기반 서비스, 응급 구조 서비스, 그리고 텔레매틱스 서비스 통과 같은 연속적으로 위치를 변경하는 이동객체의 정보를 실시간으로 관리하고 검색하는 응용분야에 활용 가능할 것이다.

  • PDF

누적밀도 웨이블릿 히스토그램을 이용한 공간 선택율 추정 (Spatial Selectivity Estimation using Cumulative Wavelet Histograms)

  • 지정희;정재혁;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.547-557
    • /
    • 2005
  • 선택율 추정 기법들의 공통적인 목표는 데이타의 요약 정보를 적은 저장 공간에 유지하고, 추정된 값과 질의 결과에 대한 오차를 최소화하는 것이다. 방대한 양의 공간 데이타에 대한 선택율 추정의 경우, 정확한 결과를 얻기 위해서는 공간 데이타의 분포를 반영하는 요약 정보를 필요로 하며, 그러한 요약 정보를 생성하기 위해서는 많은 저장 공간을 필요로 한다. 따라서, 이 논문에서는 적은 저장 공간을 사용하면서, 정확성 높은 선택율을 추정하는 누적밀도 웨이블릿 히스토그램을 제안한다. 이 히스토그램은 기존의 누적밀도 히스토그램에 유지되는 각 서브 히스토그램에 대해 웨이블릿 변환을 적용함으로써, 보다 적은 저장 공간에서 높은 정확도의 선택율을 얻을 수 있다. 우리는 실험결과를 통하여 기존 히스토그램의 저장 공간에 $25\%\~50\%$만을 사용하여 높은 정확도의 선택율 추정 결과를 보임으로써, 기존의 다른 선택율 추정기법들이 갖는 저장공간에 대한 제약사항을 해결함과 동시에 적은 저장공간을 사용하여 높은 정확도의 선택율 추정이 가능함을 확인 하였다. 이 논문에서 제안된 기법은 공간 데이타베이스에서의 공간 범위 질의에 대한 정확성 높은 선택율을 추정하기 위해 사용될 수 있다.

압축된 공간 히스토그램을 이용한 선택율 추정 기법 (Selectivity Estimation Using Compressed Spatial Histogram)

  • 지정희;이진열;김상호;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.281-292
    • /
    • 2004
  • 공간 질의에 대한 선택율 추정은 가장 효율적인 실행 계획을 찾는데 이용되는 매우 중요한 과정이다. 공간 도메인이 큰 경우, 기존 연구의 요약정보는 상대적으로 적은 정보로 선택율을 추정하기 때문에 좋은 선택율을 유지하기 어렵다. 따라서, 이 논문에서는 작은 저장공간에 공간요약정보를 압축하는 새로운 기법인 MW 히스토그램을 제안한다. 이 히스토그램은 MinSkew 분할 알고리즘과 웨이블릿 변환이 결합되어 적은 저장공간에서도 타당한 선택율과 압축효과를 얻을 수 있고, 동적 갱신에 대해 효율적으로 대처할 수 있는 구조를 가진다. 실험 결과를 통하여, 버켓 수가 0.3M/6인 MW 히스토그램이 5%-20% 질의에서 평균적으로 좋은 성능을 보이고 있어, MW 히스토그램이 적은 저장공간에서 더 좋은 선택율을 얻을 수 있음을 확인시켜주었다.

고차원에서 선택율 추정을 위한 블록 히스토그램 압축방법 (Block Histogram Compression Method for Selectivity Estimation in High-dimensions)

  • 이주홍;전석주;박선
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.927-934
    • /
    • 2003
  • 데이터베이스 질의 최적화기는 가장 효율적인 실행계획을 구하기 위해서 질의의 선택율을 추정한다. 일반적으로 애트리뷰트들은 서로 독립적이지 않기 때문에 여러 개의 애트리뷰트를 가지는 질의에 대해서는 다차원 선택을 추정 기법이 필요하다. 대부분의 상용 데이터베이스에서는 히스토그램이 계산 오버헤드가 많지 않고 작은 에러율로 데이터 분포를 를 근사 시킬 수 있기 때문에 실용적으로 많이 사용되고 있다. 그러나 여러 개의 애트리뷰트를 가진 다차원 지?l의 경우에서는 차원이 높아 질수록 에러율을 낮추기 위해 많은 저장 공간을 필요로 하기 때문에 히스토크램 방법이 적합하지 않다. 이 논문에서는 다차원 선택을 추정을 위한 새로운 기법을 제안한다. 다차원 공간에서 크기가 작은 히스토그램 버켓을 많이 만들고 이 버켓의 정보를 DCT로 압축하여 선택을 추정에 사용함으로써 에러율을 작게 하고 저장 공간의 사용량도 줄인다. 폭 넓은 실험 결과는 본 논문에서 제시한 방법들의 타당성과 이점을 확인시켜 준다.

커널 방법을 이용한 선택도 추정에 관한 연구 (Selectivity Estimation using Kernel Method)

  • 김학철;신명진;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.188-190
    • /
    • 1998
  • 데이터 베이스 관리 시스템에서는 질의 결과의 크기(selectivity)를 미리 예측하는 것이 필요하다. 질의 결과의 크기는 데이터의 분포 상태에 의해서 결정된다. 이러한 데이터의 분포 상태를 정확하게 예측하는 것이 매우 중요하다. 대부분의 데이터 베이스 관리 시스템에서는 이를 위하여 주기적으로 저장하고 있는 레코드에 대해서 히스토그램을 만들고 이용한다. 이 방법은 히스토그램의 저장공간이 적게 필요로 하고 선택도를 추정하는데 있어서 선택도 추정시 부가적인 계산이 필요하지 않은 장점이 있지만, 일정한 크기의 버켓내에서는 데이터들이 균일하게 분포한다는 가정을 함으로써 선택도 추정에 있어서 에러율이 높았다. 이에 본 논문에서는 커널 방법을 사용하여 버켓 내 데이터의 분포에 대하여 추정 함으로써 이를 해결하는 방법을 제시하였다.

시공간데이터베이스의 다차원 선택도 추정을 위한 웨이블렛 기반 히스토그램 (Simple Wavelet-based Histogram of Multidimensional Selectivity Estimation for Spatio-temporal Databases)

  • 권정민;신병철;이종연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.34-36
    • /
    • 2005
  • 선택도 추정 기법은 상용 데이터베이스에서 질의 최적화를 위해 많이 사용하고 있다. 그 중 선택도 추정 기법에 가장 많이 사용되고 있는 기법은 히스토그램이다. 최근 시공간 데이터베이스 관련 연구에서 시간$\cdot$공간 데이터베이스의 선택도 추정 기법이 활발하게 이루어지고 있다. 이 히스토그램 추정 기법이 과거에서 현재시점까지 범위 질의 수행을 성공적으로 이루어지고 있지만 대량의 데이터들을 효율적으로 관리하기에는 저장오버헤드가 너무 크다. 본 논문에서는 시공간데이터베이스에서 성공적으로 선택도 추정을 다룬 히스토그램 추정 기법을 보완하여 과거 이력데이터들의 저장을 효율적으로 할 수 있는 압축기법을 제안한다. 현재 객체에 대해서는 기존 연구에서 성공적으로 이루어진 히스토그램 기반 추정 기법을 응용하고 과거 이력데이터에 대해서는 압축기법인 웨이블렛을 응용하여 선택도추정의 오류율과 저장오버헤드의 향상이 기대된다.

  • PDF

층화 이단계 표본추출시 최적 선택율 (Optimum Selection Probabilites in Stratified Two-stage Sampling)

  • 신민웅;오상훈
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.429-437
    • /
    • 2001
  • 단순 이단계 표본 추출의 경우에 최적 선택률은 Hansen과 Hurwitz(1949)에 의하여 구하여졌다. 그러나 통계청에서 실시하는 표본조사등은 층화 이단계 추출을 한다. 따라서 실제적인 필요성에 의하여 층화 2단계 표본 설계를 시도 하였다. 층화 이단계 표본추출시에 주어진 비용아래서 모총계의 추정량의 분산을 최소로 하는 최적의 선택확률(optimum selection probability), 표본추출율과 부차 표본추출율을 Lagrangean 승수법에 의하여 구한다.

  • PDF

이동객체를 위한 현재 질의 선택율 추정 기법 (A Selectivity Estimation Technique for Current Query of Moving Objects)

  • 지정희;류근호;정두영
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.87-96
    • /
    • 2006
  • 선택을 추정은 질의 최적화를 위한 기법중의 하나이다. 이동객체에 대한 기존 선택율 추정 기법은 시간에 따른 이동객체의 위치 변화를 요약 정보에 반영하지 못하며. 또한 기존 공간 요약 정보를 확장하여 이용함으로써 선택율 추정시 많은 에러를 발생시키고 있다. 기존 기법들이 이동객체의 위치 정보 변화를 요약 정보에 반영하기 위해서는 요약 정보를 자주 재생성해야 하며, 그러므로 전체 데이터베이스를 자주 스캔해야 하는 문제점을 갖고 있다. 따라서 이 논문에서는 이동객체의 현재 질의에 대한 선택을 추정 기법을 개발하기 위하여 쿼드 트리 기반의 히스토그램 기법을 제안하였다. 또한 제안된 기법의 구현과 평가를 통해 제안된 기법의 성능을 분석하였다. 이 논문에서 제안된 기법은 차량 추적 시스템, 위치 기반 서비스, 응급 구조 서비스, 그리고 텔레매틱스 서비스 등과 같은 연속적으로 위치를 변경하는 이동객체의 정보를 실시간으로 관리하고 검색하는 응용분야에 활용 가능할 것이다.

  • PDF

일반화된 누적밀도 히스토그램을 이용한 공간 선택율 추정 (Selectivity Estimation using the Generalized Cumulative Density Histogram)

  • 지정희;김상호;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.983-990
    • /
    • 2004
  • 누적밀도 히스토그램은 사각형 객체의 네 점에 대응하는 4개의 서브 히스토그램을 유지함으로써 사각형 객체가 여러 버켓에 걸쳐질 경우 발생하는 다중 계산 문제를 해결하고 있다. 이 기법은 빠른 추정시간과 정확한 결과를 제공하고 있지만, 질의 윈도우가 그리드 셀의 경계와 일치해야 한다는 제약사항을 기반으로 수행하므로, 실제 응용에 적용시 많은 에러를 초래하게 된다. 따라서, 이 논문에서는 기존 누적밀도 히스토그램에서 질의 윈도우의 제약사항에 관한 영향을 줄이기 위해, 두가지 확률모델을 기반으로 일반화된 누적밀도 히스토그램을 사용한 선택율 추정 기법을 제안하였다. 제안된 두가지 확률 모델은 \circled1질의 영역 비율을 고려한 확률모델과, \circled2교차 영역 정보를 고려한 확률모델이다. 우리는 실제 데이터 셋을 사용하여 제안된 기법을 실험하였다 실험 결과는 이 논문에서 제안된 기법이 기존의 다른 선택율 추정 기법보다 성능이 뛰어남을 보여주고 있다 더구나, 교차 영역 정보를 기반으로 하는 확률모델의 경우 20% 질의 윈도우에서 5% 미만의 낮은 에러율을 보였다. 이 논문에서 제안된 기법은 사각형 객체의 공간 범위 질의의 선택율을 정확하게 추정하는데 사용될 수 있다.

시점 질의를 위한 선택율 추정 (Selectivity Estimation for Timestamp Queries)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.214-223
    • /
    • 2006
  • 최근 시간에 따른 대량의 공간 객체들의 효과적인 저장과 처리의 필요성이 요구되면서 시공간 데이타베이스에 대한 필요성이 증가하였다. 이러한 시공간 데이타베이스에서 효과적인 질의 처리를 위하여 여러 가지 질의 최적화 기법이 연구되었고 그중 질의의 근사적인 결과를 계산하는 선택도 추정 기법이 활발하게 연구되었다. 선택도 추정 기법에는 샘플링 기반 기법, 히스토그램 기반 기법, 웨이블릿 기반 기법 등이 있고 그중 히스토그램 기법은 현재 상용 데이타베이스에서 널리 사용되고 있다. 하지만 지금까지의 시공간 질의 최적화 연구는 이동 객체의 미래 위치에 대한 선택도 추정에 치중되어 왔다. 본 논문에서는 과거의 시공간 데이타의 질의 최적화를 위하여 새로운 히스토그램인 T-Minskew의 구축 방법을 제안한다. 또한 T-Minskew를 이용한 효과적인 선택도 추정 기법을 제안하고 임계치 기법을 이용한 히스토그램의 효과적인 유지 기법을 통해 잦은 히스토그램 재구축을 방지하고 작은 추정 오류율을 유지하는 방법을 제안한다.