• 제목/요약/키워드: 다차원 히스토그램

검색결과 14건 처리시간 0.031초

다차원 히스토그램에서 범위 질의의 선택도에 대한 오차 추정 (Error Estimation about Selectivity of Approximate Range Queries in Multi-Dimensional Histogram)

  • 정지훈;홍석진;배진욱;안성준;송병호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.211-213
    • /
    • 2001
  • 히스토그램은 질의 최적화글 위해 사용되는 튿-계 정또 중 하나이다. 최근에는 방대한 데이타에 대한 범위 질의의 선택도 추정 방법의 하나로 사용되기도 한다. 히스토그램을 통한 범위 질의의 선택도 추정 결과는 항상 오차를 포함한다. 따라서 결과의 신뢰성을 보장하기 위해 선택도에 대한 오차를 추정하는 방법이 요구된다. 추정된 선택도의 오차 추정에 대한 기존 방법은 1차원 히스토그램만을 고려하여 하나의 애트리뷰트의 값에 따라 빈도의 분포를 반영하므로 애트리뷰트가 많은 다차원 히스토그램에 바로 적용시키는데 문제가 있다. 이 논문에서는 기존의 추정된 선택도에 대한 오차 추정 기법들을 다차원에 적용할 수 있게 확장한 M-Max, M-Sum 기법을 제안하고, 두 기법을 합친 하이브리드 기법을 제안한다. 실험을 통해 M-Sum 기법과 하이브리드 기법이 M-Max 기법보다 정확한 오차 추정 기법임을 보이고, 또한 작은 기억 공간에서도 두 기법이 오차를 보다 정확하게 추정함을 보인다.

  • PDF

고차원에서 선택율 추정을 위한 블록 히스토그램 압축방법 (Block Histogram Compression Method for Selectivity Estimation in High-dimensions)

  • 이주홍;전석주;박선
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.927-934
    • /
    • 2003
  • 데이터베이스 질의 최적화기는 가장 효율적인 실행계획을 구하기 위해서 질의의 선택율을 추정한다. 일반적으로 애트리뷰트들은 서로 독립적이지 않기 때문에 여러 개의 애트리뷰트를 가지는 질의에 대해서는 다차원 선택을 추정 기법이 필요하다. 대부분의 상용 데이터베이스에서는 히스토그램이 계산 오버헤드가 많지 않고 작은 에러율로 데이터 분포를 를 근사 시킬 수 있기 때문에 실용적으로 많이 사용되고 있다. 그러나 여러 개의 애트리뷰트를 가진 다차원 지?l의 경우에서는 차원이 높아 질수록 에러율을 낮추기 위해 많은 저장 공간을 필요로 하기 때문에 히스토크램 방법이 적합하지 않다. 이 논문에서는 다차원 선택을 추정을 위한 새로운 기법을 제안한다. 다차원 공간에서 크기가 작은 히스토그램 버켓을 많이 만들고 이 버켓의 정보를 DCT로 압축하여 선택을 추정에 사용함으로써 에러율을 작게 하고 저장 공간의 사용량도 줄인다. 폭 넓은 실험 결과는 본 논문에서 제시한 방법들의 타당성과 이점을 확인시켜 준다.

중첩된 버킷을 사용하는 다차원 히스토그램에 대한 개선된 알고리즘 (An Improved Algorithm for Building Multi-dimensional Histograms with Overlapped Buckets)

  • 문진영;심규석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.336-349
    • /
    • 2003
  • 히스토그램은 최근들어 많은 관심을 끌고 있다. 히스토그램은 주로 상용 데이타베이스 관리 시스템에서 질의 최적화를 위해 속성의 값에 대한 데이타 분포를 추정하는데 사용되었다. 최근에는 근사 질의와 스트림 데이타에 대한 연구 분야에서 히스토그램에 대한 관심이 커지고 있다. 관계형 데이타베이스에서 두 개 이상의 속성에 대한 결합 데이타 분포를 근사시키는 가장 간단한 방법은 각 속성의 데이타 분포가 결합 데이타 분포에 독립적이라고 가정하는 속성 값 독립(Attribute Value Independence: AVI) 가정하 에서 각각의 속성에 대해서 히스토그램을 만드는 것이다 그러나 실제 데이타에서 이 가정은 잘 맞지 않는다. 따라서 이 문제를 해결하기 위해서 웨이블릿, 랜덤 샘플링, 다차원 히스토그램과 같은 기법들이 제안되 었다. 그 중에서 GENHIST는 실수형 속성에 대한 데이타 분포를 근사시키기 위해 고안된 다차원의 히스토그램이다. GENHIST는 데이타 분포를 좀 더 효과적으로 근사시키기 위해서 중첩되는 버킷을 사용한다. 본 논문에서는 SSE(Sum Squared Error)를 최소화시키는 중첩되는 버킷들의 최적 빈도를 결정하는 OPT 알고리즘을 제안한다. 처음에 GENHIST에 의해 중첩되는 버킷으로 구성되는 히스토그램을 만든 후에 OPT 알고리즘에 의해서 각 버킷의 빈도를 다시 계산해서 GENHIST를 개선시킬 수 있다. 실험 결과는 OPT 알고리즘이 GENHIST에 의해 만들어진 히스토그램의 정확도를 크게 개선시킴을 보여준다.

다차원 인접화소 간 명암차의 극좌표 기반 비선형 양자화 히스토그램에 의한 서명인식 (Signatures Verification by Using Nonlinear Quantization Histogram Based on Polar Coordinate of Multidimensional Adjacent Pixel Intensity Difference)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.375-382
    • /
    • 2016
  • 본 논문에서는 다차원 인접화소 간 명암차 기반 극좌표의 비선형 양자화 히스토그램을 이용한 서명인식을 제안한다. 다차원 인접화소 간 명암차는 기준화소를 중심으로 횡방향, 종방향, 대각 방향, 역대각 방향 각각의 이웃화소 간 명암차이고, 극좌표는 횡과 종 방향 및 대각과 비대각 방향 각각의 직교좌표로부터 변환된 좌표이며, 비선형 양자화 히스토그램은 반복계산 기법인 Lloyd 알고리즘에 의해 극좌표 값을 비균일 양자화한 히스토그램이다. 여기서 4방향 명암차의 극좌표 히스토그램은 대응하는 화소간의 상관성을 좀 더 많이 고려할 뿐만 아니라 히스토그램의 수를 감소시켜 계산부하를 줄이기 위함이다. 또한 비선형 양자화는 화소간의 명암변화의 속성을 더욱 더 잘 반영할 뿐만 아니라 저차원의 히스토그램 레벨을 얻기 위함이다. 제안된 기법을 256*256 픽셀의 90개(3인*30개) 서명들을 대상으로 city-block거리, Euclidean 거리, 순서값, 그리고 정규상호상관계수 각각의 정합척도에 기반 한 실험결과, 선형 양자화 기반 히스토그램에 비해 우수한 인식성능을 가지며, Euclidean 거리가 가장 우수한 정합척도임을 확인하였다.

시공간데이터베이스의 다차원 선택도 추정을 위한 웨이블렛 기반 히스토그램 (Simple Wavelet-based Histogram of Multidimensional Selectivity Estimation for Spatio-temporal Databases)

  • 권정민;신병철;이종연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.34-36
    • /
    • 2005
  • 선택도 추정 기법은 상용 데이터베이스에서 질의 최적화를 위해 많이 사용하고 있다. 그 중 선택도 추정 기법에 가장 많이 사용되고 있는 기법은 히스토그램이다. 최근 시공간 데이터베이스 관련 연구에서 시간$\cdot$공간 데이터베이스의 선택도 추정 기법이 활발하게 이루어지고 있다. 이 히스토그램 추정 기법이 과거에서 현재시점까지 범위 질의 수행을 성공적으로 이루어지고 있지만 대량의 데이터들을 효율적으로 관리하기에는 저장오버헤드가 너무 크다. 본 논문에서는 시공간데이터베이스에서 성공적으로 선택도 추정을 다룬 히스토그램 추정 기법을 보완하여 과거 이력데이터들의 저장을 효율적으로 할 수 있는 압축기법을 제안한다. 현재 객체에 대해서는 기존 연구에서 성공적으로 이루어진 히스토그램 기반 추정 기법을 응용하고 과거 이력데이터에 대해서는 압축기법인 웨이블렛을 응용하여 선택도추정의 오류율과 저장오버헤드의 향상이 기대된다.

  • PDF

다차원 히스토그램을 이용한 공간 위상 술어의 선택도 추정 기법 (A Selectivity Estimation Scheme for Spatial Topological Predicate Using Multi-Dimensional Histogram)

  • 김홍연;배해영
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.841-850
    • /
    • 1999
  • 히스토그램을 이용한 질의 술어의 선택도 추정은 상용 데이터베이스 시스템의 비용 기반 최적화기에서 가장 널리 사용되는 방법이다. 공간 데이터베이스 관리 시스템의 경우 객체간의 위상 관계를 이용한 술어가 주어지며, 질의 최적화를 위해서는 공간 위상 술어의 선택도 추정이 필수적이다. 이를 이해 본 논문에서는 기존의 다차원 히스토그램 기법에 차원 변환 기법을 적용한 공간 위상 술어 추정 기법을 제안한다. 제안된 기법은 차원 변환 공간상의 점으로 대응된 공간 객체로부터 두가지 분할 전략을 이용하여 공간 히스토그램을 생성한 수 변환 공간이 가지는 위상 관계를 이용하여 공간 위상 술어의 선택도를 추정한다. 제안된 기법은 공간 질의 최적화기에서 비교적 작은 메모리와 부가적인 입출력 없이 공간 위상 술어의 선택도를 추정할 수 있다.

  • PDF

음식재료성분 분석을 통한 음식이미지 표현 (Food Image Representation by Analyzing Ingredients)

  • 진소영;최호진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.425-428
    • /
    • 2011
  • 이 논문은 음식인식 자동화를 위해서 음식 이미지를 표현하는 새로운 방법을 제시한다. 먼저, 사람이 음식 속 재료성문을 인식하는 방법을 모방하여, 음식이미지에서 윤곽선을 따라 다각형을 검출한다 그 흐름, 각 다각형의 특징 다각형에 해당하는 음식재료성분의 라벨은 다각형의 사이즈, 다각형의 가로세로 비율 - 이 추출된다. 여기서 음식재료성분의 라벨은 음식재료이미지로 훈련 받은 Semantic Texton Forests (STF)[3]에 의해 구해진다. 구해진 다각형의 특징을 이용해 음식이미지마다 다차원 히스토그램이 형성되는데, 이히스토그램은 컴퓨터가 사람과 유사하게 음식이미지를 이해할 수 있도록 표현된다. 이 히스토그램은 컴퓨터가 음식을 인식할 수 있도록 도와주는 중요한 특징으로 사용될 것이다.

시공간 데이타베이스에서 다차원 시퀀스 데이타의 선택도추정 (Selectivity Estimation for Multidimensional Sequence Data in Spatio-Temporal Databases)

  • 신병철;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.84-97
    • /
    • 2007
  • 선택도 추정 기법은 질의 최적화를 위해 현재 상용 데이터 베이스에서 많이 사용되고 있고 히스토그램은 가장 많이 사용되는 선택도 추정 기법중의 하나이다. 최근에 시공간 데이터 베이스 관련 연구들에서 이러한 선택도 추정 기법이 기존의 시간 공간 데이타베이스 선택도 추정 기법을 확장하여 활발하게 연구되었다. 하지만 기존의 시공간 데이타베이스 선택도 추정 연구는 주로 이동 객체와 같은 시계열 데이타만 고려하였다. 또한 기존의 연구는 과거시점부터 현재 시점까지 시간적 범위 질의에 대한 선택도 추정은 불가능하였다. 따라서 본 논문에서는 시공간 데이타베이스에서 과거 시점에서 현재시점까지 시퀀스 데이타의 시간적 범위 질의를 위한 히스토그램을 구축하고 이를 이용한 효과적인 선택도 추정 기법을 제안한다. 제안한 히스토그램을 이용하면 과거부터 현재까지 시퀀스 데이타의 선택도 추정이 가능하고, 범위시간 선택도 추정 기법이 가능하며 효과적인 히스토그램 유지 기법의 적용이 가능하다.

비선형 평활화와 다차원의 명암변화에 기반을 둔 영상인식 (Image Recognition Based on Nonlinear Equalization and Multidimensional Intensity Variation)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.504-511
    • /
    • 2014
  • 본 논문에서는 영상의 비선형 평활화와 다차원의 명암변화에 기반을 둔 조합형 인식기법을 제안하였다. 여기서 비선형 평활화는 적응적 변형의 히스토그램 재조정 전처리 기법으로 영상의 밝기를 조정하여 화질을 개선하기 위함이다. 다차원의 명암변화는 인접 픽셀간의 밝기변화를 4단계로 나누어 고려함으로써 영상의 속성을 더욱 더 정확하게 반영하기 위함이고, x축과 y축의 2방향 각각의 명암변화를 고려한 정규상호상관계수는 좀 더 포괄적으로 영상의 유사성을 측정하기 위함이다. 제안된 기법을 50개 40*40 픽셀의 명암도 변화를 가지는 얼굴영상들을 대상으로 실험한 결과, 평활화를 수행하지 않거나 선형 평활화를 수행한 기법에 비해 각각 영상의 속성을 잘 반영한 우수한 인식성능이 있음을 확인하였다.

화소간의 명암차를 이용한 LBP 기반 질감분류 (A Texture Classification Based on LBP by Using Intensity Differences between Pixels)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.483-488
    • /
    • 2015
  • 본 논문에서는 질감분류를 위해 블록영상 내에서 인접 화소사이의 다차원 명암차이를 이용한 local binary pattern(LBP) 기법을 제안한다. 여기서 블록영상 내 화소 간 명암차는 4방향(세로, 가로, 대각, 역대각) 각각의 인접 화소 간 밝기변화를 고려한 것으로 영상의 질감분류에 이용되는 히스토그램의 레벨수를 감소시켜 계산 부하를 줄이기 위함이다. 또한 블록 내 명암관계를 이진패턴으로 나타낸 것으로 영상의 국부적 속성을 더욱 더 정확하게 반영하여 효과적인 질감분류를 가능하게 함이다. 제안된 기법을 128*128 픽셀의 그레이 영상 USC Texture Mosaic #2을 대상으로 크기와 질감이 다른 24개의 블록영상 각각을 분류하는 실험결과, 기존의 LBP에 비해 빠른 분류속도를 가지며, 임의 크기 블록영상의 분류도 가능함을 확인하였다. 특히 블록영상의 크기가 증가할수록 히스토그램의 레벨 감소폭이 더욱 더 크게 되어 분류속도의 개선정도도 증가함을 알 수 있다.