• 제목/요약/키워드: 유사도 인덱스

검색결과 111건 처리시간 0.028초

An Efficient Path Combining Strategy of XML Document (XML 문서의 효율적인 경로 통합 기법)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Annual Conference of KIPS
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.19-22
    • /
    • 2005
  • XML은 비즈니스 메시징, 웹사이트 정보 통합, 그리고 카탈로그 통합 등의 분야에서 다양한 데이터를 표현하기 위한 포맷으로 급격하게 성장했다. 그러나 XML 데이터의 형태가 고정되어 있지 않기 때문에 전통적인 질의 방법이 항상 정확한 결과를 보여주지는 않는다. 또한 객체 지향 DBMS가 이 영역에 적합한지의 여부는 아직 명확하지 않다. 따라서 XML 데이터를 효율적으로 검색하기 위해 기존의 관계형 DBMS와 연계하여 구조 유사성을 기반으로 하는 검색 기법이 연구되고 있다. 그 중 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스를 이용한 검색 시스템은 다른 XML 문서 검색 시스템보다 훨씬 빠른 수행 속도를 보여주지만, 3차원의 메모리 구조를 사용하여 많은 저장공간을 필요로 하는 단점이 있다. 본 논문에서는 XML 문서를 저장할 때 경로들 사이의 유사성을 이용하여 XML 데이터의 경로를 통합하는 기법에 대해 소개한다. 이렇게 통합된 경로를 이용하여 생성하는 3차원 비트맵 인덱스는 그 크기가 상당히 줄어들게 되고, 기존의 연구에서 보여주었던 문제점들을 해결하게 되었다.

  • PDF

A lossless compression scheme for color-indexed character images (컬러 인덱스 캐릭터 영상의 무손실 압축)

  • Kwon Hyukmin;Kim Manbae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.223-228
    • /
    • 2004
  • 현재 모바일 환경에서 PDA, 휴대폰 등으로 많은 캐릭터 영상들이 서비스되고 있다. 본 논문에서는 이러한 캐릭터 영상들의 무손실 동영상 압축 방법을 제안한다. 캐릭터 영상은 256컬러 인덱스 영상이며. 영상간에 유사한 컬러로 제작된다. 제안한 압축방법은 기존 MPEG, H.264에서 사용하는 동영상 부호화 기법이외에도 캐릭터 영상의 특성을 반영한다. 각 블록 타입을 DC mode, INTER mode, 및 INTRA mode로 분류하는데 다른 mode와 유사하게 DC mode는 캐릭터 영상의 특성을 활용한다. INTER mode는 예측 에러의 분포를 분석하여 세 가지 예측 방법들 중에서 압축 효율이 우수한 방법으로 처리한다. 또한 INTRA mode는 4개의 서브모드로 나누어 압축 효율성을 제고한다. 12개의 캐릭터 실험 영상들은 각각 12장의 영상으로 구성되는데, 제안 압축 방법을 적용하면 평균 1.44:1의 압축율을 얻는다. 또한 실험결과에서는 각 블록 타입의 비율 및 INTRA와 INTER블록의 비율을 조절하여 얻어 지 는 압축율의 변화를 조사하였다.

  • PDF

Implementation of an Efficient Wavelet Based Audio Data Retrieval System (효율적인 웨이블렛 기반 오디오 데이터 검색 시스템 구현)

  • 이배호;조용춘;김광희
    • The Journal of the Acoustical Society of Korea
    • /
    • 제21권1호
    • /
    • pp.82-88
    • /
    • 2002
  • In this paper, we proposed a audio indexing method that is used wavelet transform for audio data retrieval. It is difficult for audio data to make a efficient audio data index because of its own particular properties, such as requirement of large storage, real time to transfer and wide bandwidth. An audio data in del using wavelet transform make it possible to index and retrieval by using the particular wavelet transform properties. Our proposed indexing method doesn't separate data to several blocks. Therefore we use both high-pass and low-pass parts of last level coefficient of wavelet transform. Audio data indexing is made by applying the string matching algorithm to high-pass part and zero-crossing histogram to low-pass part. These are transformed to the continued strings, Through this method, we described a retrieval efficiency. The retrieval method is done by comparing the database index string to the query string and then data of minimum values is chosen to the result. Our simulation decided proper comparative coefficient and made known changing of retrieval efficiency versus audio data length. The results show that the proposed method improves retrieval efficiency compared to conventional method.

Indexing Mechanism for Efficient Semantic Query Processing (효율적인 시멘틱 질의 처리를 위한 인덱싱 기법)

  • Kim Hak-Soo;Cha Hyun-Seok;Son Jin-Hyun
    • Annual Conference of KIPS
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.97-100
    • /
    • 2006
  • RDF 는 트리플의 집합으로서 그래프 데이터 모델로 표현되며, 사용자는 RDF 그래프 모델로부터 정보를 검색하기 위해 시멘틱 질의 언어를 사용한다. 그러나 이러한 접근 방식은 최악의 경우 전체 그래프 데이터 모델을 검색해야 되는 문제점이 발생한다. 이에 따라 최근의 연구에서는 시멘틱 질의를 효율적으로 처리하기 위해서 인덱스를 사용한다. 시멘틱 질의 언어(RDQL, SPARQL)의 핵심은 RDF 트리플에 대한 패턴을 기술함으로써 원하는 트리플 정보를 검색할 수 있게 하는 것이다. 따라서, 기존의 인덱스는 단일 트리플을 효율적으로 검색하는 데 초점을 둔다. 거라나 트리플 패턴의 집합으로 질의가 표현될 경우에는 트리플 패턴 사이의 상관관계 때문에 조인비용이 많이 발생하는 문제점이 있다. 본 논문에서는 조인 비용이 발생되는 문제점을 해결하기 위한 인덱싱 기법을 제안한다. RDF 그래프 모델에서 유지해야 할 정보를 줄이기 위해서 RDF 그래프 모델에 존재하는 유사한 서브 그래프를 하나의 서브 그래프로 병합한다. 병합절차를 마친 여러 서브 그래프에 존재하는 모든 경로를 인덱스에 유지 함으로써 조인 비용을 제거한다.

  • PDF

Content-based Image Retrieval System using Multi-index key (멀티인덱스키를 이용한 내용기반 이미지 검색시스템)

  • 김진천;김주연
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • 제8권1호
    • /
    • pp.102-107
    • /
    • 2004
  • In this paper, we proposed a content-based image retrieval system using the multi-Index key. The multi-index ky combines the color distribution considering the spatial characteristic and the shape features of an image using the edge detection. Consequently, the evaluation shows that the performance of the proposed technique is better than other techniques.

A New Indexing Technique for Processing Nearest Neighbor Queries in High Dimensional Space (고차원 공간에서 최근접 질의를 효과적으로 처리하기 위한 새로운 인덱싱 기법)

  • ;Charu Aggarwal;Philip S. Yu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.83-85
    • /
    • 2000
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이터베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 시각형 혹은 원을 사용하여 객체 클러스터의 캡슐을 표현하는 기존의 다차원 인덱스들은 차원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 문제를 해결하는 새로운 인덱스 구조를 제시하고, 이를 이용하는 최근접 질의 처리 방안을 제안한다. 또한, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF

Multidimensional Index for Fingerprint Identification (지문인식을 위한 다차원공간 인덱스의 설계)

  • 김갑영;심현보;박영배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.222-224
    • /
    • 1999
  • 지문은 가장 효율적인 사용자 인증방법으로 이용되어져 왔다. 또한 컴퓨터의 발달과 더불어 자동지문 인식은 더욱 많이 연구되어졌고, 또한 급속도로 발전하였다. 이런 대부분의 연구들은 지문 인식에서 특징점 추출 및 정합부분에 관한 연구가 주류를 이루고 있다. 그런, 대단위 데이터베이스 검색 향상을 위한 방법의 연구는 아직도 미진한 실정이다. 본 연구는 기존의 지문 데이터베이스에 공간 인덱스를 추가시켜 지문을 효과적으로 추출하는 방법을 제시한다. 이 방법으로, 데이터베이스의 지문을 다차원공간 인덱스에 저장시킨다. 그리고, 지문을 검색을 할 때에는, 다차원공간상에서 미지 지문과 유사한 지문들을 추출하여, 후보지문을 만든다. 그리고, 매칭 작업은 이 후보지문들하고만 매칭 하여도 전체를 한 것과 같은 효과를 얻을 수 있다. 이러한 방법으로, 전체 지문 검색 시간을 단축시킬 수 있다.

  • PDF

Content-Based Video Search Using Eigen Component Analysis and Intensity Component Flow (고유성분 분석과 휘도성분 흐름 특성을 이용한 내용기반 비디오 검색)

  • 전대홍;강대성
    • Journal of the Institute of Convergence Signal Processing
    • /
    • 제3권3호
    • /
    • pp.47-53
    • /
    • 2002
  • In this paper, we proposed a content-based video search method using the eigen value of key frame and intensity component. We divided the video stream into shot units to extract key frame representing each shot, and get the intensity distribution of the shot from the database generated by using ECA(Eigen Component Analysis). The generated codebook, their index value for each key frame, and the intensity values were used for database. The query image is utilized to find video stream that has the most similar frame by using the euclidean distance measure among the codewords in the codebook. The experimental results showed that the proposed algorithm is superior to any other methols in the search outcome since it makes use of eigen value and intensity elements, and reduces the processing time etc.

  • PDF

A Path Combining Strategy for Efficient Storing of XML Documents (XML 문서의 효율적인 저장을 위한 경로 통합 기법)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Journal of Korea Multimedia Society
    • /
    • 제9권10호
    • /
    • pp.1257-1265
    • /
    • 2006
  • As XML is increasingly used, the need of researches which are related with XML in various fields is also augmented. Many XML document management systems have been actively developed especially for the storage, processing and retrieval of XML documents. The BitCube is a three dimensional bitmap index system that could be manipulated efficiently and improves the performance of document retrieval. However, the site of index is increase rapidly, when a new bit is added to the axis. This problem is caused by its three dimensional memory structure with document, path and word. We suggest a path combining strategy of XML documents in this paper to solve the problem of BitCube that mentioned above. To reduce the size of index, our approach combines sibling nodes that has same ancestor paths, and transforms word axis into value axis. The method reduces the size of index, when the system com poses the three dimensional bitmap index. It also improves the speed of retrieving, and takes efficiency in storage space.

  • PDF

A study on searching image by cluster indexing and sequential I/O (연속적 I/O와 클러스터 인덱싱 구조를 이용한 이미지 데이타 검색 연구)

  • Kim, Jin-Ok;Hwang, Dae-Joon
    • The KIPS Transactions:PartD
    • /
    • 제9D권5호
    • /
    • pp.779-788
    • /
    • 2002
  • There are many technically difficult issues in searching multimedia data such as image, video and audio because they are massive and more complex than simple text-based data. As a method of searching multimedia data, a similarity retrieval has been studied to retrieve automatically basic features of multimedia data and to make a search among data with retrieved features because exact match is not adaptable to a matrix of features of multimedia. In this paper, data clustering and its indexing are proposed as a speedy similarity-retrieval method of multimedia data. This approach clusters similar images on adjacent disk cylinders and then builds Indexes to access the clusters. To minimize the search cost, the hashing is adapted to index cluster. In addition, to reduce I/O time, the proposed searching takes just one I/O to look up the location of the cluster containing similar object and one sequential file I/O to read in this cluster. The proposed schema solves the problem of multi-dimension by using clustering and its indexing and has higher search efficiency than the content-based image retrieval that uses only clustering or indexing structure.