• 제목/요약/키워드: 유사 검색

검색결과 1,681건 처리시간 0.032초

비트맵 인덱싱 기반 유사한 XML 문서 검색 기법 (A Search Method of Similar XML Documents based on Bitmap Indexing)

  • 이재민;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.15-18
    • /
    • 2004
  • XML 검색을 위한 기존의 비트맵 인덱싱은 XML을 문서, 경로, 단어로 구성된 3차원 비트맵 인덱스에 매핑하고 이를 이용해 정보를 추출함으로써 뛰어난 성능을 입증하였다. 그러나 이것은 유사 문서를 수집하고 검색하기 위해 경로 전체를 인덱스 구성의 단위로 사용함으로써 유사 경로를 인식하지 못하는 문제를 초래하였으며 유사 경로를 인식하지 못함으로 인해 유사 문서 검색의 치명적인 성능 저하가 발생하게 되었다. 이에 따라 본 논문에서는 기존의 XML 검색을 위한 비트맵 인덱싱이 유사 경로를 인식하지 못하는 문제점을 해결하기 위해 유사 경로 탐색을 위한 새로운 비트맵 인덱스를 설계하고 이를 통해 효과적으로 유사 문서를 검색할 수 있는 기법을 제안한다. 제안된 기법은 노드들을 단위로 하는 새로운 비트맵 인덱스를 구성하고 구성된 인덱스의 중심을 통해 유사 경로 탐색을 위한 클러스터들을 선별적으로 검색한다. 그리고 유사 경로 탐색을 통해 추출된 경로들을 유사 문서 검색에 활용함으로써 비트맵 인덱싱의 빠른 성능을 그대로 유지하면서 기존의 XML 검색을 위한 비트맵 인덱싱이 유사 경로를 인식하지 못함으로써 발생하는 유사 문서 탐색의 성능 저하를 효과적으로 해결한다.

  • PDF

향상된 균일 스케일링을 이용한 유사 음악 검색시스템 (A Similar Music Retrieval System using Improved Uniform Scaling)

  • 이혜환;심규석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.183-188
    • /
    • 2006
  • 허밍을 통한 유사 검색 질의가 주어질 때 효과적으로 음악 데이터베이스를 검색하는 시스템에 대한 연구는 다양한 방향으로 진행되어 왔다. 최근에는 음악 데이터와 허밍 질의를 시계열 데이터로 보고 시계열 데이터 유사 검색과 관련하여 제안되어 왔던 여러 가지 거리 척도(distance measure)나 인덱싱 기법등을 적용하여 효과적으로 질의를 처리하려는 시도가 계속 되고 있다. 허밍 질의의 특성을 고려한 균일 스케일링(Uniform Scaling)을 사용하여 효과적인 유사 검색을 하는 방법은 가장 최근 제시된 방법 중 하나이다. 본 논문에서는 허밍을 통한 유사 검색 시스템인 Humming BIRD(Humming Based similaR miDi music retrieval system)를 제안하고 구현하였다. 슬라이딩 윈도우를 사용하여 음악의 임의의 부분에 대한 허밍 질의를 처리할 수 있도록 하였으며 효율적인 검색을 위해 중심을 일치시킨(center-aligned) 균일 스케일링을 제안하고 이 거리의 하한을 계산하는 하계 함수를 사용하여 탐색 공간(search space)을 효과적으로 줄여 더 빠르고 효과적인 유사 검색을 가능하도록 하였으며 실험을 통해 중심을 일치시킨된 균일 스케일링이 이전과 같은 검색 결과를 얻으면서도 효과적으로 검색함을 탐색 공간을 줄이는 가지치기 성능을 비교함으로써 보였다.

  • PDF

클러스터링 및 연속적 I/O를 이용한 이미지 데이터 검색 연구 (A study on the searching of images via clustering and sequential I/O)

  • 김진옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2002
  • 본 연구에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사할 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제시한다. 이 연구에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속주인 파일 I/O를 사용하여 클러스터를 찾는 데용을 최소화한다 클러스터인덱싱 접근은 트리 유사 구조와 임의 I/O를 사용한 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보이며 연속적 I/O를 통해 검색 미용을 낮춘다.

  • PDF

음원의 주파수 변화율과 코사인 유사도 알고리즘을 이용한 음악 검색 시스템 개발 (Development of Music Information Retrieval System Using Differentiation of Frequency and Cosine Similarity Algorithm)

  • 송지원;임은주;하성윤;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1027-1030
    • /
    • 2014
  • 대중음악과 스마트폰 기술이 발달하면서 사용자가 직접 음악을 검색할 수 있는 내용 기반 음악 검색 기술이 연구되었다. 그 결과 허밍을 사용하여 음악을 검색할 수 있는 음악 검색 시스템이 개발되었지만, 검색 속도가 느리고 검색 결과가 부정확한 시스템이 많다. 본 논문에서는 음원의 주파수 변화율을 측정하고 이를 코사인 유사도 알고리즘을 이용하여 유사도를 측정하는 음악 검색 시스템을 설계하였고, 각 설계요소를 설명한다. 새로 설계한 음악 검색 시스템을 기반으로 한 실험을 통하여 기존의 음악 검색 시스템과 유사한 성능이 나오는 것을 확인하였으며 본 논문에서 제시한 새로운 음악 검색 시스템은 기존 음악 검색 시스템보다 구조가 단순하면서도 유사한 결과를 내고 있다.

CCV와 GLCM을 이용한 계층적 내용기반 영상검색시스템의 구현 (Implementation of Hierarchical Content-based Image Retrieval System using CCV & GLCM)

  • 이경자;정성환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.28-33
    • /
    • 1998
  • 대량의 영상데이터베이스에서 질의영상에 대한 유사영상을 검색할 때의 유사도 계산을 위한 시간소모는 영상의 실시간 검색효율을 저하시키는 요인이 된다. 본 논문에서는 키영상(key image)을 이용하여 영상데이터베이스의 각 영상과 키영상의 유사도를 미리 계산해 둠으로써 질의영상과 데이터베이스 영상간의 유사도 계산시간을 단축시킨다. 그리고 검색효율을 높이기 위해 1차적으로 칼라특징으로 유사영상들을 분류한 후, 1차 분류된 영상들만을 대상으로 계층적으로 질감특징값으로 영상을 비교함으로써 검색효율을 상승시킨다. Oracle 데이터베이스 상에서 본 계층적 내용기반 영상검색시스템을 구현하였다.

  • PDF

시소러스를 이용한 XML 태그 검색 시스템 (An XML Tag Search System By Using Thesaurus)

  • 양승원;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.145-147
    • /
    • 2000
  • 현재 웹 기술은 HTML에서 정보를 표현하는 외형과 내용을 분리하여 정보를 구조화할 수 있는 XML을 사용하고 있다. 구조적으로 구성된 XML은 새로운 정보 검색의 방법을 제시하였다. 즉, 태그를 이용한 정보검색으로 검색어에 의미를 부여함으로써 정보 검색자에게 좀더 효율적인 검색을 가능하게 하였다. 그러나 이러한 구조화 문서 검색 기법은 정확한 태그를 입력하였을 경우에만 결과를 얻을수 있는 단점을 지니고 있다. 따라서 본 논문에서는 XML문서의 태그 검색에 있어 정확한 태그 검색을 확장한 유사 태그 검색기법을 설계하고 구현하였다. 유사한 태그를 검색하기 위하여 시소러스를 구성하였으며, 작성된 시소러스를 이용하여 유사한 태그에 대한 검색을 수행하였다. 기존의 XML문서 검색 시스템은 정한 태그에 대한 검색만을 수행할 수 있는 반면, 본 시스템은 태그검색에 있어 시소러스를 활용함으로써 질의에 입력되어진 태그와 유사한 태그에 대한 검색 결과를 보여줌으로써 사용자에게 질의어 선정의 불편함을 감소시켰다.

  • PDF

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

색상과 불변 모멘트를 이용한 내용기반 이미지 검색 (Contents-based Image Retrieval using Color and Invariant Moments)

  • 김목련;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.161-164
    • /
    • 2007
  • 최근 인터넷과 멀티미디어 기술이 발달함에 따라 이미지 데이터의 양이 급속히 증가하고 있다. 증가하는 이미지를 효과적으로 관리하고 검색하기 위해 내용기반 이미지 검색에 대한 연구가 활발히 진행되고 있다. 대부분의 내용 기반 이미지 검색 시스템은 색상, 모양, 질감 특징을 이용한 유사도-기반검색에 초점을 맞추고 있다. 따라서 본 논문에서는 이미지에 나타나는 주요 색상과 색상의 공간적 특성을 포함하는 픽셀샘플링, 그리고 이미지의 외형적 변경에 강인함을 갖는 불변 모멘트 값을 이용한 내용기반 이미지 검색 시스템을 제안한다. 첫 번째 유사성 검사 단계에서는 이미지의 영역별로 가중치를 부여하여 추출한 대표색상을 사용하여, 유사하지 않은 이미지를 제거하여 검색대상의 수를 줄이며, 두 번째 유사성 검사 단계에서는 첫 번째 단계에서 선별된 후보 이미지에 색상의 공간적 정보를 포함한 픽셀샘플링을 이용하여 색상의 공간적인 위치까지 유사한 이미지만을 선별한다. 두 번째 유사성 검사단계에서 이미지가 외형적으로 변형된 유사이미지의 검출이 어려운 점을 보완하는 방법으로 이미지의 불변 모멘트를 이용하여 검색의 정확성을 높인다. 제안한 이미지 검색 방법은 10000개의 다양한 이미지로 구성된 데이터베이스에서 검색을 효율성을 실험하였다.

대표 색상 정보를 이용한 영역 기반 이미지 검색 시스템의 설계 및 구현 (Design and Implementation of a Region based Image Retrieval System using Color Information)

  • 김목련;박영호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.462-467
    • /
    • 2008
  • 최근 웹 2.0 시대 참여, 공유, 개방 정신이 확대 되고, 다양한 디지털 저작물들이 대량 제작되어 활용되고 있다. 그리고 디지털 저작물의 특징상 누구나 손쉽게 무제한으로 복제와 유통이 가능함으로 디지털 저작물이 양은 기하급수적으로 증가하고 있다. 증가하는 이미지를 효과적으로 관리하고 검색하기 위해 색상, 질감, 모양 등을 이용한 내용기반 이미지 검색에 대한 연구가 활발히 진행되고 있다. 색상을 이용한 이미지 검색방법의 하나로 색상 히스토그램을 이용한 검색 방법이 있다. 그러나 이는 공간적인 상호관계를 적절히 표현하지 못한다는 단점이 있다. 따라서 본 논문에서는 이미지에 나타나는 주요 색상 및 불변 모멘트 값과 이미지의 중앙을 중심으로 한 영역별 유사도 검사를 통한 내용기반 이미지 검색 시스템을 제안한다. 첫 번째 유사성 검사 단계에서는 이미지의 영역별로 가중치를 부여하여 추출한 대표색상 정보를 사용하여, 유사하지 않은 이미지를 제거하여 검색대상의 수를 줄인다. 두 번째 유사성 검사 단계에서는 이미지를 영역으로 나누고, 이미지의 중심 영역부터 영역을 확장하며 영역마다 구축된 인덱스 검색을 통해 영역기반 유사 이미지 검색을 수행 한다. 세 번 단계에서는 이미지의 변형에 불변한 값인 불변 모멘트를 사용하여, 영역별 검사에서 제외된 유사이미지를 재검사한다. 제안한 이미지 검색 방법은 10000개의 다양한 이미지로 구성된 이미지 데이터베이스에서 검색을 실험을 통해 검색의 정확도 및 회수율을 측정하였다.

  • PDF

모양 특징정보 기반 이미지 검색을 위한 이진 영상 변환 및 유사도 검색 (Binary Conversion and Similarity Check for Shape feature Information based Image Retrieval)

  • 김주연;김진천
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.375-378
    • /
    • 2003
  • 본 논문에서는 공간적 정보로 이미지검색을 하는 모양 특징정보 기반 이미지 검색 시스템에서 검색효율을 향상 시킬 수 있는 이진 영상 변환 및 유사도 검색에 대한 기법을 제안하였다. 모양특징정보의 좀더 정확한 값의 추출을 위해 이미지의 잡음이 윤곽선으로 인식되는 값이 최소화 될 수 있도록 하는 이진 영상 변환방법을 제안하였으며, 유사도 검색에서는 영역별 특징정보 간의 비교와 병행하여 영역을 다시 소그룹화한 다음 소그룹간의 평균 유사도 값의 비교방법을 적용하였다. 성능 평가를 통하여 제안된 이진 영상 변환 겐 유사도 검색 방법을 사용한 경우 기존의 방법보다 향상된 검색 효율성을 보임을 알 수 있었다.

  • PDF