• 제목/요약/키워드: 데이터 검색 알고리즘

검색결과 514건 처리시간 0.032초

트리기반 멀티미디어 데이터의 의미적 검색을 위한 프레임워크 설계 (Design of the Framework for Tree-based Semantic Retrieval of Multimedia Data)

  • 안형근;고재진;양상석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2005
  • 현재 웹을 사용하는 사람, 디지털 컨텐츠, 정보의 생성이 계속적으로 증가하여 오고 있다. 최근 웹 데이터는 멀티미디어 데이터(비디오, 오디오, 웹TV, 이미지 등)라고 말해도 무방할 것이다. 이런 방대한 멀티미디어 데이터의 검색은 사용자들에게는 아주 중요한 작업이 되었으며, 효과적인 멀티미디어 검색 시스템의 필요성이 대두되고 있다. 최근까지의 멀티미디어 데이터 검색은 내용${\cdot}$주석기반의 검색이 주를 이루고 있다. 하지만 내용${\cdot}$주석 기반 검색은 의미${\cdot}$추론적 검색에서는 부족함을 보여주고 있는 실정이다. 따라서 본 논문에서는 검색 방법 중에서도 주석 기반 검색에서 가지는 문제점을 살펴보고 그에 대한 해결 알고리즘과 프레임워크를 제안한다.

  • PDF

병렬 정보검색 시스템의 순차적인 검색엔진 알고리즘의 병렬화를 위한 연구 (A Study for Parallelizing Sequential Algorithms of Search Engine in Parallel Information Retrieval System)

  • 김석영;박미영;박혁로;정인상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2007
  • 대규모 데이터를 효율적으로 검색하기 위한 병렬 정보검색 시스템에서는 하드웨어 확장으로 인한 병렬화로 시스템 전체의 작업 처리량을 증가시켰다. 그러나 병렬 시스템 상에서 수행되는 검색엔진의 알고리즘들은 여전히 순차적으로 수행되기 때문에, 사용자의 개별적인 질의처리 시간은 단축되지 않는다. 본 연구는 검색엔진의 병렬화를 위하여 사용자 질의처리 과정과 역색인 파일처리 과정의 순차 알고리즘들을 조사하여 병렬화의 필요성과 가능성을 평가한다. 이러한 평가는 병렬 정보검색 시스템에서 수행되는 순차 알고리즘들의 효과적이고 체계적인 병렬화를 도모하고, 보다 효율적인 병렬 정보검색 시스템의 구축을 가능하게 한다.

공간 데이터베이스 관리 시스템을 위한 버전 기반의 공간 레코드 관리 기법 (Version Based Spatial Record Management Techniques for Spatial Database Management System)

  • 김희택;김명근;김호석;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2004
  • 기존의 공간 데이터베이스 관리 시스템에서는 공간 데이터의 검색 연산이 주된 연산이었지만. 최근 공간 데이터베이스 관리 시스템에서는 이동 객체의 실시간 위치 갱신 및 추적 등 공간 데이터의 갱신 연산 또한 빈번하게 발생하고 있으며, 이에 트랜잭션간 동시성 향상의 필요성이 증가하고 있다. 기존의 일반적인 데이터베이스 관리 시스템에서는 트랜잭션의 동시성 문제를 해결하고 성능을 향상시키기 위해서 많은 기법들이 연구되었으며, 그 중에서 다중버전 알고리즘은 각 트랜잭션간의 상호간섭을 최소화시키면서 동시성을 향상시키기 위한 알고리즘이다. 하지만 공간 데이터베이스 관리 시스템에 트랜잭션의 동시성 향상을 위하여 기존의 멀티버전 알고리즘을 적용할 경우, 공간 레코드의 속성 데이터만 변경되어도 공간 레코드 전체에 대한 버전을 저장해야 하기 때문에 저장 공간의 낭비가 발생한다. 본 논문에서는 공간 레코드에 대해 트랜잭션간의 동시성을 향상시키고, 공간 레코드 버전의 저장 공간 낭비를 줄이기 위한 방법으로 속성 데이터 버전과 공간 데이터 버전을 분리하여 생성, 관리하는 레코드 관리 기법을 제안한다. 본 기법은 검색 트랜잭션은 갱신 트랜잭션의 영향을 전혀 받지 않고 트랜잭션을 진행할 수 있으며, 갱신 연산시 공간 레코드 전체의 버전을 생성하는 대신에 공간 레코드를 속성 데이터 버전과 공간 데이터 버전으로 분리하여 갱신된 데이터 버전만 생성 관리하는 기법이다.

  • PDF

효율적인 8진 트리 검색 방식의 허프만 복호화기 구현 (Efficient Huffman decoder using octal tree search algorithm)

  • 우광희;김구용;한헌수;차형태
    • 한국통신학회논문지
    • /
    • 제25권12B호
    • /
    • pp.2033-2038
    • /
    • 2000
  • 여러 가지 압축알고리즘 중에서 허프만 부호화는 데이터의 통계적인 중복성을 제거하기 위한 방법으로 많이 사용되어 왔다. 이제까지 허프만 테이블의 특성과 코드워드의 패턴에 따라 효율적으로 복호화할 수 있는 알고리즘이 많이 제안되었다. 본 논문에서는 8진 트리 검색 방법을 이용한 허프만 복호화 알고리즘을 제안하고 효율적인 하드웨어 구현 방법을 제안한다. 하드웨어의 메모리와 게이트 면적을 소형화하였고 빠른 검색을 위하여 알고리즘을 최적화하여 MPEG 오디오 복호화기 시스템에 적용할 수 있게 하였다.

  • PDF

점진적 알고리즘을 이용한 웹 문서 클러스터링 시스템의 설계 및 구현 (Design and implementation of web document clustering system using on incremental algorithm)

  • 황태호;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.207-209
    • /
    • 1999
  • 클러스터 분석은 관측의 대상이 되는 집합에 맞는 분류 구조를 생성하는데 이용되는 통계학적인 기술이다. 정보검색 응용에서 전형적으로 발견되는 높은 차원을 가진 많은 데이터 집합을 클러스터하기 위하여, 많은 공간과 시간이 필요하다. SLINK 알고리즘은 O(n2)의 시간과 O(n)의 공간의 성능을 갖으며 점진성을 반영할 수 있는 알고리즘이다. SLINK알고리즘을 이용하여 검색 엔진의 검색결과에 온라인으로 클러스터 분류를 수행하는 시스템을 구현하였다. 구현된 시스템은 상대적으로 높은 정확도와 각 클러스터를 저장하고 표현하는데 있어서의 장점을 제공하며, 상대적으로 느린 수행 속도는 온라인으로 문서들이 다운로드 되는 속도가 느리므로 문제가 되지 않음을 알 수 있었다.

  • PDF

인터넷 라우터에서의 패킷 분류를 위한 2차원 이진 검색 트리 (Two-dimensional Binary Search Tree for Packet Classification at Internet Routers)

  • 이고은;임혜숙
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.21-31
    • /
    • 2015
  • 현재의 인터넷 사용자들은 실시간으로 다양한 멀티미디어 서비스를 제공 받길 원한다. 이에 네트워크 트래픽의 속도는 매우 빨라지고 있으며, 처리하여야 하는 데이터의 양은 해마다 기하급수적으로 증가하고 있다. 데이터는 '패킷'이라는 단위의 데이터 형식으로 전송되며, 패킷분류는 인터넷 라우터의 가장 어려운 기능 중 하나로 모든 패킷에 대하여 선속도로 처리되어야 한다. 다양한 패킷 분류 알고리즘 중, 영역분할 패킷분류 알고리즘은 5개의 패킷 헤더 필드 정보를 동시에 검색할 수 있는 효율적인 알고리즘이다. 영역 분할 사분 트라이는 가장 대표적인 영역분할 패킷분류 알고리즘으로 메모리 요구량이 적은 알고리즘이지 만, 빠른 검색성능을 보장하지 못하는 단점이 있다. 본 논문에서는, 영역 분할 사분 트라이의 단점을 이진 검색 트리를 사용해 보완하는 새로운 알고리즘을 제안한다. 실험을 통하여 제안하는 알고리즘은 입력과 비교되는 룰의 수에 있어 영역 분할 사분 트라이 보다 검색 성능이 향상됨을 보았다.

이미지 데이타 클러스터링을 이용한 검색 연구 (Study on the searching of images via clustering)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.97-100
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성을 가지기 때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 사용자가 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 연구에서는 멀티미디어 데이터 검색에 클러스터링와 인덱싱 기법을 같이 적용하여 유사한 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제안한다 제안 검색 방법은 클러스터링을 생성하는 알고리즘과 해싱기법의 인덱싱을 같이 적용함으로써 VQ(Vector Quantization)보다 높은 재현율과 정확도를 보인다.

  • PDF

비디오 데이터에서 움직임 객체의 모델링을 위한 시공간 표현 기법 (A Spatio-temporal Representation Scheme for Modeling Moving Objects in Video Data)

  • 심춘보;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.585-595
    • /
    • 2000
  • 비디오 데이터에서 움직임 객체에 대한 움직임 경로는 내용-기반 검색을 위해 비디오 데이터를 색인하는 데 있어 매우 중요한 역할을 한다. 따라서, 본 논문에서는 비디오 데이터에서 움직임 객체의 움직임 경로를 모델링하기 위한 새로운 시공간 표현 기법을 제안한다. 비디오 데이터를 위한 보다 효율적인 내용-기반 검색을 위해, 제안하는 기법은 시간, 공간 관계성과 더불어 일정 시간 간격 동안 움직인 객체의 이동 거리(moving distance)를 고려한다. 아울러, 제안하는 표현 기법에 기반하여 단일 움직임 객체의 움직임 경로와 다수 움직임 객체들의 움직임 경로를 위한 새로운 유사성 측정 알고리즘을 제시하며, 이들 알고리즘은 검색 결과에 대해서 유사성에 준하여 순위(Ranking)를 부여할 수 있다. 마지막으로, 성능 평가를 통하여 제안된 시공간 표현 기법은 기조의 Li 방법과 Shan의 방법에 비해 동등한 재현율을 유지하며, 정확율 측면에서 약 20%의 성능 향상을 보인다.

  • PDF

유전체 데이터의 유래(Provenance) 관리를 위한 메타데이터의 설계 (Design of Metadata for Provenance Management of Genome Data)

  • 송명선;장재우;엄정호;최동훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1195-1198
    • /
    • 2011
  • 최근 의료 분야에 대한 관심이 높아짐에 따라 유전체 데이터를 수집하고 관리하여 분석하는 기술에 대한 많은 연구가 수행되고 있다. 유전체 데이터는 크게 유전체 데이터를 분석하는 전처리단계와 유전체 데이터로부터 변이된 유전체 데이터를 생성하는 후처리단계를 통해 분석된다. 이러한 분석 과정은 많은 시간이 소요되며, 후처리단계에서 결과 데이터는 분석 알고리즘 및 처리 기법에 따라 상이한 결과 데이터를 생성한다. 또한, 유전체 데이터의 각 파이프라인 별 분석된 데이터의 관리가 필요하다. 본 논문에서는 유전체 데이터의 특성을 고려하여, 유전체 데이터 유래 관리를 위한 메타데이터를 설계한다. 아울러 데이터 유래 메타데이터는 자신의 이전데이터들의 결과데이터에 신속한 접근이 가능해야하며, 자신과 유사한 데이터 유래를 지닌 파이프라인의 상세 정보를 신속하게 검색하는 색인구조가 필요하다. 따라서 이를 고려한 유래 메타데이터 검색 알고리즘을 설계한다.

FCM을 이용한 지식기반 데이터베이스 검색 시스템의 구축 (Building of Database Retrieval System Based on Knowledge using FCM)

  • 박계각;서기열;천대일;양원재
    • 한국지능시스템학회논문지
    • /
    • 제11권1호
    • /
    • pp.88-93
    • /
    • 2001
  • 기존의 데이터베이스 검색시스템은 사용자의 검색 조건에 정확히 일치하는 데이터가 데이터베이스 내에 존재할 경우에만 사용자에게 해당 데이터를 제공할 수 있고, 사용자의 검색조건을 정확히 만족하는 데이터가 없을 경우에는 적절한 데이터를 제공할 수 없는 문제점이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 FCM의 클러스터증가 및 재초기화 알고리즘을 제안하였고, FCM을 이용하여 데이터베이스 내의 데이터로부터 구축된 지식기반 데이터베이스(KDB)와 구축된 이미지 데이터베이스와 연동을 통하여 사용자의 요구에 가장 근접한 데이터를 제시해 주는 검색시스템을 제안하였다. 본 연구에서 제안된 수법을 우체국의 우편주문안내책자를 이용한 선물고르기 DB 검색 시스템에 적용하여 그 유효성을 확인하였다.

  • PDF