• 제목/요약/키워드: 정보검색기법

검색결과 2,279건 처리시간 0.037초

비디오 데이터에서 움직임 경로의 효율적인 검색을 위한 시그니쳐-기반 접근 기법 (A Signature-based Access Method for Efficient Retrieval on Moving Objects′Trajectories in Video Data)

  • 심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.253-255
    • /
    • 2001
  • 본 논문에서는 비디오 데이터가 지니는 움직임 객체의 움직임 경로(Moving Objects'Trajectories)를 이용한 사용자 질의에 대해 효율적인 검색을 위만 새로운 시그니쳐 기반 접근 기법을 제안한다. 제안하는 시그니쳐 기반 접근 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들을 탐색하여 필터링을 수행하기 때문에, 순차 탐색에 대해 디스크 접근 횟수를 감소시켜 검색 성능을 향상시킨다. 마지막으로 성능 평가를 통해 제안하는 방법이 삽입 시간, 검색 시간, 그리고 부가 저장 공간의 검색 효율(Retrieval Efficiency) 측면에서 성능이 우수함을 보인다.

  • PDF

KD-Trees 와 PCA를 이용한 MPEG 비디오 검색 (MPEG Video Retrieval using KD-Trees and PCA)

  • 김대일;장혜경;홍종선;김영호;강대성
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2003년도 하계학술대회 논문집
    • /
    • pp.118-121
    • /
    • 2003
  • 본 논문은 동영상 압축 부호화에 대한 표준안인 MPEG기반의 압축 비디오 stream에서[1, 2], 질의 영상에 대한 효율적인 검색 기법을 제안한다. 비디오 검색은 높은 차원의 색인 정보를 이용하는데, 높은 차원의 data set을 색인 정보로 하여 효율적인 검색 능력을 보여주는 KD-Trees(K Dimensional-Trees)알고리즘[3]을 비디오 검색기법에 적용하고자 한다. 먼저, key frame에 PCA (Principal Component Analysis) 알고리즘[4]을 이용하여 색인 정보를 추출한 다음, 추출된 색인 정보를 KD-Trees에 적용하여 효율적인 검색을 가능하게 한다. 실험 결과, 기존의 검색 기법보다 상당한 양의 처리 시간과 메모리 공간을 줄일 수 있음을 보였다.

  • PDF

유서문서 및 관련연구자 검색 방법 (Similar Documents and Related Researcher Retrieval Method)

  • 한희준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.6-9
    • /
    • 2010
  • 학술정보 이용자는 연구에 필요한 자료를 획득하기 위해 검색서비스를 이용한다. 대부분의 웹 이용자는 원하는 정보를 얻기 위해 수많은 검색 질의어를 생성하여 시스템에 요청하고 선별된 정보 리스트들을 탐색하고 정보획득의 최종 목적지로써 해당 정보의 상세화면으로 이동하게 된다. 마찬가지로 논문 및 특허 정보를 제공하는 학술정보서비스의 경우 이용자의 최종 목적지는 한 건의 상세 메타정보 혹은 원문이 되는데, 이 때 이용중인 정보와 유사한 다른 유형의 학술정보 및 관련 연구 분야의 연구자 제공 서비스는 이용자의 정보획득 요구를 쉽게 충족시키기 위한 필수요소이다. NDSL(국가과학기술종합정보서비스) 의 경우 동일 DB내에서의 유사문서 검색기능(논문검색에서는 유사논문 제공, 특허검색에서는 유사특허 제공)을 제공하지만 이는 이종 DB간 유사문서를 이용하고자 하는 사용자 요구사항을 만족시키지 못하는 수준이다. 본 논문에서는 논문, 특허, 연구보고서, 동향분석 자료를 포함한 학술정보 검색서비스에서 사용자 질의어와 검색엔진이 제공하는 검색 요소 및 부스팅(boosting) 기법을 이용한 이종 컨텐츠간 유사문서 리스트 및 관련 연구 분야의 연구자명 검색 서비스 기법에 대해 논한다. 이는 사용자가 원하는 학술정보를 서비스 최종 화면에서 효과적으로 제공함으로써 반복되는 검색 및 탐색의 노력을 줄일 수 있다.

  • PDF

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

다차원 시퀀스 데이터베이스를 위한 효율적인 범위 검색 기법 (Efficient Range Search Method for Multi-dimensional Sequence Database)

  • 이상준;김범수;이석호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.613-620
    • /
    • 1999
  • 시간의 흐름에 따라 순차적으로 생성되는 연속적인 데이터의 모임을 시퀀스라 한다. 저장된 시퀀스에서 질의로 주어진 시퀀스와 유사한 것을 찾는 문제에 대한 기존의 연구는 대부분 하나의 속성만을 대상으로 한것이며, 여러 속성으로 구성된 다차원 시퀀스에 대해서는 아직까지 활발한 연구가 이루어지지않고 있다. 본 논문에서는 유사도에 기반한 다차원 시퀀스의 범위 검색 문제를 정의하고 세 가지 검색 기법을 기술한다. 순차 검색 기법, 속성별 인덱스 구조, 차원 감소 기법을 이용한 다차원 시퀀스의 검색 기법을 기술하고 질의에 대해 어떤 검색 기법이 효율적인지 실험을 통해 보인다.

문서 클러스터링 기법을 활용한 병렬 정보 검색 (Parallel Information Retrieval using Document Clustering Techniques)

  • 강유경;박세진;류광렬;정상화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.750-752
    • /
    • 1998
  • 본 논문은 고품질의 정보를 신속하게 제공할 수 있으며, cost-effective 한 medium-grained 병렬 정보 검색 시스템을 제시하고 있다. 본 검색 시스템은 병렬 모델의 효율을 극대화하는 방안으로 문서 라이브러리를 작은 단위의 클러스터로 세분화하고 검색 시 클러스터 단위로 프로세서에 할당될 수 있게 하여 할당될 작업의 단위를 적절히 중규모화하였을 뿐만 아니라, 각 클러스터마다 독립적인 염색인 파일을 별도로 두어 순위 부여 계산시 통신을 최소화 할 수 있도록 하였다. 또한, 기계 학습 기법을 이용하여 가능한 한 유사한 문서군이 되도록 클러스터링 함으로써 불필요한 크러스터가 검색될 가능성을 최소화하여 성능을 높였다. 본 검색 시스템은 분산메모리 MIMD 구조의 트랜스퓨터에서 구현되었으며, Connection machine에서 사용되는 Stanfill방법과의 비교 실험을 통하여 계층적인 접근법의 성능을 비교, 평가하였다. 그리고 random클러스터링 기법과 비교하여 기계학습을 통한 클러스터링 접근방법이 우수함을 보이고 있다.

  • PDF

범주 기반 평가를 이용한 검색시스템의 성능 향상 (Improving Performance of Search Engine Using Category based Evaluation)

  • 김형일;윤현님
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.19-29
    • /
    • 2013
  • 정보에 대한 공간 복잡도가 높은 현재의 인터넷 환경에서는 사용자가 원하는 정보를 정확히 제공하는 것이 검색엔진의 목표이다. 그러나 대다수 검색엔진이 활용하는 내용 기반 기법은 현재의 인터넷 환경에서는 효과적인 도구로 사용될 수 없다. 내용 기반 기법은 어휘의 형태적 특성을 이용하여 웹페이지 가중치를 결정하기 때문에 웹페이지에 대한 변별력이 우수하지 못하다는 단점이 있다. 이러한 문제점을 해결하여 사용자에게 효과적인 정보를 제공하기 위해, 본 논문에서는 범주 기반 평가 기법을 제안한다. 범주 기반 평가 기법은 질의어를 의미관계로 확장하여 웹페이지와 유사성을 측정한다. 웹페이지 가중치 적용에 있어서, 범주 기반 평가 기법은 웹페이지 검색에 대한 사용자 반응과 질의어 범주를 가중치에 활용함으로써 웹페이지에 대한 변별력을 증가시킨다. 본 논문에서 제안한 기법은 사용자가 원하는 정보를 검색엔진을 통해 효과적으로 제공할 수 있는 장점이 있으며, 다양한 실험을 통해 범주 기반 평가 기법의 활용성을 확인하였다.

MPEG-7에 기반한 동영상 검색 시스템 인덱스 기법 (A Method of Movie Retrieval System Index based on MPEG-7)

  • 김택곤;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.25-27
    • /
    • 2003
  • MPEG-7은 XML을 이용하여 사용자가 원하는 내용을 검색하고 브라우징할 수 있도록 하는 멀티미디어 컨텐츠의 다양한 정보를 기술하고 있다. 그러나 많은 부분으로 나누어진 세부화된 장면들을 찾는 질의가 주어졌을때 원하는 정보를 찾기 위하여 모든 문서의 내용을 검색하는 것은 상당한 시간이 요구되며, 일반적인 XML 문서의 인덱싱 기법을 적용할 경우 MPEG-7의 관점에서 부합되지 않은 점이 있다. 본 논문에서는 이를 개선하기 위하여 MPEG-7 문서의 구조적인 정보를 기반으로 하는 인덱싱 기법을 제안하고 질의를 하여 동영상내의 원하는 부분을 효율적으로 찾는 방법을 보인다.

  • PDF

연관률 기반 복합어를 이용한 개선된 정보검색 시스템 (Improved Information Retrieval System Using Multi word Based On Association Ratio)

  • 이병희;최종필;박승규;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.163-165
    • /
    • 2004
  • 복합어의 추출은 정보 검색 및 온톨로지 분야의 연구에 있어서 중요한 비중을 차지하고 있다. 이 분야의 연구는 언어학적인 필터링 및 통계적 기법에 기반 한 연구와 최근의 문맥정보 및 사전 점보를 이용하는 기법 등으로 구분될 수 있다. 복합어를 정보 검색 및 온톨로지 분야에 응용하기 위해서는 복합어의 정확한 추출뿐만 아니라 그 복합어가 문서를 표현할 수 있는 정도를 측정하는 기법이 필요하다. 특히 정보검색 분야에서는 추출된 복합어에 대해 어떻게 가중치를 부여할 것인 가가 중요한 문제이다. 본 논문에서는 연관률(Association Ratio)에 기반 하여 복합어를 추출하고, 추출된 복합어에 대친 적절한 가중치를 부여함으로써 검색 시스템의 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

군집화를 이용한 하이브리드 기반 채용검색 랭킹 기법 (Recruiting Ranking Techniques Based on Hybrid Using Clustering)

  • 조보연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1587-1590
    • /
    • 2012
  • 인터넷의 활용이 보편화 됨에 따라 정보의 양은 급격히 늘어나고 있다. 이에 취업을 희망하는 구직자의 경우 IR 로부터 원하는 정보를 검색하기 위해 과거보다 더 많은 시간과 노력이 필요하게 되었다. 이에 본 논문에서는 TF(Term Frequency)기법을 통해 문서를 추출하고 추출된 문서의 Doc_ID 빈도수를 기준으로 한 내용기반과 군집기법을 혼합한 하이브리드 검색 시스템을 제안한다. 구직자들이 클릭한 취업정보들의 링크번호들을 K-means 알고리즘을 이용하여 군집화를 한다. 생성된 군집들은 각기 하나의 문서로 가정하고, 기존 문서과 더불어 검색 주제와 연관성을 갖고 있는 문서들을 동적비율로 검색 랭킹 하는 방식이다. 기존의 IR 기술과의 비교 실험을 통해 성능을 평가하였다. 실험결과 본 논문에서 제안한 방법이 기존의 방법보다 우수함을 확인할 수 있었다