• 제목/요약/키워드: 정보검색기법

검색결과 2,281건 처리시간 0.032초

웹문서분류체계의 설계 (Design for the System of Web Document Classification)

  • 남영준
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.183-188
    • /
    • 1998
  • 인터넷에 존재하는 웹 문서와 사이트들은 충분히 학술적 가치를 갖고 있기 때문에 중요한 정보원으로 간주된다. 도서관은 이 새로운 정보원을 대상으로 도서관 이용자를 위한 새로운 검색기법과 관리기법을 개발할 필요가 증대되었다. 왜냐하면 현재 웹 검색 엔진에서 제공하는 분류체계는 도서관학적 관점에서 개발되지도 않았으며 또한 웹 검색엔진간 분류체계의 설계원칙도 없기 때문이다. 본 논문에서는 이점에 착안하여 웹문서를 효율적으로 검색할 수 있는 실험적인 새로운 웹 문서분류체계를 설계하였다. 설계는 해당 분류항목과 연관된 웹 문서의 수와 접속비율에 근거하였으며, 설계의 수준은 1차적으로 류·강 항목까지 제한하였다.

  • PDF

타임스탬프된 이벤트 시퀀스를 위한 효율적인 검색 방법 (An Effective Searching Method for Timestamped Event Sequences)

  • 이우준;노국필;강성구;박상현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.782-784
    • /
    • 2003
  • 시퀀스로부터 원하는 패턴을 효율적으로 검색하는 것은 타임 시리즈 분석이나 네트웍 침입 탐지와 같은 응용 환경에서 필수적이다. 예로서, 특정한 이벤트가 발생할 때마다 이벤트의 유형과 발생 시각을 기록하는 네트웍 이벤트 관리 시스템을 생각해보자. 네트웍 이벤트들의 연관 관계를 발견하기 위한 전형적인 질의 형태는 다음과 같다: "CiscoDCDLinkUp이 발생한 후 20초 이내에 MLMStatusUP이 발생하며 그 후 40초 이내에 CiscoDCDLinkUP이 발생하는 모든 경우를 검색하라." 이 논문은 위와 같은 질의를 효율적으로 처리할 수 있는 방안으로 빈도수 기반, 조인 기반, 트리 순회 기반의 검색 기법들을 제시한다.기법들을 제시한다.

  • PDF

용어가중치 결합이 검색 효율성에 미치는 영향 연구 (The Impact of Combining Term Wights on Retrieval Effectiveness)

  • 최성환;정영미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문에서는 데이터 결합 영역에서 문서값을 정규화 하는 기법과 결합함수에 따라 용어가중치 결합이 검색성능에 어떤 영향을 미치는가를 분석하였으며, 특히 용어가중치 결합이 실질적으로 효율적인가를 성능 향상률 측면과 검색시스템의 효율성 측면에서 검증하고, 성능이 향상된 용어가중치 결합의 특징을 분석하였다. 실헙결과 대부분의 장어가중치 결합은 문서값 정규화 기법과 실험집단에 관계없이 높은 성능 향상률을 보이지 않았다. 특히 단일가중치고 높은 검색성능을 보였던 상위 가중치 알고리즘들은 다른 가중치 알고리즘과 결합할 경우 두드러진 성능 향상률을 보이지 않았다. 검색시스템의 효율성 측면에서 용어가중치 결합을 평가한 결과 문헌 내 단어빈도를 최대단어 빈도로 정규화한 가중치 알고리즘이 코사인 정규화 기법을 적용한 가중치 알고리즘들과 결합될 때 5개 실험집안에서 최적 단일가중치 보다 2% 이상 높은 성능을 보였다. 이는 서로 다른 특성을 지니는 용어가중치 알고리즘들이 장단점을 보완하여 검색성능을 향상시킨 수 있다는 것을 의미한다. 그러나 용어가중치 결합의 효율성은 컬렉션과 가중치 알고리즘의 특성에 의존적이었으며, 비록 각 용어가중치 결합의 성능이 높게 나타날지라도 최적의 성능을 보인 달일가중치와 비교하면 그 성능 차이가 미미하거나 낮아서 대부분의 용어가중치 결합이 실질적으로 효과적이지 못하였다.

  • PDF

R-Tree에서 지연 없는 검색을 위한 버전 기반의 동시성 제어 기법 (An Concurrency Control Technique Based on Version Techniques for Non Blocking Queries in R-Tree)

  • 김민성;김명근;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.101-104
    • /
    • 2004
  • R-Tree 색인은 기존의 공간 데이터베이스관리시스템에서 공간 데이터 검색을 위하여 많이 사용되고 있는 공간 색인기법이다. 하지만 R-Tree 색인에서 기존의 잠금(Lock) 기반 동시성 제어는 갱신연산의 잠금으로 인해 검색연산의 블록킹 오버헤드(blocking overhead)가 발생한다. 본 논문에서는 R-Tree 색인에서 검색연산의 블록킹 오버헤드의 주요 원인이 되는 노드 분할 연산과 MBR(Minimum Bounding Rectangle) 갱신연산에 대해 각각 노드단위와 노드엔트리 단위의 버전(Version)을 생성하고 유지하여 동시에 발생하는 검색연산이 갱신연산으로 인한 지연이 없이 자신에 알맞은 버전을 읽음으로써, 검색성능을 높일 수 있는 버전 기반의 동시성 제어 기법을 제안한다.

  • PDF

XML 기반 멀티미디어 검색시스템의 설계에 관한 연구 (A Study on Design of Multimedia Retrieval System based on XML)

  • 윤미희;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.103-106
    • /
    • 2003
  • 비디오는 멀티미디어 데이터의 가장 대표적인 형태로, 텍스트나, 이미지. 오디오와 객체의 움직임 같은 풍부한 정보를 담고 있다. 비정형의 멀티미디어 데이터를 다양하고 효율적으로 표현하기 위해서는 XML(extensible Markup Language)을 사용하여 저장하고 검색하는 멀티미디어 검색시스템이 필수적이다. 그러므로 멀티미디어 데이터에 대한 검색을 위해서는 멀티미디어 데이터의 내용을 구조적으로 설명하는 메타데이터가 필요하고 이 메타데이터를 XML을 사용하여 표현하며 저장하고 검색하기 위한 멀티미디어 검색시스템이 요구된다. 본 논문에서는 XML 메타데이터 모델링 기법과 이 모델링 기법을 기반으로 한 멀티미디어 검색시스템을 제안한다.

  • PDF

다계층 메타데이타 기반 이미지 내용검색 시스템 설계 (Design of Content-based Image Retrival System using Multilevel Metadata)

  • 신용수;홍성용;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.142-144
    • /
    • 2002
  • 대부분의 내용기반 이미지 검색 시스템은 이미지의 특징 벡터인 색상, 모양, 그리고 질감에 의해서 유사한 이미지를 검색하는 기법을 제공하고 있다. 최근 이러한 내용기반 이미지 검색 기술은 의료 영상 이미지와 같은 다양한 분야에 적용되고 있으며, 이에 따라서 의료 이미지를 분석하여 저장, 검색하기 위한 데이터베이스 시스템이 증가하고 있다. 그러나, 대량의 이미지로부터 원하는 이미지를 검색하기 위해서는 이미지의 메타데이타를 효율적으로 표현해야 하며, 의미성과 이미지의 특징 데이터를 통합적으로 저장 관리 할 수 있는 이미지 데이터베이스를 설계하고 구축해야만 한다. 본 논문에서는 기존의 내용기반 이미지 검색 기법을 살펴보고. 이미지를 내용기반으로 분류하고 저장할 수 있는 데이터베이스 시스템을 설계하여 효율적인 의미기반 검색을 지원말 수 있는 모델을 제시한다. 다계층 메타데이타 레이어 구조로 이미지에 대한 개념 지식 모델을 표현하고, 이미지내의 객체를 메타데이타로 표현하여 분류할 수 있는 모델을 제안한다. 또한, 이미지 내용검색을 지원하기 위한 시스템 구조를 설계하고, 메타데이타가 저장되기 위한 관계형 모델을 스타 스키마의 형태로 제시한다. 제안된 방법은 의미적인 이미지 내용 검색 방법의 지원에 활용될 수 있다.

  • PDF

동영상 내용기반 검색을 위한 고차원 벡터 데이터 색인 구조의 성능 분석 (Performance Analysis of High-Dimensional Index Structure for Vector Data in Content-Based Video Retrieval)

  • 이현조;장재우;박순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.211-214
    • /
    • 2007
  • 최근 멀티미디어 데이터, 특히 UCC를 중심으로 동영상 데이터가 급증하고 있다. 그러나 현재 대부분의 검색 시스템은 키워드 기반의 동영상 데이터 검색만을 지원하고 있으며, 따라서 사용자가 원하는 동영상 데이터를 효율적으로 검색하지 못하는 실정이다. 동영상 데이터에 대한 효율적인 검색을 지원하기 위해서는, 동영상의 내용(이미지, 색, 모양 등)을 고차원의 특징 벡터 데이터로 표현하여 유사한 동영상을 검색하는 내용-기반 검색이 요구된다. 본 논문에서는 내용-기반 검색을 위해 제안된 기존의 고차원 벡터 데이터 색인 구조를 실험을 통하여 성능을 비교하며, 이를 통해 동영상 내용-기반 검색에 가장 효율적인 색인 기법을 제시한다. 아울러 보다 효율적인 내용-기반 검색을 위한, 근사 k-NN 질의 탐색 기법의 유용성을 검증한다.

인덱싱 에이전트를 이용한 멀티미디어 데이터베이스 시스템 (A Multimedia Database System using Indexing Agent)

  • 이광형;이창수;이종희;오해석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.57-60
    • /
    • 2003
  • 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템은 설계한다.

  • PDF

웹 검색 결과 시각화 기법의 사용성 평가에 관한 연구 (A Usability Evaluation on the Visualization Techniques of Web Retrieval Results)

  • 김성희;김문정
    • 한국문헌정보학회지
    • /
    • 제41권3호
    • /
    • pp.181-199
    • /
    • 2007
  • 본 연구는 웹 정보로부터 이용자가 원하는 정보를 효율적으로 검색, 도출하기 위한 방안으로 시각화된 기법을 제시하였다. 이용자를 기반으로 한 시각화 기법의 사용성을 평가하기 위해 먼저, 시각화에 대한 개념 및 사용성 평가 요소를 분석한 후 현재 상용화 되고 있는 웹 검색 시각화 시스템인 searchCrystal과 KartOO를 선정해서 사용성을 평가하였다. 그 결과 시각화의특징을 살려서 디자인 된 시스템은 이용자로 하여금 더 친숙하고 효율적인 인터페이스 환경을 제공하는 것으로 나타났다.

비트맵 필터를 이용한 효율적인 유사 문자열 검색 기법 (Efficient Approximate String Searches using Bitmap Filter)

  • 권인택;김종익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1298-1301
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 역 리스트 병합 과정에서 역 리스트의 탐색 비용을 줄이기 위해 비트맵 필터를 사용하는 기법을 제안한다. 비트맵 필터를 사용하여 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 역 리스트 병합 알고리즘의 성능을 30~40% 정도 개선함을 보인다.