• 제목/요약/키워드: 정보검색기법

검색결과 2,278건 처리시간 0.03초

내용 기반 이미지 검색을 위한 복합 질의문 계획 생성 기법 (Generating Combined Query Plan for Content-Based Image Retrieval)

  • 박미화;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.562-571
    • /
    • 2000
  • 이미지 데이터는 텍스트 데이터와는 달리 다양한 색상과 모양, 질감과 같은 비정형적인 특징을 가진다. 따라서 이미지 데이터베이스는 텍스트 기반의 전통 데이터베이스와는 다른 모델링 방법과 질의, 검색 방법을 사용한. 특히, 내용 기반 이미지 검색에서의 검색 속도와 정확도를 향상시키기 위해서는 새로운 복합 질의문 계획 생성 기법이 필요하다. 본 논문에서는 이를 위해 먼저, 단일 조건을 갖는 시각 질의에 대한 처리 기법들을 토대로 여러 조건을 갖는 복합 질의를 처리하기 위한 복합 질의문 계획 생성기법인 SSCC(Similarity Search for Conjunction Combination Query) 알고리즘을 제안한다. SSCC는 이미지 데이터베이스 검색 시스템에서 복합 질의를 처리하기 위한 질의 최적화 과정에서 질의 수행 시간과 투플 I/O를 최소화하는 질의문 계획을 생성하기 위해 사용된다. SSCC 알고리즘은 복합질의를 단일 질의들로 준해하고 퍼지 집합 이론을 도입하여 단일 질의의 결과들을 통합한다. 논문에서 연구된 내용 기반 복합 질의문 계획 생성 기법은 특정 이미지 영역에 국한되지 않으며 다양한 종류의 시각 질의를 수행하기 위한 효율적인 질의문 계획 생성 기법으로 사용될 수 있다.

  • PDF

Pre-Order List를 이용한 XML문서의 효과적인 색인방법 (An Efficient Indexing Method For XML Documents Using Pre-Order List)

  • 김영;박상호;박선;이주홍;홍준식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.154-156
    • /
    • 2004
  • 최근 XML은 인터넷상의 데이터의 표현 및 교환의 표준으로 인식되면서 XML에 대한 많은 연구가 이루어지고 있다 특히 XML문서의 정보량이 방대해짐에 따라 빠른 검색의 필요로 많은 인덱싱 기법들이 제안되었다. 최근의 연구 중, 패스를 기반으로 하는 인덱싱 기법들은 중간노드와 최하위노드의 검색, 조상-후손관계의 조인연산 등에서 성능이 떨어지는 경향이 있다. 이를 보완하기 위해 연구된 Numbering-Scheme 기반의 인덱싱 기법들은 대부분의 검색에서 우수한 성능을 보인다. 그러나 하위 노드가 늘어나는 경우엔 검색 오버헤드가 커질 수 있으며, 대량의 XML 문서나 구조가 다른 XML 문서가 추가되면 인덱스와 데이터 값의 재조정이 필요하게 된다. 이러한 문제를 해결하기 위하여 본 논문은 Numbering-Scheme을 기반으로 각 노드별 노드범위(Node-Range)와 Pre-Order List물 추가하여 검색성능을 높이고, 데이터의 삽입, 삭제에 효과적인 인덱싱 기법을 제안한다.

  • PDF

역 색인을 이용한 경로 질의 기반 대용량 XML문서 검색 (Retrieval of Large scaled XML Documents based on Path Query using Inverted indexes)

  • 문경원;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2005
  • 1998년 XML 문서 표준이 제안된 이래, 다양한 응용 분야에서 XML은 데이터를 표현하는 표준으로 자리잡아 가고 있다. 특히, 인터넷상의 많은 데이터들이 XML 형태로 작성되고 변환됨에 따라 다량의 XML 데이터가 생성되고 있다. 따라서 현재 XML 문서의 저장 및 질의 처리 기법의 연구가 활발하게 진행되고 있다. 하지만 기존의 연구는 대용량 XML 문서를 다루기에는 미흡한 점이 있다. 본 논문에서는 인터넷상의 널리 퍼져있는 방대하고, 다양한 구조의 XML문서들을 대상으로 패스 기반 질의를 빠르게 처리할 수 있는 검색 기법을 제안한다. 제안된 기법은 인터넷상에 산재해 있는 여러 XML 문서를 관계형 데이터베이스에 효율적으로 저장하고 질의를 통해 인터넷상 XML 문서의 엘리먼트를 빠르게 검색하는데 주안점을 둔다. 먼저, XML 문서를 관계형 데이터베이스에 효율적으로 저장하는 계층형 XML 저장 기법을 제안하고, 정보 검색 시스템에서 많이 사용하는 역 인덱스를 사용하여 저장된 XML 문서에 대한 검색 성능을 향상시킨다.

  • PDF

시드를 이용한 도메인 관련 복합어 추출 기법 (Extracting Domain Related Multi-word Terms using Seeds)

  • 조성원;최종필;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.166-168
    • /
    • 2004
  • 복합어 추출 기법은 최근 활발한 연구가 진행되고 있는 온톨로지 구축과 정보 검색에 중요한 기법으로 연구되어 왔다. 초기의 연구는 주로 언어학적인 필터 기법이나 통계적 기법을 사용하였지만, 최근 문맥정보와 의미 사전 등을 이용하여 용어를 추출하는 방법으로 발전해 오고 있다. 또한 정보검색 분야와 온톨로지 분야에서도 모든 용어를 추출하는 방법보다 문서 집합의 도메인에 적합하다고 판단되는 용어들을 추출하는 방법이 그 성능을 향상시킬 수 있다. 본 논문에서는 통계학적 방법을 이용하여 도메인에 적합한 시드 용어의 추출을 하고, 그 시드 용어를 이용해 가중치를 정제하는 방법과 시드 용어로부터 관련된 용어를 추출해 나가는 방법을 적용하여 문서 집합의 도메인에 맞는 용어들을 추출하고자 한다.

  • PDF

집합 기반 POI 검색을 이용한 문장 유사도 측정 기법 (Sentence Similarity Measurement Method Using a Set-based POI Data Search)

  • 고은별;이종우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.711-716
    • /
    • 2014
  • 최근 논문 표절 논란과 지능형 텍스트 검색서비스에 대한 관심이 증가하면서 문장 유사도 측정의 필요성이 증가하고 있다. n-gram, 편집거리, LSA 등 기존의 다양한 방향으로 선행 연구가 있었지만 각 기법마다 장단점이 존재한다. 본 논문에서는 집합 기반 POI 검색 기법을 이용한 새로운 방향의 문장 유사도 측정 기법을 제안한다. 집합 기반 POI 검색 기법은 하드매칭에 비해 단어의 도치, 누락, 삽입, 변경에 현저한 성능 향상을 보인다. 이 기법을 이용하면 보다 정확하고 빠른 문장 유사도 측정이 가능하다. 제안하는 기법은 기존 집합 기반 POI 검색 기법의 데이터 로딩 알고리즘과 텍스트 검색 알고리즘을 변형하고 어절 연산 알고리즘을 추가하여 두 문장의 유사도를 백분율로 표현한다. 실험을 통해 본 논문에서 제시하는 기법이 정확도와 속도에서 n-gram과 기존 집합 기반 POI 검색 기법에 비해 우수함을 확인하였다.

개념 계층과 사용자 정보를 이용한 지능적 이미지 검색 시스템 설계 (Design of Intelligent Image Retrieval System utilizing Conceptual Hierarchy and User Information)

  • 홍성용;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.290-292
    • /
    • 1999
  • 본 논문은 개념 계층과 마이닝 기법을 적용하여 이미지 데이터베이스에서 이미지 데이터에 대한 검색 기법을 지능화하고, 시스템을 효율적으로 관리하는데 있다. 개념 계층을 이용하여 이미지 정보를 지능적인 형태로 저장, 검색하고, 효율적인 웹서비스를 하기 위해 사용자의 정보와 사용자가 이용한 질의 정보 그리고 이미지 정보를 통합하여 사용자에게 좀 더 많은 부가 정보를 제공한다. 또한, 사용자의 의도를 추측하여 사용자의 의도를 반영한 지적인 이미지 시스템을 개발하기 위한 방법을 제시한다.

  • PDF

이미지 데이터베이스에서의 응답 시간 향상을 위한 그리드 기반 매칭 기법 (A Grid-based Matching Algorithm for Improving Response Time in Image Database)

  • 남윤영;박진규;황인준;위영철;김동윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.283-286
    • /
    • 2006
  • 내용기반의 이미지 검색방법은 객체의 내부의 정보를 이용한 검색방법으로 색상, 모양, 질감과 같은 특징을 사용한다. 이러한 특징 중에 모양은 검색에 사용될 수 있는 점을 추출하여 유사도 계산에 사용한다. 유사도 계산은 점의 개수가 증가할수록 검색의 응답시간도 함께 증가한다는 문제점이 있다. 본 논문은 응답시간 향상을 위하여 특징점들에 대한 그리드 기반의 유사도 매칭 기법을 제안한다. 그리드 기반의 유사도 매칭 기법은 점들을 그리드로 나누어 검색의 범위를 좁힘으로써 매칭하는 횟수를 줄이는 방법이다. 특징점으로 사용된 점들은 이미지의 선으로부터 MPP(Minimum Perimeter Polygons) 알고리즘으로 추출하였으며, 특징 점들간의 거리값의 합을 유사도로 계산하였다. 실험에서는 400여개의 식물 잎 이미지로부터 점들을 추출하여 검색 시간을 비교하였다.

  • PDF

아이코닉 이미지 데이터베이스에서 순위부여를 지원하는 새로운 공간매치 표현기법 (A New Spatial-match Respresentation Scheme supporting Ranking in Iconic Image Database)

  • 김연중;장재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권6호
    • /
    • pp.752-762
    • /
    • 1999
  • 멀티미디어 정보 검색 응용에 있어서 관련성 있는 멀티미디어 문서를 검색하기 위해 이미지에 대한 내용-본위 검색이 필수적이다. 이를위하여 본 논문에서는 이미지를 몇 개의 인식 가능한 심볼 즉, 아이콘으로 표현하고, 주어진 문서를 대표하는 값으로 받아들여 색인을 한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면 질의에 있는 이미지를 아이콘으로 변환한후, 접근 깁버을 통하여 원하는 이미지를 검색한다. 이를 위하여 본 논문에서는 방향관계 연산자와 위치관계 연산자를 합성하여 새로운 공간 매치 표현 기법을 제안한다. 제안하는 방법은 이미지 내의 아이콘들간의 관계성을 보다 정확하게 표현하며 순위 부여가 가능한 새로운 공간관계 표현기법이다. 아울러 본 연구에서 제안한 방법을 기존의 9DLT 방법 및 SMR 방법과 검색효율면에서 성능 비교를 수행한다. 마지막으로 성능 실험을 통하여 제안한방버이 기존의 9DLT 및 SMR 방법에 비해 정확률 측면에서 약 0.1 재현율 측면에서 약 0.2만큼 우수함을 보인다.

순위부여를 지원하는 공간배치 표현 기법의 성능평가 (Performance Evaluation of Spatial-match Representation Scheme Supporting Ranking)

  • 김연중;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.253-255
    • /
    • 1998
  • 멀티미디어 정보 검색 응용에 있어서 관련성 있는 멀티미디어 문서를 검색하기 위해 이미지에 대한 내용-본위 검색이 필수적이다. 이를 위하여 이미지를 몇 개의 인식 가능한 심볼 즉, 아이콘으로 표현하고, 주어진 문서를 대표하는 값으로 받아들여 색인을 한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면, 질의에 있는 이미지를 아이콘으로 변환한 후, 접근 기법을 통하여 원하는 이미지를 검색한다. 이를 위해 많은 아이코닉 표현 기법이 제안되었다. 본 논문에서는 SRR과 기존의 9DLT방법 및 SMR 방법과 검색효율 면에서 성능 비교를 수행한다. 마지막으로 성능 실험을 통하여 제안한 방법이 기존의 9DLT 및 SMR 방법에 비해 정확률 측면에서 약 0.1 재현율 측면에서 약 0.2 만큼 우수함을 보인다.

인공생명 기법을 이용한 정보검색 에이전트의 원형 (Prototype of Information Retrieval Agents Using Artificial Life Technologies)

  • 김학균;조성배
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.391-394
    • /
    • 1997
  • 인터넷의 웹은 여러 곳에 분산되어 있을 뿐만 아니라 끊임없이 동적으로 변화하는 특성이 있기 때문에, 보통의 인덱스를 통한 정보검색 방법에는 한계가 있다. 이러한 웹의 특성을 적절히 살리면서 원하는 정보를 신속하게 검색하기 위하여, 본 논문에서는 여러 개의 에이전트가 인공생명 기법에 의해 조직되어 정보를 검색하는 온라인 에이전트를 소개한다. 이것은 각각의 에이전트에 의하여 검색된 문서가 얼마나 질의에 가까운가에 따라서 해당 에이전트를 만이 살아 남아 문서를 가져오도록 함으로써, 불필요한 문서를 검색하지 않게 되어 단위 시간에 원하는 문서를 많이 얻어올 수 있는 장점이 있다. 실제 웹 환경에서 실험한 결과 종래의 폭우선 검색이나 랜덤검색에 비하여 좋은 결과를 내는 것을 볼 수 있었다.

  • PDF