• 제목/요약/키워드: 구조검색

검색결과 2,312건 처리시간 0.032초

네비게이션 정보추출에 의한 XML 본문검색시스템 (XML Fulltext Retrieval System by Extracting Navigation Information)

  • 강남규;이응봉;이석형
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.91-110
    • /
    • 2002
  • 최근, 키워드 기반 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가 연구개발보고서를 대상으로 하였으며, XML 연구보고서의 DTD. 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

구조 기반 검색을 위한 색인 구조에 대한 분석 (Analysis of Indexing Schemes for Structure-Based Retrieval)

  • 김영자;김현주;배종민
    • 한국멀티미디어학회논문지
    • /
    • 제7권5호
    • /
    • pp.601-616
    • /
    • 2004
  • 구조적 문서들에 대한 검색시스템은 구조 기반 검색 질의를 지원하여 다양한 수준의 검색 기능을 제공한다. 완전한 구조 기반 질의를 처리하기 위해서는 구조적 문서가 가지는 엘리먼트 간의 구조적 포함관계나 순서에 관한 정보를 유지되어야 한다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계와 엘리먼트의 발생순서에 관련된 질의 등 여러 유형의 순수 구조 질의를 처리할 수 있는 네 가지 색인구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 전체 문서 인스턴스 트리 개념에 바탕을 두고 있다.

  • PDF

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이에 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이의 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여 할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구 (A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML)

  • 양옥렬;이용주
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1025-1042
    • /
    • 2002
  • 본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

개인화된 방송 컨텐츠의 효율적 검색을 위한 메타데이터 검색 구조 설계 (Design of Metadata Retrieval Structure for Efficient Browsing of Personalized Broadcasting Contents)

  • 이혜규;박성한
    • 전자공학회논문지CI
    • /
    • 제46권2호
    • /
    • pp.100-105
    • /
    • 2009
  • 본 논문에서는 개인화된 방송 컨텐츠의 보기 시스템에서 사용자가 보다 빠르게 검색할 수 있도록 메타데이터 저장 구조를 계층화하는 방법을 제안한다. 이를 위하여 본 논문에서는 원하는 컨텐츠를 찾는데 걸리는 시간을 단축시킬 수 있도록 MPEG-7 MDS 구조의 분류 기술구조와 기술구조 사이에 세부장르 목록이 들어있는 하위 장르 테이블을 추가한다. 그리고 기술구조에서 기존의 메타데이터들이 분류 없이 트리 형태의 계층구조로 저장되던 부분을 사건과 객체로 구분하여 저장하도록 한다. 이러한 방법은 기존 연구에 비해 장르의 단계별 검색이 가능해짐으로 사용자가 원하는 계층적 검색이 가능해진다. 또한, 메타데이터를 사건과 객체를 구분하여 저장함으로써 탐색의 복잡성을 최소화한다. 실험 결과에서 제안하는 검색 구조의 시스템이 기존 시스템의 구조보다 향상된 검색 시간을 보여준다.

문서의 동적 삽입 삭제를 위한 STEER 역파일 구조 (STEER Inverted File Structure for Dynamic Document Insertion/Deletion)

  • 김남일;박영찬;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF

내용 기반 검색을 지원하는 멀티미디어 XML 데이터베이스 시스템 (Multimedia XML Database System supporting Content-based Retrieval)

  • 김연희;신판섭;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2001
  • 현재 웹 서비스 기반검색 시스템의 일반화에 힘입어 단순한 덱스트 정보뿐 만 아니라 이미지 데이터와 같은 멀티미디어 정보가 보편화되고 그 교류의 양이 크게 증가하였다. 따라서 덱스트 정보에 대한 검색과 함께 멀티미디어 정보에 대한 효과적 검색을 지원하는 시스템 개발이 중요시되고 있다. 그러나 기존에 개발된 시스템들은 멀티미디어 데이터를 검색 결과의 부가적 정보로서 사용하는 것이 일반적이며 그 자체를 질의 검색의 주요 대상으로 처리하지 못하였다. 따라서 본 논문에서는 웹 상에서 대용량 이미지 데이터베이스를 구축하고 이를 기반으로 효과적 검색을 지원하는 멀티미디어 검색 시스템을 설계한다. 제안 시스템은 크게 두 가지 검색 구조를 제공하는데, 먼저 기존의 덱스트 기반 검색을 위하여 이미지의 의미 정보를 XML로 표현하여 이를 DTD 독립적인 스키마에 따라 관계형 데이터베이스에 저장, 관리하여 체계적이고 구조적인 서비스를 지원한다. 또한 이미지에 대한 내용 기반 검색을 위하여 이미지 데이터베이스를 구축하고 이미지 데이터로부터 색상 히스토그램 특성을 자동으로 추출하여 구축한 인덱스를 유지, 관리하며, 이를 통한 내용 기반 검색 구조와 사용자 질의 인터페이스를 설계한다.

  • PDF

자기 조직적 링 구조를 이용한 P2P 검색기법 (A Peer-to-Peer Search Scheme using Self-Organizing Ring)

  • 손재의;한세영;박성용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.349-351
    • /
    • 2006
  • 본 논문에서는 비구조적 피어-투-피어 시스템에서의 낮은 검색 성공률과 긴 검색 시간을 개선하기 위하여, 성능이 우수한 우수 피어들로 자기 조직적인 링 구조를 구성하고 광고 및 검색에 이용하는 검색 기법을 제안하였다. 우수 피어 링 구조는 동적인 환경에서 시스템의 상황에 따라 적응적으로 크기가 변하고, 에이전트를 이용하여 지속적으로 우수한 피어들이 링 구조에 참여하게 함으로써 검색 성공률을 높이고, 빠른 검색 시간을 유지할 수 있게 하였다.

  • PDF

분산된 생물정보 데이터베이스의 통합검색 시스템연구 (Integrated Information Retrieval System from Distributed Biological Database)

  • 윤홍원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.311-314
    • /
    • 2000
  • 분자 생물학의 발전염기서열, 단백질 서열, 지놈 서열 등의 서열데이터베이스와 단백질 3차구조를 제공하는 구조 데이터베이스등이 구축되어서 웹을 통해 많은 정보를 제공하고 있다. 전세계적으로 분산되어 있는 다양한 생물정보 데이터베이스의 효율적인 검색을 위해서 통합 검색 시스템의 개발이 필요하다. 이 논문에서는 전세계의 생물정보 데이터베이스의 개발 현황을 보이고 분산되어 있는 생물정보데이터베이스로부터 통합검색을 위한 생물정보 통합검색시스템(GenPlus)를 제안하였다. 제안한 GenPlus 에서는 염기 서열, 단백질서열, 그리고 키워드를 이용한 서열정보, 구조정보,완전한 지놈 정보, 그리고 문헌정보의 통합 검색을 제공한다.

  • PDF