• 제목/요약/키워드: Structure Retrieval

검색결과 431건 처리시간 0.025초

XML을 이용한 지능형 이미지 검색 시스템 (An Intelligent Image Retrieval System using XML)

  • 홍성용;나연묵
    • 한국멀티미디어학회논문지
    • /
    • 제7권1호
    • /
    • pp.132-144
    • /
    • 2004
  • 인터넷 기술의 급속한 발전으로 인하여 인터넷 사용자의 수와 인터넷상의 멀티미디어 정보의 양이 계속 증가하고 있다. 최근의 e-비즈니스나 쇼핑몰 사이트에서는 많은 양의 이미지 정보를 취급하고 있으며, 이로 인하여 이미지에 대한 효율적인 내용 검색의 필요성이 대두되고 있다. 본 논문에서는 XML기술을 이용하여 웹 상의 이미지를 지능적으로 검색할 수 있는 시스템을 제안한다. 상품 카탈로그와 같은 복잡하고 다중 객체를 보유하고 있는 이미지에 대하여 객체 기반 내용 검색을 수행할 수 있도록 지역 특징, 전역 특징, 의미 등의 메타 데이타를 표현하는 다계층 메타데이타 구조를 제안한다. 또한, 이미지에 대한 의미 기반 검색 및 내용 기반 검색을 수행 할 수 있도록 이러한 메타데이타를 저장하기 위한 XML-Schema를 설계하고 각 메타데이타를 XML 문서 형태로 표현하는 방법을 보인다. 또한, XSLT를 이용하여 이미지에 대한 검색 결과를 웹 브라우저나 모바일 브라우저와 같은 다양한 사용자 환경에 보여줄 수 있도록 자동 변환하는 방법을 제시한다. 본 논문에서 제시한 방법은 이미지에 대한 메타데이타를 XML 형태로 표현하므로 XML을 지원하는 상용 시 스템을 이용하여 용이하게 시스템을 구현할 수 있으며, 이미지 메타데이타의 시스템간 공유도, 검색질의에 대한 정확성, 사용자의 검색 만족도를 증가시킬 수 있다.

  • PDF

Grove를 이용한 구조적 SGML문서의 저장 및 검색 (A Storage and Retrieval System for Structured SGML Documents using Grove)

  • 김학균;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권5호
    • /
    • pp.501-509
    • /
    • 2002
  • 플랫폼에 관계없이 한번 작성된 문서의 정보를 이기종 시스템간 공유하고 다양한 문서 형식을 지원하기 위해 SGML(1508879)이 사용되고 있다. SGML 문서는 내용뿐만 아니라 구조정보를 가지고 있다. SGML 문서가 널리 보급됨에 따라서 구조적 정보를 이용한 데이타베이스의 구축 및 검색 시스템에 대한 필요성이 고조되고 있다. 그러나, 기존의 색인어를 이용한 전문 검색 엔진으로는 문서의 구조정보를 활용할 수 없다. 본 논문에서는 DSSSL 및 HyTime의 문서 모델인 Grove를 변형한 데이타 모델을 이용하여 문서 형식에 독립적이면서, 문서 형식과 내용을 분리하여 저장하는 SGML 문서 저장 시스템을 개발하였다. 구조정보를 손실없이 저장할 수 있도록 객체 지향형 데이타베이스 시스템인 오브젝트 스토어(Object Store)를 이용하였다. 또한 엘리먼트에 대해 관계형 DBMS와 유사한 인덱스 구조를 생성하여 검색 성능을 향상시켰고, 내용기반 검색과 구조기반 검색을 효율적으로 결합한 사용자 인터페이스를 구축하였다.

Xpath에 의한 인터넷 문서의 레이아웃 추출 방법에 관한 연구 (A Study on Layout Extraction from Internet Documents Through Xpath)

  • 한광록;선복근
    • 한국콘텐츠학회논문지
    • /
    • 제5권4호
    • /
    • pp.237-244
    • /
    • 2005
  • 현재 뉴스 데이터 등 대부분의 인터넷 문서는 일정한 템플릿을 기반으로 작성되고 있으며 템플릿은 메인 데이터 이외에 인덱스, 광고, 헤더데이터 등 정보검색에 도움이 되지 않는 형태로 구성되어 있다. 이는 인터넷 문서를 정보검색의 데이터로서 사용하려고 할 때 적합한 형태가 아니다. 그러므로 다양한 정보검색 분야에서 인터넷 문서를 처리하기 위해선 광고, 페이지 인덱스 등의 부가정보를 분별해야 한다. 따라서 본 논문에서는 웹페이지의 레이아웃에 영향을 미치는 블럭 태그의 특징과 구조를 파악하고 웹페이지간의 거리를 계산하여, 웹페이지의 레이아웃을 검출하는 방법을 제안한다. 실험결과 1000개의 문서 중 640개를 분류했으며, 평균 64%의 recall 수치를 얻을 수 있었다. 이 방법을 데이터 추출, 문서요약 등의 정보검색 분야의 전처리 과정에 적용할 경우 문서의 자동화 처리 시간을 감소시키고 처리의 효율성을 높일 수 있을 것으로 기대된다.

  • PDF

XML 문서에 포함된 구조 정보의 표현과 검색 (Representing and retrieving the Structured Information of XML Documents)

  • 조윤기;조정길;이병렬;구연설
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.361-366
    • /
    • 2001
  • 웹의 발전으로 인터넷 상의 정보 양이 증가하면서 XML을 이용하여 이들 정보를 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다. 이 논문에서는 XML 문서의 효율적인 관리와 구조 검색을 위해 구조 정보 표현과 검색 메카니즘을 제안한다. 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제 엘리먼트에 대한 다양한 구조 검색을 효율적으로 지원하지 못한다. 이 논문에서는 XML 문서의 구조 정보를 표현하기 위해 엘리먼트에 대한 부모 노드와 현재 노드의 계층 정보, 형제 노드 및 동일한 형제 노드의 순서 정보를 갖는 고정된 크기의 LETID를 제안한다. 또한, 구조 정보를 검색하기 위해 내용 색인, 구조 색인 그리고 애트리뷰트 색인 모델과 구조 정보 검색 알고리즘을 제안한다. 제안한 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현 할 수 있을 뿐 아니라 간단한 연산으로 특정 엘리먼트에 직접적인 접근과 다양한 질의 처리가 가능하다.

  • PDF

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

재사용 시스템 개발을 위한 객체지향 검식 프레임워크 (Object-Oriented Retrieval Framework to Construct the Reuse-Supporting Systems)

  • 김정아;문충렬;김승태
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.711-720
    • /
    • 1995
  • 본 논문에서는 라이브러리의 하부 표현 구조에 관계 없이 재사용 라이브러리로 부 터 소프트웨어 부품을 일관성 있게 저장하고 검색할 수 있도록 지원해주는 검책 프레 임워크를 객체지향 기법을 도입하게 제안하였다. 제안한 검색 프레임워크는 일관된 사 용자 인터페이스를 가능하도록 하기 위하여 시각적 영역에서 미리 정의한 간단한 시각 적 오퍼레이션을 통해 라이브러리에 저장한 부품에 대한 정보 객체를 검색할 수 있도 록 하였다. 이는 제안한 4I모델에 의해 가능하다. 또한 새로운 검색 메카니즘이나 분 류기법을 쉽게 추가할 수 있다. 본 논문에서는 객체지향 프레임워크 개발을 위한 4I 모델을 제안하고 이를 구성하는 각각의 구성 요소를 객체로 모델링하고 구현하였다.

  • PDF

소프트웨어 재사용을 위한 정보검색시스템 구축 (The Information Retrieval System for Software Reuse)

  • 김영길
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권1호
    • /
    • pp.1-8
    • /
    • 2016
  • 본 논문에서는 전반적으로 소프트웨어 재사용과정에서 지적되고 있는 문제점을 재사용 단계별로 정리하고, 지적되어온 문제점 중 라이브러리 구축과정에서 효과적인 부품의 인덱싱과 기능적으로 관련된 부품들끼리의 분류로 검색의 성능 증진을 꾀할 수 있는 방법을 제안한다. 객체지향 소프트웨어 라이브러리를 구성하는 부품은 클래스가 가지고 이있는 객체지향 모델의 특성과 클래스가 지니고 있는 책임으로 기능을 모두 고려하여 객체지향 라이브러리를 구축하고 객체지향 지향 라이브러리는 상속구조를 바탕으로 라이브러리내의 계층구조를 형성한다. 그러나 이러한 계층구조는 구문적인 정보를 바탕으로 이루어지는 것으로 클래스 부품의 기능성과 일치하지 않을 수도 있다. 이를 해결하기 위하여 본 논문에서는 클래스 계층구조와 같은 지기기반 접근법과 클래스 부품의 기능성에 기반을 둔 소프트웨어 부품의 인덱싱과 분류에 필요한 정보검색 방법을 혼용한 라이브러리 과닐 기법을 제안한다. 특히 본 논문에서는 최근에 많은 분야에 걸쳐 연구가 진행 중인 객체지향 방법론을 바탕으로 개발된 소프트웨어 라이브러리의 기능 향상을 위한 구조와 구축 방법을 제안하고 지원 시스템을 개발한다.

방사선 의료영상 검색 시스템에 관한 연구 (A Study on Radiological Image Retrieval System)

  • 박병래;신용원
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제28권1호
    • /
    • pp.19-24
    • /
    • 2005
  • 방사선사를 위한 교육 및 영상 정보에 대한 정확한 판단에 유용한 주석-기반 방사선 의료영상 검색 시스템을 설계 및 구현하고, 방사선 의료영상에 대한 단순 속성정보, 부가적인 정보인 텍스트 설명정보로부터 추출한 중요 키워드에 대한 효율적인 검색을 위해 $B^+$-트리와 역화일 기법을 이용한 색인기법을 제안하고자 한다. 윈도우즈 XP에서 Delphi를 이용하여 구현하였으며, 방사선사는 방사선 의료영상에 대한 속성 정보, 부가적인 설명정보, 이미지 정보를 저장하도록 하고, 구축된 영상 데이터베이스로부터 속성정보와 텍스트 키워드 정보를 이용하여 검색 가능하도록 하였다. 임상방사선사가 단순속성정보 및 텍스트 설명정보를 찾아냄으로써 임상현장에서의 체계적인 교육뿐 만 아니라 지식을 구조화함으로써 교육시간의 단축과 방사선 의료영상에 대해 정확한 판단을 내릴 수 있다. 구현되어진 방사선 의료영상검색 시스템은 차후에 일반촬영, 특수조영영상을 포함한 통합화상시스템으로의 확장이 요구되며, 아울러 웹을 통한 서비스를 구축함으로써 의사결정시스템으로 발전 할 수 있는 기반기술로 기대된다.

  • PDF

SGML 한글문서의 논리적 구조에 근거한 색인기법에 관한 연구 (A Study of Automatic Indexing Technique based on Logical Structure of SGML Hangul Document)

  • 유석종
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.85-101
    • /
    • 1995
  • 기존 색인 시스템은 전자문서에 대하여 전문색인 (full-text indexing) 방법만을 지원하며, 문서의 논리적 구조를 검색 방법으로 적절하게 활용하지 못하고 있다. 대부분의 전자문서는 특정 시스템에 의존적인 형식으로 되어 있으며, 문서의 물리적 형태만을 나타내고 논리적 구조에 대한 정보는 포함하고 있지 않다. 이에 반해 1986년에 ISO에서 문서교환에 대한 표준방식으로 제정한 SGML (Standard Generalized Markup Language)은 문서의 논리적 구조에 대한 정보를 포함하고 있다. 본 논문에서는 기존의 전문색인 시스템의 단점을 보완하고 표준문서형식을 사용하기 위해 SGML 문서에서의 색인 시스템을 설계 구현하고자 한다. 기존 색인 시스템에서는 문서 전체에 대하여 색인이 이루어지는데 비하여 본 시스템에서는 SGML 문서의 구성요소인 엘리먼트에 기반하여 색인 영역을 지정할 수 있게 하엿다. 따라서 문서의 논리적 구조를 반영한 다양한 검색기법에 응용될 수 있다. 또한 본 시스템에서는 SGML 한글문서에 대하여 자동색인이 가능하다.

  • PDF

문서의 동적 삽입 삭제를 위한 STEER 역파일 구조 (STEER Inverted File Structure for Dynamic Document Insertion/Deletion)

  • 김남일;박영찬;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF