• 제목/요약/키워드: XML 키워드 검색

검색결과 53건 처리시간 0.026초

효과적인 소프트웨어 컴포넌트 분류 및 검색에 관한 연구 (A Study for the Effective Classification and Retrieval of Software Component)

  • 조병호
    • 인터넷정보학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-10
    • /
    • 2006
  • 컴포넌트 재사용을 통한 소프트웨어의 개발은 소프트웨어 생산비용을 절감할 수 있는 유용한 방법이다. 그러나 컴포넌트 재사용에 있어 키워드나 카테고리 분류에 의한 검색 방법은 컴포넌트 개체의 복잡성으로 인하여 정확한 컴포넌트 검색이 어렵다. 따라서 기존의 다른 연구 방법을 조사/분석하여 XML 명세를 이용한 컴포넌트 분류 및 검색에 효과적인 방법 및 이를 기반으로 한 컴포넌트 통합관리 시스템 구조를 제시하고자 한다. 컴포넌트 검색에 있어 많은 일치하지 않은 컴포넌트 메타 표현인 DTD 항목이 존재한다. 이를 보완하기 위하여 정확도 및 간결도 측정을 사용한 검색 방법은 우선적으로 고려해야할 컴포넌트를 찾는데 효과적인 하나의 방법이다. 이 방법은 기존의 키워드 검색으로 어려운 유사하게 일치하는 항목의 컴포넌트를 찾음으로써 보다 나은 우선순위를 갖는 적합한 컴포넌트 검색이 가능하게 한다.

  • PDF

XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법 (A Search Method for Components Based-on XML Component Specification)

  • 박서영;신영길;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권2호
    • /
    • pp.180-192
    • /
    • 2000
  • 최근 들어 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있다. 컴포넌트는 인터페이스 부분만을 이용하여 개발되는 소프트웨어에 바로 바인딩시켜 재사용될 수 있는 독립적인 바이너리 코드이다. 많은 컴포넌트 사용자들이 인터넷 상에서 적합한 컴포넌트를 검색하고 사용할 수 있도록, 컴포넌트 명세서는 웹 문서 형태를 사용하는 것이 바람직하다. 기존의 HTML 웹 문서 기반의 검색 엔진을 통하여 컴포넌트를 검색할 때 정확한 의미 검색이 불가능하다는 문제점이 있다. 본 논문에서는 정확한 의미 검색을 수행할 수 있도록 컴포넌트 명세서를 HTML 문서 대신 XML 문서로 사용할 것을 제안한다. 또한, XML 컴포넌트 명세서를 통하여 사용자가 원하는 컴포넌트를 정확하게 검색할 수 있는 XML 문맥 기반 검색(context-based search)을 제안한다. 문맥 기반 검색은 컴포넌트의 특성을 나타내는 문맥(context)과 컴포넌트 특성의 실제 값인 용어(term)를 사용하여 사용자가 원하는 컴포넌트의 특성을 정확하게 질의하고 검색할 수 있는 방법이다. 이 검색 방법은 용어-문맥-컴포넌트 명세서 순으로 된 역화일 인덱싱 (Inverted File Indexing) 방법을 사용한다. 이와 함께 사용자의 편의를 위하여, 기존의 소프트웨어 재사용 라이브러리에서 사용되던 검색 방법인 키워드 검색, 퍼싯 검색, 브라우징 검색 방법 등을 지원한다. 이들 다양한 검색 방법들은 인터페이스 레이어, 질의 확장 레이어, XML 검색 엔진 레이어 등 3-레이어 검색엔진 구조를 통한 효율적인 인덱스 스킴에 의해 지원된다. 본 논문에서는 컴포넌트 사용자들이 원하는 컴포넌트를 정확하게 검색할 수 있도록 하기 위하여 컴포넌트 명세서를 대한 XML DTD(Document Type Definition)를 정의하고, HTML 기반 검색 방법과 XML 기반 검색 방법에 대한 컴포넌트 검색 성능을 비교한다.

  • PDF

메타데이타를 삽입한 디지털 콘텐츠 생성 도구 개발 (Development of Digital Contents Authoring Tool using Metadata)

  • 천수덕;주상욱;이상준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.50-54
    • /
    • 2007
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전되고 있으며, 이에 따른 데이타베이스의 기술이 공간데이타, XML, 비디오, 음성과 같은 다양한 멀티미디어 데이터 분야에 적용되고 있다. 비디오 데이타는 순차적인 특성을 가지며, 시간과 공간정보가 결합된 3차원 데이타로서 처리시간이 높은 작업이기 때문에 검색이나 브라우징이 대단히 비효율적이다. 본 논문에서는 비주얼리듬을 이용하여 비디오 데이타에서 대표 프레임(Key Frame)을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하여 검색이나 브라우징을 할 수 있는 동영상 내용편집 도구(Authoring Tool for Video Contents)를 제안한다. 비주얼리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT(inverse Discrete Cosine Transform)과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집효과를 효과적으로 구분할 수 있다. 그리고 XML 데이타에는 태그 및 정보와 함께 대표 프레임의 정보까지 저장되므로 유사 화면 검색이나 내용 기반 검색을 제공할 수 있다.

  • PDF

SCORM 기반의 XML 학습 컨텐츠 검색 시스템 (XML-based Retrieval System for SCORM-based Virtual Learning Contents)

  • 최병욱;송미숙;조정원
    • 컴퓨터교육학회논문지
    • /
    • 제6권1호
    • /
    • pp.9-17
    • /
    • 2003
  • 차세대 인터넷 표준 언어인 XML(eXtensible Markup Language)은 데이터(data)와 표현(presentation) 그리고 구조(structure)가 구분되기 때문에 어느 환경에서나 재사용성이나 재구성이 용이한 장점을 보이고 있다. 본 논문에서는 XML 문서를 가상교육 시스템(Virtual Education System)의 멀티미디어 컨텐츠로 범위를 제한하여 사용자 위주의 효율적인 검색 시스템을 구현한다. 본 시스템에서는 가상교육 표준안으로 제안되고 있는 SCORM(Sharable Content Object Reference Model)에서 정의한 SCO(Sharable Content Object)단위의 메타데이터를 기반으로 컨테츠를 설계하고 각 문서를 키워드, 엘리먼트, 애트리뷰트 단위로 색인한다. 또한 사용자 인터페이스에서 엘리먼트 검색화면을 구조적으로 구성해줌으로써 사용자가 DTD(Document Type Definition)에 대한 사전지식 없이도 검색이 가능하며, XML-QL로 재구성된 XML 문서의 형태와 XSL(eXtensible markup language Stylesheet Language)을 이용한 HTML 형태의 두 가지 결과화면을 제시함으로써 사용자 선택의 폭을 넓혀준다.

  • PDF

KEM 2.0을 이용한 MPEG-7 기반의 교육용 영상정보 검색시스템 개발 (Developing an Education Image Retrieval System based on MPEG-7 using KEM 2.0)

  • 곽길신;주경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.155-164
    • /
    • 2005
  • 최근 교육정보의 교류 수요의 급속한 증가에 따라 교육정보 자료에 대한 베타데이터의 표준이 필요하게 되었다. 이에 따라 국내에서는 교육정보 자료를 통합적으로 공유 재사용하기 위하여 KEM(Korea Educational Metadata) 2.0을 한국교육학술정보원에서 개발하였다. 또한 해외에서는 최근 급증하고 있는 멀티미디어 데이터의 메타데이터에 대한 적절한 표현을 위하여 MPEG-7 표준이 제정되었다. 본 논문에서는 다양한 형태의 교육정보 자료 중에서 교육용 이미지에 대한 검색시스템을 개발하였다. 본 검색시스템은 한국교육학술정보원에서 개발된 KEM 2.0을 수용하기 위하여 교육용 이미지의 메타데이터 표현을 KEM 2.0 기반에서 MPEG-7으로 확장한 XML 스키마를 사용하였다. 또한 의미기반의 키워드 검색과 내용기반 이미지 검색의 장단점을 서로 보완하기 위해 키워드 검색과 내용기반의 이미지 검색을 통합한 검색 기능을 제공한다. 또한 표준화된 베타데이터를 사용함에 따라 메타데이터의 재사용성을 높이고 이기종 시스템간의 상호 호환성을 높일 것이다.

  • PDF

VoiceXML기반 EPG 검색 시스템 (A VoiceXML-based EPG Retrieval System)

  • 김한수;황인준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.351-363
    • /
    • 2004
  • 최근 들어 디지털 방송의 본격적인 서비스 개시와 더불어 수많은 채널을 통한 TV 프로그램 방송이 가능하게 되었다. 이로 인해 시청자들은 더 이상 신문이나 TV 가이드와 같은 인쇄매체를 통한 방송 스케줄의 검색이 사실상 어렵게 되었다. 이 같은 문제점을 해결하기 위해 디지털 방송 환경에서는 시청자들에게 전자 프로그램 가이드(EPG: Electronic Program Guide)를 제공한다. 현재 대부분의 EPG 서비스는 디지털 TV 화면이나 각 방송사 웹사이트, 그리고 모바일 단말기에서 EPG 정보를 화면상에서 시각적으로 제공하는 측면에만 초점을 두고 있다. 하지만 이와 같은 EPG 서비스 방식은 검색을 위해 키워드를 직접 입력하기 어려운 운전자나 시각 장애인과 같은 사용자 그룹이 EPG 서비스를 이용할 수 없는 한계점을 지닌다. 따라서 본 논문에서는 모바일 폰을 이용하여 운전자나 시각 장애인과 같은 사용자 그룹도 편리하게 EPG 서비스를 검색할 수 있는 음성 EPG 검색 시스템을 제안하고 프로토타입 시스템의 구현 및 실험을 통해 효율성을 입증하였다.

웹 서비스 검색을 위한 시맨틱 매칭 엔진 (Semantic Matching Engine for Searching Web Services)

  • 양승훈;이대욱;권준호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.267-272
    • /
    • 2006
  • 인터넷망의 지속적인 발달과 함께 웹 애플리케이션 개발 방법으로 XML 기반의 웹 서비스가 부각되면서 많은 웹 서비스들이 개발되었고, 점차 더 많은 웹 서비스들이 개발될 것으로 예상된다. 이처럼 급격하게 늘어나는 웹 서비스들 중에서 사용자가 원하는 웹 서비스 찾는 것이 중요한 이슈로 부각되고 있다. 그러나 현재의 웹 서비스 검색 표준인 UDDI 레지스트리는 키워드 기반이기 때문에 검색 성능의 한계점을 갖고 있다. 최근에 이러한 한계를 극복하고자 하는 많은 연구가 진행되고 있지만 아직은 많이 부족한 상황이다. 따라서 본 논문에서는 비록 키워드가 일치하지 않더라도 사용자가 원하는 웹 서비스를 찾을 수 있도록 웹 서비스 표준인 UDDI 레지스트리에 시맨틱 매칭 엔진(semantic matching engine)이라는 추가적인 시맨틱 레이어를 추가하여 재현율(recall)과 정확률(precision)을 모두 향상 시킬 수 있는 시스템을 제안한다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

MCML 기반 모션캡처 데이터 저장 및 퍼지 기반 모션 검색 기법 (Storing and Retrieving Motion Capture Data based on Motion Capture Markup Language and Fuzzy Search)

  • 이성주;정현숙
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-275
    • /
    • 2007
  • 모션 캡처 기술은 현실감 있는 캐릭터 동작을 얻기 위해 많이 사용되고 있지만, 모션 캡처 데이터의 상이한 포맷들로 인하여 효율적인 모션 데이터의 저장과 검색이 어려운 문제점을 가지고 있다. 본 논문에서는 상이한 형식의 모션 캡처 데이터를 통합하고 효과적으로 저장 및 검객하기 위한 프레임워크를 제안한다. 상이한 모션 캡처 데이터 포맷들을 통합하기 위한 XML 기반의 표준 포맷을 MCML(Motion Capture Markup Language)로 정의하고 있으며 서로 다른 포맷의 모션 캡처 데이터 파일을 하나의 단일화된 MCML 파일로 변환하여 관계형 데이터베이스 또는 XML 데이베이스에 저장함으로써 동일 데이터의 중복 저장 및 공유 문제를 해결한다. 모션캡처 데이터의 검색은 퍼지 문자열 검색(Fuzzy string searching) 기법에 의한 유사어 검색으로 특정 키워드를 포함하는 MCML 문서들을 찾거나 특정 위치의 시작 프레임에서 일련의 프레임들을 선택적으로 추출할 수 있는 모션클립(motion clips) 검색이 가능하도록 하였다.

문서 분석 기반 주요 요소 추출 시스템 (Document Analysis based Main Requisite Extraction System)

  • 이종원;여일연;정회경
    • 한국정보통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.401-406
    • /
    • 2019
  • 본 논문에서는 XML 형태의 논문이나 보고서로 작성된 문서를 분석하는 시스템을 제안한다. 논문이나 보고서에서 지정한 키워드를 추출하고 이를 사용자에게 보여준 뒤 사용자가 해당 문서 내에서 검색을 원하는 키워드를 입력하면 각 키워드들을 포함하고 있는 문단들을 추출한다. 시스템은 사용자가 입력한 키워드들의 빈도수를 확인하고 가중치를 계산한 뒤 가중치가 가장 낮은 키워드만을 포함한 문단들을 제거한다. 또한, 정제된 문단들을 10개의 영역으로 나눈 뒤 영역별 문단들의 중요도를 계산하고 각 영역들의 중요도를 비교하여 가장 높은 중요도를 갖는 주요 영역을 사용자에게 알려준다. 이러한 특징들로 인해 제안하는 시스템을 활용할 경우 기존의 문서 분석 시스템을 활용하여 논문이나 보고서를 분석하는 것보다 압축률이 높은 형태로 주요 문단들을 제공받을 수 있다. 이로 인해 문서를 이해하는데 필요한 시간을 줄일 수 있을 것으로 사료된다.