• 제목/요약/키워드: structured retrieval system

검색결과 58건 처리시간 0.025초

XQuery 기반 XML 검색시스템의 구조적인 질의 검색 성능 평가 (Performance Evaluation of an XQuery-based XML Retrieval System for the Structured Queries)

  • 정영미;김희섭;신동헌;양중식
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.295-304
    • /
    • 2005
  • XQuery는 W3C에서 가장 최근에 발표한 XML 질의 언어 표준 초안으로 다양한 형태의 XML 데이터소스에 폭넓게 적용할 수 있도록 설계되어 있다. 또한 XQuery는 데이터 내용뿐만 아니라 구조 검색에 대해 경로 질의를 이용하여 쉽고 간단하게 처리할 수 있는 특징이 있다. 본 연구애서는 XQuery를 지원하는 XML 검색시스템을 설계 및 구현하고, 개발된 시스템(Litch Search Server)을 INEX 2004를 통해 구조적인 질의에 대한 성능을 평가하여 그 개략적인 결과에 대하여 기술하고 있다.

  • PDF

NVST DATA ARCHIVING SYSTEM BASED ON FASTBIT NOSQL DATABASE

  • Liu, Ying-Bo;Wang, Feng;Ji, Kai-Fan;Deng, Hui;Dai, Wei;Liang, Bo
    • 천문학회지
    • /
    • 제47권3호
    • /
    • pp.115-122
    • /
    • 2014
  • The New Vacuum Solar Telescope (NVST) is a 1-meter vacuum solar telescope that aims to observe the fine structures of active regions on the Sun. The main tasks of the NVST are high resolution imaging and spectral observations, including the measurements of the solar magnetic field. The NVST has been collecting more than 20 million FITS files since it began routine observations in 2012 and produces maximum observational records of 120 thousand files in a day. Given the large amount of files, the effective archiving and retrieval of files becomes a critical and urgent problem. In this study, we implement a new data archiving system for the NVST based on the Fastbit Not Only Structured Query Language (NoSQL) database. Comparing to the relational database (i.e., MySQL; My Structured Query Language), the Fastbit database manifests distinctive advantages on indexing and querying performance. In a large scale database of 40 million records, the multi-field combined query response time of Fastbit database is about 15 times faster and fully meets the requirements of the NVST. Our slestudy brings a new idea for massive astronomical data archiving and would contribute to the design of data management systems for other astronomical telescopes.

XML Repository System Using DBMS and IRS

  • Kang, Hyung-Il;Yoo, Jae-Soo;Lee, Byoung-Yup
    • International Journal of Contents
    • /
    • 제3권3호
    • /
    • pp.6-14
    • /
    • 2007
  • In this paper, we design and implement a XML Repository System(XRS) that exploits the advantages of DBMSs and IRSs. Our scheme uses BRS to support full text indexing and content-based queries efficiently, and ORACLE to store XML documents, multimedia data, DTD and structure information. We design databases to manage XML documents including audio, video, images as well as text. We employ the non-composition model when storing XML documents into ORACLE. We represent structured information as ETID(Element Type Id), SORD(Sibling ORDer) and SSORD(Same Sibling ORDer). ETID is a unique value assigned to each element of DTD. SORD and SSORD represent an order information between sibling nodes and an order information among the sibling nodes with the same element respectively. In order to show superiority of our XRS, we perform various experiments in terms of the document loading time, document extracting time and contents retrieval time. It is shown through experiments that our XRS outperforms the existing XML document management systems. We also show that it supports various types of queries through performance experiments.

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

Lifecycle and Requirements for Digital Collection Management of Thai Theses and Dissertations

  • Jareonruen, Yuttana;Tuamsuk, Kulthida
    • Journal of Information Science Theory and Practice
    • /
    • 제7권3호
    • /
    • pp.52-64
    • /
    • 2019
  • This research was aimed at studying the situation, problems, and requirements for digital collection lifecycle management of Thai theses and dissertations. The mixed research method used was composed of: (1) Study of the problem and situation in which the qualitative method was applied. The research site covered 10 higher education institutions where the Thailand Digital Collection (TDC) project is operated. The informants were key administrative officers of the TDC project of each institution. In-depth and structured interviews were conducted on an individual basis to obtain the most accurate answers. (2) Study of requirements based on the quantitative research method to survey the requirements for the digital collection management system for Thai theses and dissertations from 84 purposively-selected TDC project officers and 527 end users selected by accidental sampling, totaling 611 samples. Research findings are as follow: (1) The study of the situation and problems of digital collection lifecycle management shows that Thai higher institutions systematically manage their digital collection. The management lifecycle is consistent with the Guidance documents for lifecycle management of ETDs, which included seven steps: program planning, creation, submission, and ingestion, access and retrieval of digital objects, archiving and preservation, evaluation and assessment, interoperation (creation of institutional collaboration), and development of link data. (2) The study of requirements for digital collection management of Thai theses and dissertations shows five system requirements: acquisition and gathering, digitization, metadata standards, management of rights, and storage and retrieval, all of which are at M (mandatory) and D (desirable) levels.

퍼스컴을 이용한 농업기후자료 검색 및 분석시스템 (An Agroclimatic Data Retrieval and Analysis System for Microcomputer Users(CLIDAS))

  • 윤진일;김영찬
    • 한국작물학회지
    • /
    • 제38권3호
    • /
    • pp.253-263
    • /
    • 1993
  • 남한내 72개 기상관서에서 관측, 보관중인 일기상자료는 농업적 활용가치가 높은 신뢰성 있는 기후자료이지만 농업분야의 연구 및 기술지도 종사자들이 쉽게 접근하기 어려워 지금까지 그 활용도가 낮았다. 이러한 문제점을 해결하기 위해 현재 그 사용인 보편화된 개인용 컴퓨터를 이용하여 이들 기후자료의 검색과 분석작업을 용이하게 수행할 수 있는 기후자료 관리체계를 개발하고자 본 연구를 수행하였다. 기후자료 베이스로는 1960년부터 1991년까지 축적된 기상청 소속 72개 기상대 및 기상관측소의 매일 평균, 최고, 최저기온, 상대 습도, 평균풍속, 최대풍속, 증발량, 강수량, 일조 시수, 운량 및 풍향자료를 기본으로 하였으며 이들로부터 주간 및 월간 기후자료베이스를 생성하였다. 자료관리체계는 한글대화식으로 운영되며 사용자가 진정한 기간동안의 일간, 주간 및 월간 자료를 조건없이 표출하는 표준검색기능과, 사용자가 지정한 기간내 자료 가운데 사용자가 지정한 기상조건에 부합되는 자료만을 검색할 수 있는 선택 검색기능을 갖고 있다. 또한 일간자료로부터 주요 농업기후지수인 생장도일과 증발산위를 계산하는 기능도 갖고 있다. 모든 검색자료는 모니터 화면, 프린터, 혹은 아스키 데이터 화일로 출력시킬 수 있어 검색자료의 심층분석에 직접 사용할 수 있다. 관리체계의 사용환경은 브이지에이 그래픽 카드가 장착된 아이비엠 개인용 컴퓨터 호환기 종으로서 모든 지점의 자료를 검색하기 위해서는 50메가바이트 이상의 하드디스크 사용영역이 확보되어야 한다. 프린터 출력은 엡슨계열의 도트매트릭스형이면 가능하다. 본 기후자료 관리 체계는 기능별 프로그램 모듈이 독립적으로 작성되어 있으므로 향후 기능의 수정, 보완, 추가작업이 지속적으로 이루어 질 수 있으며 자료베이스 구조 역시 범용 자료관리언어를 사용하여 생성하였으므로 새로운 자료도 용이하게 추가시킬 수 있다.

  • PDF

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

세포 신호전달 경로 데이타베이스를 위한 데이타 모델링 (Data Modeling for Cell-Signaling Pathway Database)

  • 박지숙;백은옥;이공주;이상혁;이승록;양갑석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권6호
    • /
    • pp.573-584
    • /
    • 2003
  • 최근 유전체학과 단백질체학 분야에서 생성되는 방대한 분량의 데이타로부터 생물학적 의미를 추출해내기 위한 생물정보학적인 도구들에 대한 필요성이 크게 대두되고 있다. 본 논문에서는 세포 신호전달 경로에 관한 정보를 효율적으로 표현, 저장함은 물론 저장된 데이타로부터 생물학적 의미를 추출할 수 있도록 하기 위한 다양한 요구 조건들을 생물학자의 관점에서 분석하고, 이들 요구조건을 체계적으로 반영하여 설계한 ROSPath 데이타베이스 시스템을 제안한다. ROSPath 데이타 모델에서는 향후의 확장성을 고려하여 불완전한 지식의 표현이 가능하도록 하며 인터넷상에서 기존의 다른 생화학 데이타베이스를 공유할 수 있는 연결성을 제공한다. 또한, 객체지향 모델을 이용하여 계층적인 구성을 제공함으로써 효율적인 검색을 지원한다. ROSPath 데이타 모델은 두 가지 주요 데이타 요소인 ‘바이오 개체’와 ‘상호작용’으로 정의된다. 바이오 개체는 세포 신호전달 경로에 관여하는 단백질과 단백질 상태 등과 같은 개개의 생화학적인 개체를 의미하고, 상호작용은 단백질 상태 전이나 화학 반응, 단백질-단백질 상호작용 등과 같은 바이오 개체들 간의 다양한 관계 및 신호전달과정을 설명한다. 제안된 ROSPath 데이타 모델을 이용하여 구성되는 복잡한 정보 네트워크는 다양한 생화학 프로세스들을 기술하고 분석하는 데에 활용할 수 있다.

긴 메뉴항목 리스트의 시각화 기법 비교에 관한 실험적 연구 (An Experimental Comparison on Visualization Techniques of Long Menu-Lists)

  • 서은경;성혜은
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.71-87
    • /
    • 2007
  • 인터넷 환경과 디지털자원의 활용환경이 빠르게 변화됨에 따라 탐색과 브라우징을 제공해주는 정보시스템의 인터페이스 또한 새롭게 변해가고 있다. 특히 최근에 검색 인터페이스에서 많이 사용되고 있는 긴 리스트의 메뉴항목을 이용자가 보다 쉽게 브라우징하고 선택할 수 있도록 하기 위하여 시각화기법을 이용하여 디스플레이하고 있다. 본 연구는 이용자와 데이터 특성에 맞는 긴 메뉴항목 시각화 기법을 제안하기 위하여 긴 리스트의 메뉴항목을 시각화하기 위하여 많이 사용되고 있는 기법 즉 트리구조 메뉴, 목차방식 메뉴, 롤-오버방식 메뉴, 클릭방식 메뉴, 어안렌즈 방식 메뉴를 비교하였다. 그 결과 계층구조 메뉴 중에서는 전문가는 목차방식 메뉴를, 초보자는 트리구조 메뉴를 선호하고, 또 순차적 구조 메뉴 중에서는 전문가와 초보자 모두 롤오버방식 메뉴를 선호하고 있음을 알 수 있었다.

WebCam을 이용한 멀티미디어 보안시스템의 설계와 구현 (Design and Implementation of Multimedia Monitoring System Using WebCam Structure)

  • 송은성;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.161-166
    • /
    • 2003
  • 본 논문에서는 웹카메라(WebCam)을 이용한 멀티미디어 보안시스템을 설계하고 이를 구현하는 새로운 방법을 제안한다. 최근 여러 분야에서 WebCam을 응용하여 다양하고 편리한 기능의 시스템을 구현하고, 이를 웹의 편리한 기능에 접목시켜 구조적이고 향상된 성능을 실현하고 있다. 멀티미디어 동영상은 고도의 자료압축 방식과 통신회선 속도의 향상 및 인터넷을 통한 다양한 서비스가 가능해지면서 기존의 보안시스템에 대한 성능향상을 목적으로 크게 변모하고 있다. 본 논문에서 제안하는 보안시스템의 설계방식은 개방된 인터넷을 이용한 통신망 환경에서 보안시스템이 달성하고자 하는 목적을 위하여 웹의 활용성을 충분히 보여줄 수 있을 뿐 아니라 다양한 웹 서비스를 활용함으로써 기존의 것보다 뛰어난 응용성을 보장하는 형태이다. 실시간 멀티미디어 동영상 및 음성의 전송을 통한 현실감 있는 모니터링은 물론 다양한 방식으로 변환되는 정보 서비스와 멀티미디어 자료저장 및 추출을 통한 비실시간 감시 및 보안을 모두 실현할 수 있는 구조와 실현 시스템을 제시하는 것이다.

  • PDF