• Title/Summary/Keyword: 가상적합문서

Search Result 11, Processing Time 0.022 seconds

Performance Improvement by a Virtual Documents Technique in Text Categorization (문서분류에서 가상문서기법을 이용한 성능 향상)

  • Lee, Kyung-Soon;An, Dong-Un
    • The KIPS Transactions:PartB
    • /
    • v.11B no.4
    • /
    • pp.501-508
    • /
    • 2004
  • This paper proposes a virtual relevant document technique in the teaming phase for text categorization. The method uses a simple transformation of relevant documents, i.e. making virtual documents by combining document pairs in the training set. The virtual document produced by this method has the enriched term vector space, with greater weights for the terms that co-occur in two relevant documents. The experimental results showed a significant improvement over the baseline, which proves the usefulness of the proposed method: 71% improvement on TREC-11 filtering test collection and 11% improvement on Routers-21578 test set for the topics with less than 100 relevant documents in the micro average F1. The result analysis indicates that the addition of virtual relevant documents contributes to the steady improvement of the performance.

Design and Implementation of a Virtual Document Authoring Tool for a Digital Library (디지털 도서관에서 이용하는 가상문서 저작도구의 설계 및 구현)

  • Lee, Sang-Bong;Cho, Eun-Il;Lee, Yong-Bae;Myaeng, Sung-Hyon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.171-174
    • /
    • 2000
  • 가상문서(Virtual Document)란 특정 저장장소에 저장되어 실재로 존재하는 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. 가상문서의 특징은 여러가지 형태로 작성되고 표현된 문서들을 하나의 문서개념으로 통합해 제시할 수 있으며, 가상문서 단일로 데이터를 관리함으로써 다양한 멀티미디어 요소들이 그에 적합한 애플리케이션의 도움을 받아 하나의 프레임 안에서 동시에 존재하고 상호 연계하여 동작할 수 있게 된다. 가상문서를 사용하는 이점은 첫째, 저작자가 가상문서안에 들어갈 여러 미디어 컨텐트들을 복사하여 가상문서에 직접 삽입하지 않고 위치정보만을 기술하므로 방대한 양의 멀티미디어 문서에 대한 저장공간을 줄일 수 있으며 둘째, 링크의 사용으로 인해 크기가 작아진 가상문서는 네트워크를 통한 문서 전송시 효율적으로 전송할 수 있다. 본 논문에서는 디지털도서관 시스템 MIRAGE III(4)에서 이용하는 가상문서를 쉽게 만들어 주는 가상문서 저작도구의 설계 및 구현과정에 대하여 기술하였다.

  • PDF

The Efficient Schema Conversion to map the XML Document into the RDB (XML의 RDB로의 맵핑을 위한 효율적인 스키마 변환)

  • 김태희;김선경
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.429-433
    • /
    • 2003
  • 웹상의 문서는 데이터 중심의 표준 언어인 XML 문서로 표현된다. XML 데이터를 범용적이고 우수한 성능의 관계형 데이터베이스와 연동하여 이용하기 위해서는 두 구조 사이의 맵핑 과정이 필요하다. 계층적 구조의 XML 문서와 데이터베이스의 평면적인 구조의 차이를 고려한 구조 맵핑을 위해서 검색 시스템에 적합한 가상분할 방식으로 엘리먼트를 분석하여 관계 스키마를 정의한 후 XML 문서를 저장한다. 이를 위해 스키마는 DTD 에 독립적인 형태로 변환하고, 엘리먼트의 추가와 삭제, 검색의 효율성을 위해 노드간의 위치 정보와 함께 독립적인 ID를 부여하여 구조적 검색을 수행할 수 있게 하였다.

  • PDF

SGML/XML 기반 문서 정보 시스템

  • 주종철;김현기;박영찬
    • Proceedings of the CALSEC Conference
    • /
    • 1998.10a
    • /
    • pp.69-78
    • /
    • 1998
  • SGML/XML 기반 문서 정보 시스템의 문서 포맷은 인간이 비교적 쉽게 이해할 수 있으며 기존의 문서 정보 시스템에서는 접근 불가한 레벨까지 인간이 접근할 수 있는 통로를 제공한다. 또한, 문서처리 관점에서 보면 기존의 각 CAL/EC관련 응용 프로그램에서 생성된 데이터는 문서 또는 파일 단위의 접근으로 업무레벨에 도움을 주는 것이 제한적인 것에 반해 SGML/XML 기반 문서정보 시스템은 DTD(Document Type Definition)에서 설계된 엘리먼트, 속성, 엔티티 등의 단위까지 접근할 수 있는 Mechanism으로 기존의 문서 정보 시스템과 차별화 되는 지식 매체로서 지식기반 시스템의 하부 프레임워크를 제공한다. SGML/XML 기반 문서 정보 시스템의 요소로서 SGML/XML 문서 정보 검색 시스템은 표현된 계층적 논리정보를 이용하여 다양한 문서 접근점을 제공할 수 있으며, 사용자 요구에 적합한 문서의 재사용 및 동적인 문서제시를 가능하게 한다. 또한, SGML/XML 문서 정보 관리 시스템은 공동 저작을 위한 세부 논리적 단위별 check-in/check-out, 액세스 제어, 버전닝 기능 등을 제공하여 기업 내 자산 관리를 위한 새로운 파라다임을 제공한다. 본 논문에서는 구현 사례와 더불어 SGML/XML 기술이 CALS/EC 추진에 주는 영향과 향후 바람직한 CALS/EC 또는 가상기업(Virtual Enterprise)구축을 위한 기술적 방향에 대해 논한다.

  • PDF

KISTI 분산통합검색시스템

  • Kim, Seon-Ho
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.5
    • /
    • pp.8-19
    • /
    • 2001
  • 분산통합검색 시스템은 지리적으로 흩어져 있는 개별 데이터베이스의 정보 내용과 형식, 그것이 다른 데이터베이스의 어떠한 정보와 연계되어야 하는지를 스스로 판단하여, 사용자의 정보 요청이있을 때마다, 적합한 정보를 세계 각처의 전자 도서관에서수집하고 유형별로묶어서 체계화된 가상 문서를 실시간으로 제공하는 역할을 수행한다.

  • PDF

CALS 표준에 의한 외주 및 부품관리 시스템

  • 이영수;권창완;임춘성;신기태;이창호
    • Proceedings of the CALSEC Conference
    • /
    • 1998.10a
    • /
    • pp.225-233
    • /
    • 1998
  • 현재의 전자조립 산업계의 일반적인 VAN 기반 외주 관리 시스템은 대부분의 경우 협력 관계에 있는 특정 기업에 설치된 자체 VAN 시스템을 통해서만 운용되고 있어 최근의 국제화 가상기업 환경에 적합하지 않다. 이에 대한 대안으로써 부품관리 기능과 외주관리 기능을 통합적으로 운영할 수 있는 CITIS시스템의 도입을 적극 생각해볼 수 있다. 본 연구에서는 제품의 라이프 사이클을 통해 발생되는 기업간 외주관련 비즈니스 및 부품기술보를 CITIS의 개념을 바탕으로 CALS 표준을 이용하여 인터넷상에서 온라인으로 정보를 교환하고 공유하는 계약자정보통합시스템의 프로토타입을 개발하였다. 이를 위하여 인터넷 EDI에 의한 기업간 비즈니스 전자문서교환 기술개발과 SGML을 통한 기술정보교환 기술개발, 기존의 기업내 시스템과의 원할한 인터페이스 지원방안연구, 인터넷을 이용한 고객지원 시스템의 네 가지 방향으로 연구가 수행되었다. 본 연구를 통하여 개방된 인터넷을 이용한 정보공유를 가능하게 함으로써 기업의 외주업무의 효율성 향상과 가상기업 환경에 대비한 인프라 구축을 기대할 수 있다.

  • PDF

Index Mechanism for advancement learning efficiency of E-Iearning (이러닝시스템의 학습 효율성 향상을 위한 색인 메커니즘)

  • Kim, Eun-Jung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.5
    • /
    • pp.906-912
    • /
    • 2009
  • Offline-based study is proceeding effectively for directly teaching and communication between a learner and a professor. In general virtual education system have been solve this problem using provides search of particular learning domain and auto feedback of relative learning domain after examination. But the learner needs personally select the right document among search result set and interconnected precedence study domain. Therefore, the unskilled learner is difficult of learning progress over against offline-based study. This paper suggests a index mechanism of varied views for helps to learner understand the flow and direction of learning and correlation between units.

A Study on the Necessity and Applicability of Interactive Electronic Technical Manual(IETM) for Construction Projects (건설분야 전자매뉴얼의 필요성 및 특성분석을 통한 실무적용성 연구)

  • Kang, Leen-Seok;Jung, Won-Myung;Kwak, Joong-Min
    • Korean Journal of Construction Engineering and Management
    • /
    • v.6 no.1 s.23
    • /
    • pp.99-108
    • /
    • 2005
  • Interactive electronic technical manual(IETM) for construction projects means an electronic tool that regulations and specifications related to construction method or maintenance process ale described by electronic book type. It has a meaning of integrated information system that includes virtual reality(VR), 3D animation and image contents for representing real construction information so that user can easily understand the construction situation and maintenance process. The basic information and technical manuals of construction facilities are being written as paper documents in our construction industry. As the result, the information management in the maintenance phase of construction projects is inefficient, and maintenance cost is being increased. This study attempts to improve the lack of understanding about construction IETM through the analysis of necessity and unique function of construction IETM comparing with the IETMS in other industry, Finally, this study shows a scenario of construction IErM for mitigating natural disaster of construction facilities to verify applicability of IETM.

The research of dialogic style electronical commerce solution (대화형 전자상거래에 대한 연구)

  • 김정우;김진섭;박동원;주기호;김도완
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.12a
    • /
    • pp.29-32
    • /
    • 2000
  • 전자상거래는 전자 인프라(컴퓨터 및 통신망)를 통해 기업과 소비자간(Business-to- Consumer;B-to-C), 기업과 정부간(Business-to-Administration; B-to-A), 소비자와 정부간(Consumer-to-Administration; C-to-A)을 포함한 어떤 형태의 업무적 거래나 정보교환을 하는 것을 의미한다고 볼 수 있다. 이 인터넷을 이용한 전자상거래는 기업이 고객에 대한 정보를 실시간으로 수집할 수 있고, 고객취향을 즉시 알아 대 고객 서비스 개선과 인터넷쇼핑몰에서 고객별 차별화 되고 특화 된 서비스를 제공함으로써 판매를 촉진할 수 있으며, 주문 및 물품배송 관련 문서를 웹을 통해 전자적으로 처리한다. 그러나 기존의 가상 쇼핑몰은 이러한 전자 쇼핑몰의 장점을 활용하지 못하고 있다. 즉 소비자를 고려하지 않은 인터페이스 구조, 또한 허술한 관리 시스템으로 인한 소비자의 불신 등이 기존 시스템의 문제이다. 현재 나와 있는 전자 상거래 구축 솔루션에 대한 문제점을 해소하고 좀더 이식하기 쉽고 소비자가 사용하기 편한 시제품을 본 연구에서 개발하였다. ICQ 와 같은 쪽지 개념을 사용한 본 연구의 결과물은 보안이 갖추어진 지불시스템과 연동 가능하며, 대형 인터넷상점 구축 솔루션 및, 소호(SOHO)나 중소 규모의 인터넷 쇼핑몰에 적합한 통합형 전자상거래 솔루션에 대한 연구한다.

  • PDF

Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis (FCA 기반 계층적 구조를 이용한 문서 통합 기법)

  • Kim, Tae-Hwan;Jeon, Ho-Cheol;Choi, Joong-Min
    • Journal of Intelligence and Information Systems
    • /
    • v.17 no.3
    • /
    • pp.63-77
    • /
    • 2011
  • The World Wide Web is a very large distributed digital information space. From its origins in 1991, the web has grown to encompass diverse information resources as personal home pasges, online digital libraries and virtual museums. Some estimates suggest that the web currently includes over 500 billion pages in the deep web. The ability to search and retrieve information from the web efficiently and effectively is an enabling technology for realizing its full potential. With powerful workstations and parallel processing technology, efficiency is not a bottleneck. In fact, some existing search tools sift through gigabyte.syze precompiled web indexes in a fraction of a second. But retrieval effectiveness is a different matter. Current search tools retrieve too many documents, of which only a small fraction are relevant to the user query. Furthermore, the most relevant documents do not nessarily appear at the top of the query output order. Also, current search tools can not retrieve the documents related with retrieved document from gigantic amount of documents. The most important problem for lots of current searching systems is to increase the quality of search. It means to provide related documents or decrease the number of unrelated documents as low as possible in the results of search. For this problem, CiteSeer proposed the ACI (Autonomous Citation Indexing) of the articles on the World Wide Web. A "citation index" indexes the links between articles that researchers make when they cite other articles. Citation indexes are very useful for a number of purposes, including literature search and analysis of the academic literature. For details of this work, references contained in academic articles are used to give credit to previous work in the literature and provide a link between the "citing" and "cited" articles. A citation index indexes the citations that an article makes, linking the articleswith the cited works. Citation indexes were originally designed mainly for information retrieval. The citation links allow navigating the literature in unique ways. Papers can be located independent of language, and words in thetitle, keywords or document. A citation index allows navigation backward in time (the list of cited articles) and forwardin time (which subsequent articles cite the current article?) But CiteSeer can not indexes the links between articles that researchers doesn't make. Because it indexes the links between articles that only researchers make when they cite other articles. Also, CiteSeer is not easy to scalability. Because CiteSeer can not indexes the links between articles that researchers doesn't make. All these problems make us orient for designing more effective search system. This paper shows a method that extracts subject and predicate per each sentence in documents. A document will be changed into the tabular form that extracted predicate checked value of possible subject and object. We make a hierarchical graph of a document using the table and then integrate graphs of documents. The graph of entire documents calculates the area of document as compared with integrated documents. We mark relation among the documents as compared with the area of documents. Also it proposes a method for structural integration of documents that retrieves documents from the graph. It makes that the user can find information easier. We compared the performance of the proposed approaches with lucene search engine using the formulas for ranking. As a result, the F.measure is about 60% and it is better as about 15%.