• 제목/요약/키워드: 가상적합문서

검색결과 11건 처리시간 0.03초

문서분류에서 가상문서기법을 이용한 성능 향상 (Performance Improvement by a Virtual Documents Technique in Text Categorization)

  • 이경순;안동언
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.501-508
    • /
    • 2004
  • 본 논문에서는 문서분류의 학습단계에 가상적합문서기법을 적용하여 성능을 향상시킬 수 있는 방법을 제안한다. 어떤 범주에 대해 적합하다고 판단된 두 개의 적합문서를 결합해서 생성된 문서 또한 적합문서가 된다는 관찰을 통해서, 문서분류기가 학습할 수 있는 새로운 정보를 추가함으로써 분류기의 학습을 돕는다. 제안하는 방법은 학습문서집합에 있는 적합문서들의 쌍을 조합해서 단순히 변환함으로써 가상의 문서를 생성한다. 이 방법에 의해서 생성된 가상 문서는 두 개의 적합문서에 같이 발생하는 어휘들에 대해서는 높은 가중치를 갖고, 문서 내의 어휘 공간이 확장되는 특성을 갖는다. 대량의 문서를 포함하는 TREC-11 필터링 태스크 참여에서 제안한 방법은 제공되는 학습문서를 이용한 기본 성능에 비해 71%의 성능 향상을 보였다. 또한 문서분류 연구에서 일반적으로 비교를 위해 이용하는 실험집합인 Routers-21578에서 학습집합의 적합문서 개수가 100개 이하인 범주에 대해서 기본 학습문서를 이용한 분류기에 비해 11%의 성능향상을 보였다. 가상문서를 계속 추가해 나가면서 성능의 변화를 분석한 결과, 가상문서의 추가는 문서분류기의 학습능력을 도와 성능이 꾸준히 향상되고 있음을 보였다.

디지털 도서관에서 이용하는 가상문서 저작도구의 설계 및 구현 (Design and Implementation of a Virtual Document Authoring Tool for a Digital Library)

  • 이상봉;조은일;이용배;맹성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.171-174
    • /
    • 2000
  • 가상문서(Virtual Document)란 특정 저장장소에 저장되어 실재로 존재하는 물리적 문서(Physical Document)들을 대상으로 사용자에게 필요한 일부분 또는 전체를 동적으로 연결하여 통합한 문서를 의미한다. 가상문서의 특징은 여러가지 형태로 작성되고 표현된 문서들을 하나의 문서개념으로 통합해 제시할 수 있으며, 가상문서 단일로 데이터를 관리함으로써 다양한 멀티미디어 요소들이 그에 적합한 애플리케이션의 도움을 받아 하나의 프레임 안에서 동시에 존재하고 상호 연계하여 동작할 수 있게 된다. 가상문서를 사용하는 이점은 첫째, 저작자가 가상문서안에 들어갈 여러 미디어 컨텐트들을 복사하여 가상문서에 직접 삽입하지 않고 위치정보만을 기술하므로 방대한 양의 멀티미디어 문서에 대한 저장공간을 줄일 수 있으며 둘째, 링크의 사용으로 인해 크기가 작아진 가상문서는 네트워크를 통한 문서 전송시 효율적으로 전송할 수 있다. 본 논문에서는 디지털도서관 시스템 MIRAGE III(4)에서 이용하는 가상문서를 쉽게 만들어 주는 가상문서 저작도구의 설계 및 구현과정에 대하여 기술하였다.

  • PDF

XML의 RDB로의 맵핑을 위한 효율적인 스키마 변환 (The Efficient Schema Conversion to map the XML Document into the RDB)

  • 김태희;김선경
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2003년도 추계공동학술대회
    • /
    • pp.429-433
    • /
    • 2003
  • 웹상의 문서는 데이터 중심의 표준 언어인 XML 문서로 표현된다. XML 데이터를 범용적이고 우수한 성능의 관계형 데이터베이스와 연동하여 이용하기 위해서는 두 구조 사이의 맵핑 과정이 필요하다. 계층적 구조의 XML 문서와 데이터베이스의 평면적인 구조의 차이를 고려한 구조 맵핑을 위해서 검색 시스템에 적합한 가상분할 방식으로 엘리먼트를 분석하여 관계 스키마를 정의한 후 XML 문서를 저장한다. 이를 위해 스키마는 DTD 에 독립적인 형태로 변환하고, 엘리먼트의 추가와 삭제, 검색의 효율성을 위해 노드간의 위치 정보와 함께 독립적인 ID를 부여하여 구조적 검색을 수행할 수 있게 하였다.

  • PDF

SGML/XML 기반 문서 정보 시스템

  • 주종철;김현기;박영찬
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1998년도 학술대회지 vol.1
    • /
    • pp.69-78
    • /
    • 1998
  • SGML/XML 기반 문서 정보 시스템의 문서 포맷은 인간이 비교적 쉽게 이해할 수 있으며 기존의 문서 정보 시스템에서는 접근 불가한 레벨까지 인간이 접근할 수 있는 통로를 제공한다. 또한, 문서처리 관점에서 보면 기존의 각 CAL/EC관련 응용 프로그램에서 생성된 데이터는 문서 또는 파일 단위의 접근으로 업무레벨에 도움을 주는 것이 제한적인 것에 반해 SGML/XML 기반 문서정보 시스템은 DTD(Document Type Definition)에서 설계된 엘리먼트, 속성, 엔티티 등의 단위까지 접근할 수 있는 Mechanism으로 기존의 문서 정보 시스템과 차별화 되는 지식 매체로서 지식기반 시스템의 하부 프레임워크를 제공한다. SGML/XML 기반 문서 정보 시스템의 요소로서 SGML/XML 문서 정보 검색 시스템은 표현된 계층적 논리정보를 이용하여 다양한 문서 접근점을 제공할 수 있으며, 사용자 요구에 적합한 문서의 재사용 및 동적인 문서제시를 가능하게 한다. 또한, SGML/XML 문서 정보 관리 시스템은 공동 저작을 위한 세부 논리적 단위별 check-in/check-out, 액세스 제어, 버전닝 기능 등을 제공하여 기업 내 자산 관리를 위한 새로운 파라다임을 제공한다. 본 논문에서는 구현 사례와 더불어 SGML/XML 기술이 CALS/EC 추진에 주는 영향과 향후 바람직한 CALS/EC 또는 가상기업(Virtual Enterprise)구축을 위한 기술적 방향에 대해 논한다.

  • PDF

KISTI 분산통합검색시스템

  • 김선호
    • 지식정보인프라
    • /
    • 통권5호
    • /
    • pp.8-19
    • /
    • 2001
  • 분산통합검색 시스템은 지리적으로 흩어져 있는 개별 데이터베이스의 정보 내용과 형식, 그것이 다른 데이터베이스의 어떠한 정보와 연계되어야 하는지를 스스로 판단하여, 사용자의 정보 요청이있을 때마다, 적합한 정보를 세계 각처의 전자 도서관에서수집하고 유형별로묶어서 체계화된 가상 문서를 실시간으로 제공하는 역할을 수행한다.

  • PDF

CALS 표준에 의한 외주 및 부품관리 시스템

  • 이영수;권창완;임춘성;신기태;이창호
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1998년도 학술대회지 vol.1
    • /
    • pp.225-233
    • /
    • 1998
  • 현재의 전자조립 산업계의 일반적인 VAN 기반 외주 관리 시스템은 대부분의 경우 협력 관계에 있는 특정 기업에 설치된 자체 VAN 시스템을 통해서만 운용되고 있어 최근의 국제화 가상기업 환경에 적합하지 않다. 이에 대한 대안으로써 부품관리 기능과 외주관리 기능을 통합적으로 운영할 수 있는 CITIS시스템의 도입을 적극 생각해볼 수 있다. 본 연구에서는 제품의 라이프 사이클을 통해 발생되는 기업간 외주관련 비즈니스 및 부품기술보를 CITIS의 개념을 바탕으로 CALS 표준을 이용하여 인터넷상에서 온라인으로 정보를 교환하고 공유하는 계약자정보통합시스템의 프로토타입을 개발하였다. 이를 위하여 인터넷 EDI에 의한 기업간 비즈니스 전자문서교환 기술개발과 SGML을 통한 기술정보교환 기술개발, 기존의 기업내 시스템과의 원할한 인터페이스 지원방안연구, 인터넷을 이용한 고객지원 시스템의 네 가지 방향으로 연구가 수행되었다. 본 연구를 통하여 개방된 인터넷을 이용한 정보공유를 가능하게 함으로써 기업의 외주업무의 효율성 향상과 가상기업 환경에 대비한 인프라 구축을 기대할 수 있다.

  • PDF

이러닝시스템의 학습 효율성 향상을 위한 색인 메커니즘 (Index Mechanism for advancement learning efficiency of E-Iearning)

  • 김은정
    • 한국정보통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.906-912
    • /
    • 2009
  • 오프라인에서는 학습자와 교수자간의 직접적인 학습 내용 전달과 의사소통으로 보다 효율적인 학습이 이루어진다. 이에 가상 학습에서는 특정 학습 영역에 대한 검색 기능과 평가 후 관련 학습 영역으로의 자동 피드백 연결등의 기능으로 이러한 부분을 해결하고 있다. 그러나 검색결과에서 가장 적합한 학습 영역을 선택하고, 현재의 학습을 위해 선행되어져야 할 이전 학습 영역을 선택하는 것들이 학습자의 몫이기 때문에 학습 내용에 익숙하지 않은 학습자에겐 오프라인 학습에 비해 많은 어려움이 따른다. 본 논문에서는 학습자가 전체 학습 내용의 흐름과 단원간의 연관성 및 학습 방향을 잡는데 도움을 줄 수 있는 보다 다양한 시각에서의 색인 메커니즘을 제안한다.

건설분야 전자매뉴얼의 필요성 및 특성분석을 통한 실무적용성 연구 (A Study on the Necessity and Applicability of Interactive Electronic Technical Manual(IETM) for Construction Projects)

  • 강인석;정원명;곽중민
    • 한국건설관리학회논문집
    • /
    • 제6권1호
    • /
    • pp.99-108
    • /
    • 2005
  • 건설분야 전자매뉴얼은 기존에 서술적 문서형태로 작성되어온 시공법, 유지관리절차 등에 관련된 시방규정, 지침서들이 시각화를 위한 멀티 미디어 기능과 통합연계정보 제공기능을 갖는 전자적 형태로 구성된 것을 의미한다. 이러한 전자적 개념의 건설전자매뉴얼은 지침 규정의 전자화는 물론이고, 공사관리자의 이해도 증진을 위해 해당 규정에 관련된 3D동영상 화면과 가상현실, 시공이력사진 정보들을 연계해서 제공해 주는 종합 정보시스템 개념을 갖고 있다. 현재 시방정보, 관련법규 등의 건설분야 각종 지침들은 전자화를 위한 표준적 인 규칙 이 없이 일반적 인 문서형 태로 작성되고 있으므로, 관련정보의 체계적인 축적 및 공유가 어렵고 효과적 인 시설물의 시공 및 유지관리에 장애요인이 되고 있다. 본 연구에서는 기존 건설분야 정보화 체계와 비교하여 전자매뉴얼의 필요성과 타 분야 전자매뉴얼대비 건설전자매뉴얼의 특성을 분석하여 건설분야에 적합한 구성전략을 제시함으로써, 건설분야 전자매뉴얼의 활용도를 인식시키는데 연구목적이 있다. 이를 위하여 본 연구에서는 유지관리업무 전자매뉴얼 시안을 포함하는 시설물 재해관리용 전자매뉴얼의 적용성을 가상적으로 구성하여 검증하고 있다.

대화형 전자상거래에 대한 연구 (The research of dialogic style electronical commerce solution)

  • 김정우;김진섭;박동원;주기호;김도완
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.29-32
    • /
    • 2000
  • 전자상거래는 전자 인프라(컴퓨터 및 통신망)를 통해 기업과 소비자간(Business-to- Consumer;B-to-C), 기업과 정부간(Business-to-Administration; B-to-A), 소비자와 정부간(Consumer-to-Administration; C-to-A)을 포함한 어떤 형태의 업무적 거래나 정보교환을 하는 것을 의미한다고 볼 수 있다. 이 인터넷을 이용한 전자상거래는 기업이 고객에 대한 정보를 실시간으로 수집할 수 있고, 고객취향을 즉시 알아 대 고객 서비스 개선과 인터넷쇼핑몰에서 고객별 차별화 되고 특화 된 서비스를 제공함으로써 판매를 촉진할 수 있으며, 주문 및 물품배송 관련 문서를 웹을 통해 전자적으로 처리한다. 그러나 기존의 가상 쇼핑몰은 이러한 전자 쇼핑몰의 장점을 활용하지 못하고 있다. 즉 소비자를 고려하지 않은 인터페이스 구조, 또한 허술한 관리 시스템으로 인한 소비자의 불신 등이 기존 시스템의 문제이다. 현재 나와 있는 전자 상거래 구축 솔루션에 대한 문제점을 해소하고 좀더 이식하기 쉽고 소비자가 사용하기 편한 시제품을 본 연구에서 개발하였다. ICQ 와 같은 쪽지 개념을 사용한 본 연구의 결과물은 보안이 갖추어진 지불시스템과 연동 가능하며, 대형 인터넷상점 구축 솔루션 및, 소호(SOHO)나 중소 규모의 인터넷 쇼핑몰에 적합한 통합형 전자상거래 솔루션에 대한 연구한다.

  • PDF

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.