• Title/Summary/Keyword: 디지털 문서

Search Result 480, Processing Time 0.029 seconds

Related Documents Classification System by Similarity between Documents (문서 유사도를 통한 관련 문서 분류 시스템 연구)

  • Jeong, Jisoo;Jee, Minkyu;Go, Myunghyun;Kim, Hakdong;Lim, Heonyeong;Lee, Yurim;Kim, Wonil
    • Journal of Broadcast Engineering
    • /
    • v.24 no.1
    • /
    • pp.77-86
    • /
    • 2019
  • This paper proposes using machine-learning technology to analyze and classify historical collected documents based on them. Data is collected based on keywords associated with a specific domain and the non-conceptuals such as special characters are removed. Then, tag each word of the document collected using a Korean-language morpheme analyzer with its nouns, verbs, and sentences. Embedded documents using Doc2Vec model that converts documents into vectors. Measure the similarity between documents through the embedded model and learn the document classifier using the machine running algorithm. The highest performance support vector machine measured 0.83 of F1-score as a result of comparing the classification model learned.

대용량 XML 문서 처리를 위한 기본도구

  • Chae, Jin-Seok
    • Digital Contents
    • /
    • no.9 s.76
    • /
    • pp.19-21
    • /
    • 1999
  • XML을 여러 응용에서 활용하기 위해서는 문서 작성을 도와주는 도구 및 관련 S/W들이 필요하다. 여기서는 XML문서 처리의 가장 기본이 되는 XML파서와 DTD편집기, XML편집기, XSL 편집기 등의 저작 도구를 설명하고, 일반적인 XML문서를 위한 브라우저와 수학, 화학, 음악 등 특수 분야의 브라우저에 대해 소개한다.

  • PDF

Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents (XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리)

  • 박천수;임동수;박종현;강민구;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

An Extension of Hangul MG System for Web Document Retrival (웹 문서 검색을 위한 한글 MG 시스템의 확장)

  • 김범수;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.290-292
    • /
    • 2000
  • 최근 국대 인터넷 발전과 더불어 검색엔진들의 수요가 많아지고 있어 크고 작은 검색엔진들이 많이 개발되고 있다. 기존의 디지털 라이브러리에 사용되고 있는 정보 검색 엔진인 한글 MG 시스템을 웹 문서 검색에 적용하는데는 어려움이 있었다. 본 논문은 한글 MG 시스템을 기반으로 웹 사이트의 내부 문서 검색이 가능한 소형검색엔진으로 확장하는데 필요한 웹 로봇에 의한 문서 수집, 수집된 문서의 가공, 메타 데이터의 데이터베이스와, 단락 대 문서 사상, 문서 검색을 위한 질의 루틴의 수정과 웹 검색 및 시스템 관리 인터페이스에 대한 방안들을 제안하여 확장 시스템을 설계하고 구현하였다.

  • PDF

A Study on Natural Language Document and Query Processor for Information Retrieval in Digital Library (디지털 도서관 환경에서의 정보 검색을 위한 자연어 문서 및 질의 처리기에 관한 연구)

  • 윤성희
    • Journal of the Korea Computer Industry Society
    • /
    • v.2 no.12
    • /
    • pp.1601-1608
    • /
    • 2001
  • Digital library is the most important database system that needs information retrieval engine for natural language documents and multimedia data. This paper describes the experimental results of information retrieval engine and browser based on natural language processing. It includes lexical analysis, syntax processing, stemming, and keyword indexing for the natural language text. With the experimental database ‘Earth and Space Science’ that has lots of images and titles and their descriptive text in natural language, text-based search engine was tested. Combined with content-based image search engine, it is expected to be a multimedia information retrieval system in digital library

  • PDF

Revival of Text Document Image Contents (텍스트 문서 영상 컨텐츠의 부활)

  • 오일석
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.11a
    • /
    • pp.96-102
    • /
    • 2003
  • The human knowledge has been integrated mainly through the text documents. The computer technologies changed the way of production and deliverly of the documents from analog to digital. During the paradigm shift, a serious problem must occur due to a large gap between the old contents and newly generated contents. This paper reviews some methods to reduce the gap for the text document image contents.

  • PDF

Design and Implementation of a Virtual Education System on the Web Environment (웹 환경에서의 가상교육 시스템 설계 및 구현)

  • 노진순;이용배;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.595-597
    • /
    • 2001
  • World-Wide Web으로 인하여 인터넷 상의 다양하고 고품질의 자료들을 교육 자료에 손쉽게 활용할 수 있는 시대가 도래하였다. 그러나 이러한 자료들은 교육적 효과를 극대화시키기 위해서 좀 더 정제되고, 교육과정에 맞는 흐름을 가질 필요가 있다. 이러한 과정의 흐름을 제공하기 위해서는 웹 상에서 분산되어 독립적으로 존재하는 디지털 문서들을 교육 목적에 맞게 새로운 순서, 즉 문맥화된 순서를 가진 자료로 재구성할 수 있어야 하며, 문서간의 부드러운 내용 전개를 위해서 부가적인 설명이나 기존 문서에 빠져 있는 내용들을 보완할 수 있어야 한다. 본 논문의 연구과정에서 개발된 가상교육 시스템은 교사가 교육용 지식문서를 작성하여 면대면(face to face) 교육에서는 직접 학생들을 교육할 수 있는 교육 자료로 사용될 수 있을 뿐만 아니라 웹을 통해서는 학생 스스로가 부족한 부분을 원하는 시간에 학습할 수 있는 능동적인 교육 환경을 제공할 수 있다. 또한, 가상교육 시스템에 가상문서 개념을 도입함으로써 인터넷 상의 수많은 리소스들을 인용하는 것에 대한 부하를 막을 수 있다. 본 논문에서는 인터넷 상의 디지털 컨텐츠를 전문적인 지식을 가진 교사가 교육과정에 맞게 쉽게 재구성해 줄 수 있도록 가상교육 시스템을 설계 및 구현한 내용에 대해 기술한다.

  • PDF

XML Digital signature System based on Mobile Environment (모바일 환경에서의 XML 문서 디지털 서명 시스템)

  • Hao, Ri-Ming;Hong, Xian-Yu;Lee, Seong-Hyun;Lee, Jae-Seung;Jung, Hoe-Kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2007.10a
    • /
    • pp.701-704
    • /
    • 2007
  • Recently, More and more consumer enjoy the finance service such as settling, account transferring, stocks investment, and so via mobile device. In the mobile environment, data transferring between the devices is formatted as XML. However, the common XML file is exposed to the attack such as hacking and malignity code, to satisfy security of mobile environment is very difficult. The problem is more seriously at the open platform such as WIPI that is developed by our country. So there is enough reason to propose one system to protect the import data. In this paper, we development the system to digital signature and signature the XML document in order to protect data, and the system is observing the recommendation of the XML Signature Syntax and Processing by W3C. When designing and composition the system, we use the digital signature algorithm RSA, DSA, KCDSA, and HMAC, etc. we test the system at the open WIPI platform.

  • PDF

Design and Implementation of the Search Inside Middleware System by using XML (XML 기반의 본문검색 미들웨어 시스템 설계 및 구현)

  • Kim, Hyo-Nam
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.229-232
    • /
    • 2011
  • 최근 스마트 디바이스 기반의 다양한 콘텐츠 제작 공급에 대한 새로운 마켓 시장 형성과 태블릿 디바이스 기반의 전자책 시장 규모의 확대에 따른 새로운 유형의 디지털 콘텐츠 시장이 형성되고 있다. 디지털 미디어는 정보환경 범위를 종이의 범위에서 벗어나 매체와 연계한 다양한 형태로의 변화뿐만 아니라 서술 방식과 소통방식의 방법에도 변화를 발생하였다. 그리고 지면에서 국한된 아날로그 매체의 물리적, 공간적, 시간적인 한계를 뛰어넘어 다양한 콘텐츠를 손쉽게 접근할 수 있게 만들었다. 이런 환경에서 본문검색 서비스는 아날로그와 디지털 매체의 상호 공존관계를 형성할 수 있다. 본 논문에서는 그림종이문서를 본문검색이 가능한 이미지형태의 디지털문서로 변환해주는 디지털라이징 시스템으로 문자위치정보를 포함하는 광학문자인식(OCR)기능과 인식된 문자의 오류를 수정하는 에디터기능을 통해 추출된 내용을 XML형태로 제공하는 본문검색 시스템을 제안한다. 특히, 문자인식 후처리 공정에서 복수의 관학문자인식(OCR)엔진을 통해 결과 비교와 문자위치 정보 확인 및 편집, 맞춤법 검사 등의 특화된 기능 등은 본 논문에서 가지는 강점으로 디지털문서 구축에 소요되는 시간과 비용을 혁신적으로 절감시켜준다.

  • PDF

A Design and Implementation of Data Provider for Developing Features Supporting OAl in MIRAGE (MIRAGE의 OAI지원 기능을 위한 Data Provider 설계 와 구현)

  • 지용인;이종필;이현숙;이만호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.169-171
    • /
    • 2002
  • MIRAGE는 XML을 기반으로 하는 가상문서라는 개념을 도입하여 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한 디지털도서관 시스템이다. OAI는 컨텐츠에 대한 메타데이터를 이용해서 디지털도서관 안에 있는 정보를 상호이용하기 위한 프로토콜이다. 본 논문에서는 MIRAGE에 OAI 지원 기능을 첨가하여 MIRAGE 시스템에 의해 만들어진 가상문서에 대한 메타데이터를 제공하는 data provider를 구현하여 다른 디지털도서관과 더불어 정보를 상호이용할 수 있도록 하였다. 또한 원문에 대한 접근을 원하는 사용자를 위해서 메타데이터의 원문에 직접 접근할 수 있도록 하였다.

  • PDF