• Title/Summary/Keyword: Electronic document

검색결과 485건 처리시간 0.036초

FP-Tree를 이용한 문서 분류 방법 (Text Document Categorization using FP-Tree)

  • 박용기;김황수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권11호
    • /
    • pp.984-990
    • /
    • 2007
  • 전자 문서의 급속한 증가로 인하여 자동 문서 분류의 필요성도 증가하고 있다. 기존의 문서 분류 방법들은 대개 문서를 단어의 집합으로 간주하여 기계 학습의 방법을 그대로 적용하거나 악간의 변형을 가한 방법들이 대부분이다. 본 논문에서는 데이타 마이닝 분야에서 사용되는 FP-Tree 구조를 이용하여 문서내의 문장들의 패턴을 저장하고 이를 사용하여 문서를 분류하는 방법(FPTC)을 제시한다. 또한 FP-Tree를 이용한 방법에 상호 정보량과 문장별 엔트로피를 적용하여 분류 정확도를 높이는 방법 그리고 각각의 실험 결과와 함께 다른 문서 분류 알고리즘과 비교 분석한 결과를 살펴보기로 한다.

객체 지향 데이타베이스를 이용한 HyTime 문서의 구조 정보 관리 (Management of the Structure Information of HyTime Documents using Object-Oriented Database)

  • 박인호;강현석
    • 한국멀티미디어학회논문지
    • /
    • 제5권4호
    • /
    • pp.351-360
    • /
    • 2002
  • 하이퍼미디어 응용에 나타나는 다양한 형태의 멀티미디어 데이타와 이들 사이의 동기화 등을 지원하기 위해 하이퍼미디어 전자 문서의 기술 표준인 HyTime(Hypermedia/Time-based Structuring Language)이 사용되고 있다. 그런데 이러한 HyTime 문서를 효과적으로 관리하기 위해서는 HyTime문서의 논리적 구조 정보를 체계적으로 데이타베이스에 저장하여 여러 사용자가 공유할 수 있도록 관리할 필요가 있다. 본 논문에서는 하이퍼미디어 문서의 논리적인 구조를 정의하는 HyTime DTD(Document Type Definition)를 객체 지향 데이타베이스에서 체계적으로 관리하기 위해 메타 데이타베이스 스키마를 설계하고 이를 관리하는 방법을 기술한다.

  • PDF

The Sequence Labeling Approach for Text Alignment of Plagiarism Detection

  • Kong, Leilei;Han, Zhongyuan;Qi, Haoliang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권9호
    • /
    • pp.4814-4832
    • /
    • 2019
  • Plagiarism detection is increasingly exploiting text alignment. Text alignment involves extracting the plagiarism passages in a pair of the suspicious document and its source document. The heuristics have achieved excellent performance in text alignment. However, the further improvements of the heuristic methods mainly depends more on the experiences of experts, which makes the heuristics lack of the abilities for continuous improvements. To address this problem, machine learning maybe a proper way. Considering the position relations and the context of text segments pairs, we formalize the text alignment task as a problem of sequence labeling, improving the current methods at the model level. Especially, this paper proposes to use the probabilistic graphical model to tag the observed sequence of pairs of text segments. Hence we present the sequence labeling approach for text alignment in plagiarism detection based on Conditional Random Fields. The proposed approach is evaluated on the PAN@CLEF 2012 artificial high obfuscation plagiarism corpus and the simulated paraphrase plagiarism corpus, and compared with the methods achieved the best performance in PAN@CLEF 2012, 2013 and 2014. Experimental results demonstrate that the proposed approach significantly outperforms the state of the art methods.

글로벌 전자무역의 실현을 위한 eUCP의 역할과 개정방안 (A Study on the Roles and Revision of eUCP for Global Electronic Trading)

  • 최석범;홍성규
    • 무역상무연구
    • /
    • 제18권
    • /
    • pp.105-134
    • /
    • 2002
  • In the Spring of 2000, the Banking Commission of the ICC decided to appoint a working group to draft a supplement to the UCP 500 to clarify the position regarding electronic presentation under a documentary credit. Provisions was drafted to supplement its existing rules for documentary credit, that is, UCP 500. These new provisions known as Supplement to UCP 500 for Electronic Presentation was approved by the ICC Banking Commission at the beginning of November 2001 and came in force as of 1 April 2002 The eUCP covers matters such as definitions of key terms such as electronic record, electronic signature, format, paper document, received. An eUCP Credit must specify the formats in which electronic records are to be presented and if not, electronic records may be presented in any format. Electronic records may be presented separately and need not be presented at the same time. The purpose of this paper is to understand the main substance of eUCP and to facilitate the introduction of electronic letter of credit by studying the problems and revision of eUCP and new electronic UCP. The main substances of eUCP are electronic address as place for presentation of electronic records, flexibility of the formats of electronic records to be presented, endowment of the notice of completeness of presentation to the beneficiary, one electronic record satisfying one or more originals or copies of an electronic record, the electronic records to be examined including the electronic record at the hyperlink to an external system or the referenced system, no remark as to the time period for the examination of documents. The Roles of eUCP are the Promotion of the Electronic Trade, the Supply of Basis on the Uniform Rules for Electronic Letter of Credit, the introduction of Electronic Trade Model. The characteristics of eUCP are a supplement to the UCP, no address of any issues relating to the issuance or advice of Credit electronically, independence of specific technologies and developing electronic commerce system, that is, Bolero Service. The Problems of eUCP are flexibility of format of electronic record, heavy burden on the side of banks, and the problems regrading the number of presentation, the notice of completeness of presentation, no provision in regard to the time to examine the electronic records, and representation of the electronic records. In the revision of eUCP to resolve the problems, the things to be taken into consideration are as follows; the designation of the format allowing the banks to examine electronically, prohibition of the paper documents, the development of the system receiving the electronic records, the addition of the reception notice on the side of the banks, the setting of the time to examine the electronic records, the construction of the backup system or the dual processing system.

  • PDF

UN/CEFACT 제출 양식 기반의 기업간 표준 전자문서 개발 지원 시스템 (A Supporting System for Developing Standard B2B Electronic Documents Based on UN/CEFACT Submission Forms)

  • 안경림;박찬권;김형도
    • 한국전자거래학회지
    • /
    • 제11권4호
    • /
    • pp.49-66
    • /
    • 2006
  • 기업간 전자거래가 활성화됨에 따라서 표준 전자문서의 이용이 급속히 증가되고 있으며, 기업간에 교환되는 표준 전자문서의 종류와 형태도 변하고 있다. 초창기에 주로 사용되던 EDI 전자문서를 대신하여, 최근에는 XML전자문서가 활발히 사용되고 있다. 이를 위해 제정된 XML전자문서 프레임워크표준들은 대부분 기본적인 구문 규칙과 메시징, 그리고 표준문서에 대해서만 규정하고 있어서, 새로운 표준 전자문서 개발에서 효율성과 효과성을 확보하기가 어려웠다. 국제적 EDI 표준인 UN/EDIFACT 개발 경험을 반영하여, UN/CEFACT에서는 전자문서를 구성하는 데이터 항목을 컴포넌트로 만들어 전자문서를 개발할 때 재활용할 수 있는 방법론과 라이브러리를 제공하고 있다. 그러나 이러한 방법론과 라이브러리를 적용하여 전자문서를 개발하고 활용하기 위해서는 추가적인 많은 노력이 요구된다. 이를 개선하기 위하여, 이 논문에서는 UN/CEFACT의 표준 전자문서 제출 양식을 중심으로 등록저장소의 각종 자원을 재활용할 수 있고, 다양한 양식간의 자동화된 변환을 지원하는 시스템을 제안한다.

  • PDF

중국 온라인중재규칙에 관한 연구 (A Study on the Online Arbitration Rules in China)

  • 최석범
    • 한국중재학회지:중재연구
    • /
    • 제21권2호
    • /
    • pp.47-64
    • /
    • 2011
  • The China International Economic and Trade Arbitration Commission(CIETAC) released online arbitration rules which apply the resolution of disputes over electronic commerce transactions, as well as other economic and trade disputes in which the parties agree to do. The evidence submitted by the parties may be electronic evidence created, sent, received or stored by electronic, optical or magnetic means. Electronic evidence with a reliable electronic signature shall carry the same effect and probative force as a document with a hand-written signature. Where a case is tried in a tribunal, the arbitration tribunal shall conduct an online trial hearing using internet video conference or other electronic or computer communication means. Unless the parties have another agreement, summary procedure shall apply to cases where the amount in dispute exceeds RMB 100,000 but no more than RMB 1 million, or where the amount in dispute exceeds RMB 1 million and a party submits a written application for summary procedure after obtaining the written consent of the other party. Unless the parties have agreed otherwise, fast-track procedure shall apply to cases where the amount in dispute does not exceed RMB 100,000 or where the amount in dispute exceeds RMB 100,000 and a party submits a written application for fast-track procedure after obtaining the written consent of the other party. Notable features of the Online Rules are as follows; first, there is not detailed consideration for online arbitration. Second, communications between the parties and the tribunal are allowed only through the Secretariat. Third, elaborate provisions regarding the electronic submission and transmission of documents is provided for. Forth, various factors must be considered by the tribunal in deciding the evidence's reliability. Fifth, reasonable endeavours is levied on CIETAC to keep data communications secure and encrypted. Sixth, the tribunal has the right to investigate and collect relevant evidence. And finally different procedures are provided for in consideration of the various types of E-commerce.

  • PDF

안전한 전자상거래 플랫폼 개발을 위한 ESES의 구현 (Implementing the ESES for Secure Electronic Commerce Platform)

  • 이주영;김주한;이재승;문기영
    • 정보처리학회논문지C
    • /
    • 제8C권5호
    • /
    • pp.551-556
    • /
    • 2001
  • 본 논문에서는 전자상거래의 활성화를 위해 네트워크를 통해 전달되는 내용에 대한 보호 뿐 아니라 사용자 인증, 데이터 무결성 보장, 송수신에 대한 부인 봉쇄 등 다양한 보안 기능에 대한 필요성을 충족시키기 위해서 ESES(ETRI Secure E-commerce Services) 시스템을 제안한다. ESES는 현재 전자상거래 문서의 표준으로 광범위하게 채택되고 있는 XML(eXtensible Markup Language) 문서 뿐 아니라 전자상거래시 교환되는 디지털 컨텐츠를 위한 보안 서비스를 제공을 목적으로 한다. 본 논문에서는 ESES 시스템에 대한 간략한 소개와 함께 전자상거래시스템에 적용될 보안 서비스를 제공하기 위해 어떻게 설계, 구현되었는지를 기술한다. 마지막으로 ESES를 보완하기 위해 필요한 향후 연구과제를 제시한다.

  • PDF

원격교육 지원을 위한 도서관 정보서비스에 있어서 저작권 문제 -복제권과 전송권을 중심으로- (Copyright Issues for Distance Learning Library Services Focusing on the Right of Reproduction and Right of Communication)

  • 김현희;정경희
    • 한국도서관정보학회지
    • /
    • 제33권1호
    • /
    • pp.15-34
    • /
    • 2002
  • 저작권법은 저작자의 권리와 그 권리에 대한 제한을 통하여 문화의 향상발전에 이바지하는 것을 목적으로 한다. 학교교육 목적을 위한 경우와 도서관에서의 이용에 대하여 저작권자의 일부 권리를 제한시키는 규정은 저작재산권 제한의 대표적인 예이다. 본 논문은 원격교육을 지원하는 도서관정보 서비스 과정에서 발생하는 저작권 문제를 고찰하고 문제점과 해결방안을 제시하고자 하였다. 이를 위하여 먼저, 원격교육과정에 참여하는 교육자와 피교육자에 의한 저작물 사용시 저작권 문제가 기존의 면대면 교육상황과 어떻게 다른지 고찰하였다. 또한 원격교육을 지원하는 도서관서비스 중 전자지정도서제 운영, 전자적 도서관상호대차 및 전자적 문헌전달서비스 과정에 있어서 저작권 문제를 고찰하고, 현행 저작권법에서 해당 법조항의 문제점과 개정방안을 제시하였다.

  • PDF

컴포넌트기반의 XML/EDI 시스템 설계 및 구현 (Design and Implementation of Component-Based XML/EDI System)

  • 문태수;김호진
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제12권1호
    • /
    • pp.87-116
    • /
    • 2003
  • One of the important applications for business-to-business electronic commerce is in procurement and inventory management using electronic data interchange(EDI). Using online catalogs and approved supplier lists, firms can easily create requisitions and purchasing documents. The emerging trend in EDI technology is changed from VAN(Value Added Network) based EDI to XML based EDI. This paper intends to suggest a component-based XML/EDI system using Unified Modeling Language(UML), as an application system for automobile part industry. Applying component based XML/EDI systems designed with UML methodology, we analyzed the workflow and the document on procurement process between trading partners and implemented a prototype of efficient XML/EDI system, as a surrogate of existing VAN/EDI. The result of applying object-oriented CBD(Component Based Development) technique is to minimize the risk of life cycle and facilitate the reuse of software as mentioned to limitation of information engineering methodology. It enables the interoperability with corporate legacy systems such as ERP(Enterprise Resource Planning), SCM(Supply Chain Management). This system proposes a solution to apply analysis phase and design phase in implementation of XML/EDI system. The implementation of XML/EDI system using CBD shows the ease of use in software reuse and the interoperability with corporate internal information system. The purchasing department with XML/EDI system can electronically communicate purchase orders, delivery schedules to external suppliers and interoperate with other application systems.

  • PDF

철도 물류 정보 표준화 방안 및 정보시스템 개선에 대한 연구 (A Study on the Railroad Logistics Information Standardization and Information System Improvement)

  • 안경림;김동희;박찬권;박정천
    • 한국전자거래학회지
    • /
    • 제13권3호
    • /
    • pp.121-135
    • /
    • 2008
  • 현재 화차를 이용하여 화물을 운송하는 철도 물류는 국내 화물 물동량의 $10{\sim}20%$ 가량을 담당하고 있다. 철도물류 사용자인 운송사(화주 포함) 또는 내륙화물기지는 철도물류 업무를 처리하기 위해 EDI(XML)를 통해 문서를 전송하거나 WEB을 통해 데이터를 입력하고 있다. 그러나 점차 e-비즈니스 환경이 활성화됨에 따라 기존 철도물류 업무에 대한 개선이 요구되고 있다. 또한 확장성 있는 ebXML 기반의 스키마 형식의 사용이 확산되면서 DTD 구조의 전자문서를 XML 스키마 형태로 개선할 필요성도 제기되고 있다. 본 논문에서는 철도물류업무 개선을 위한 철도물류 정보 표준을 연구하고자 한다. 이를 위하여 기존 비즈니스 프로세스를 재정의 하여 불필요한 업무를 개선하고, 비즈니스 프로세스 모델링으로 철도 물류 액티비티를 정의해서 최종 정보 모델을 도출한다. 또한 도출된 정보 모델에 따라 새로운 전자문서를 설계할 수 있도록 비즈니스 정보 개체를 정의하였으며, 철도물류 정보시스템의 개선된 구조도 제안하고자 한다. 이를 통해 철도물류 비즈니스에 효율적이고 확장성 있는 업무 절차를 제공할 수 있을 것이다.

  • PDF