• Title/Summary/Keyword: PDF Document

Search Result 47, Processing Time 0.023 seconds

인터넷 원거리출판의 응용과 PDF의 인쇄활용에 관한 연구 (A Study on the online of PDF Electronic Documents System)

  • 유영수;강영립;김병현;이광수
    • 한국인쇄학회:학술대회논문집
    • /
    • 한국인쇄학회 2001년도 국제학술발표회
    • /
    • pp.63-77
    • /
    • 2001
  • PDF(Portable Document Format) is a file format that Adobe advances postscritp technique and use in managing document information or electric publishing(internet, CD-ROM, DVD). PDF is a devised document type for being able to read and print anywhere, independent of OS, printer type, resolution, and the kind of computer etc. Because this includes a compressing function, it transfers document through a small size of file in internet or intranet. In addition, that is a file format has various advantages-sharing of information and transfering documents in on line or off line environment. In this paper, we developed electronic document system using PDF format. Electronic document system consists of filter, automatic indexing, special searching system and web server. The information used in this paper is database made using Zwon\`s DocuCom. The filter recognizes various kinds of document structure. And according to property of document, it produces ASCII output. In addition to processing various formats of document, the filter can extract keywords in documents of MS WORD, Excel, Powerpoint, PDF, CAD etc. This filter uses the structure of window printer drive and can extract the information for text, page, font type and size from relevant document. The automatic indexing recognizes the formatted tag of document form ASCII text produced by filter and extracts adequate keyword to structure and property of document. PDF electronic document systems proposed in this paper can be used in Internet, PC communication. Users can choose and read electronic documents by two ways. First, users can choose and read relevant books using PDF electronic document homepage. Second, users can use PDF integrated-search system. User can search after inputing keyword and choose reference field and type of data. But, now, PDF products of Adobe can\`t support the Korean character. If this problem is resolved, we thick that PDF applications system looks active. Although there is limited function in case of using Zwon DocuCom used in this study, we think that there isn\`t a great deal of difficulty in electronic document and building digital database.

  • PDF

웹을 기반으로 한 PDF 출판 솔류션에 관한 연구 (PDF Publication Solution based on Web)

  • 이재득
    • 산업경영시스템학회지
    • /
    • 제28권2호
    • /
    • pp.109-116
    • /
    • 2005
  • In the previous C/S publishing system, the editor or contributor can arbitrarily modify the document created by the author, in which case it is difficult to identify the changes made in the document. Another shortcoming is in that when the document is in need of tracking or editing, the client must have the respective editing system. To solve this problem, the gist of the document must be preserved along with the document itself, and the process of handling the document must be standardized. Publishing on the web ensures a more stable and accurate result in processing documents. The significance of web publishing is made clear, when we consider the importance of information per se and the growing demand for immediate publication in the present day. The need for a simple and straightforward apache-based PDF publishing system, in which HTML and CSS are supported, and a converting engine provides PDF standard security application support, is prominent. This provides a library in which one can directly create a PDF via Windows, Linux, or Unix without having to rely on a client, allowing high-speed PDF creation. The development of a web-accessed PDF converting engine forms the basis for e-transactions, online brochures, electronic B/L, and many other industrial sectors.

PMCN: Combining PDF-modified Similarity and Complex Network in Multi-document Summarization

  • Tu, Yi-Ning;Hsu, Wei-Tse
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제9권3호
    • /
    • pp.23-41
    • /
    • 2019
  • This study combines the concept of degree centrality in complex network with the Term Frequency $^*$ Proportional Document Frequency ($TF^*PDF$) algorithm; the combined method, called PMCN (PDF-Modified similarity and Complex Network), constructs relationship networks among sentences for writing news summaries. The PMCN method is a multi-document summarization extension of the ideas of Bun and Ishizuka (2002), who first published the $TF^*PDF$ algorithm for detecting hot topics. In their $TF^*PDF$ algorithm, Bun and Ishizuka defined the publisher of a news item as its channel. If the PDF weight of a term is higher than the weights of other terms, then the term is hotter than the other terms. However, this study attempts to develop summaries for news items. Because the $TF^*PDF$ algorithm summarizes daily news, PMCN replaces the concept of "channel" with "the date of the news event", and uses the resulting chronicle ordering for a multi-document summarization algorithm, of which the F-measure scores were 0.042 and 0.051 higher than LexRank for the famous d30001t and d30003t tasks, respectively.

Design and Implementation of the Document HTML System for Preserving Content Integrity

  • Hyun Cheon Hwang;Ji Su Park;Jin Gon Shon
    • Journal of Information Processing Systems
    • /
    • 제19권3호
    • /
    • pp.334-346
    • /
    • 2023
  • An electronic document based on PDF has been widely used in customer communication between an enterprise and a customer to deliver personalized content. However, electronic documents based on PDF in the form of paper layouts are not suitable for mobile environments because of low readability and lack of interactive interaction. Even though HTML is an essential language in a mobile environment, electronic document based on PDF is still used as it has a content integrity verification feature with a digital signature. It means that a user is sacrificing user experience in a mobile environment for content integrity and using paper-layout electronic documents. In this research, we design the Document HTML specification by setting the Document HTML conformance, adding the extended meta tags, and signing the message digest with a digital signature based on public key infrastructure (PKI). Furthermore, we implemented the Document HTML system, which has REST API services to generate and verify the Document HTML, and did experimental verification of the theory. As a result, we have confirmed that the Document HTML has both content integrity and user experience on mobile. Furthermore, the Document HTML is expected to be an alternative document format to deliver personalized content from an enterprise to a customer in a mobile environment instead of the paper layout electronic document such as PDF.

CAD 뷰어 기반 대화형 3D PDF 문서 생성 자동화 (Automatic Generation of Interactive 3D PDF Document in a 3D Viewer Environment)

  • 박경호;최영;양상욱;송인호
    • 한국정밀공학회지
    • /
    • 제25권4호
    • /
    • pp.77-85
    • /
    • 2008
  • PDF is widely accepted as a standard document format and now it supports 3D contents as well. Within the engineering application areas, this new 3D feature may be used to support sharing of 3D documents and thus collaboration between engineering departments, suppliers and partners. In this paper, we describe a system that automatically generates formatted engineering documents including 3D data converted from 3D applications such as commercial 3D CAD viewer. The system consists of two major modules. One is U3D conversion module and the other is PDF conversion module. U3D conversion module extracts geometry, view data, assembly and disassembly information from 3D viewer and converts to U3D format, currently in IDTF text file format. PDF conversion module generates a PDF file and inserts U3D data, various annotation information, and scripts for custom generated operations such as assembly and disassembly in the PDF document.

PDF를 활용한 고문헌의 원문디지털화 방안에 대한 고찰 (Study on Methods of Digitalization of Older Books Using PDF)

  • 리상용
    • 한국문헌정보학회지
    • /
    • 제34권1호
    • /
    • pp.133-153
    • /
    • 2000
  • 본 논문은 1999년 4월에 출시된 Acrobat 4.0에서 지원하는 PDF(Portable Document Format)를 이용해서 고문헌의 원문을 디지털화하여, 웹상에서 이용자가 고문헌의 원문을 손쉽게 검색할 수 있도록 하기 위한 방안에 대해 연구한 것이다. 이전의 Acrobat 3.0판은 한글 지원에 문제가 많았으나, 이번에 개정된 4.0판에서는 다국어폰트의 지원으로 한글, 중국어, 일본어 등의 PDF변환이 가능해졌다. 따라서 <한글97>(속칭<아래아 한글>)로 구축된 고문헌의 원문파일을 PDF로 변환은 물론 편집도 가능하게 되었다. PDF파일의 뷰어인 Acrobat Reader는 웹상에서 무상으로 다운로드 받을 수 있으므로, 이 PDF를 이용하여 고문헌의 원문을 디지털화 한다면, 향후 개선되어야 할 문제가 있긴 하지만, 이용자가 인터넷상에서 손쉽게 고문헌의 원문을 검색할 수 있게 될 것이다.

  • PDF

전자서명 장기검증 기능 적용을 위한 PDF 표준 개선방안 (Improvement of the PDF Standard to Apply Long Term Electronic Signatures)

  • 박선우;정재욱;원동호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.381-384
    • /
    • 2012
  • 2008년 국제표준 ISO 32000-1로 지정된 PDF 표준은 전자서명에 대한 표준을 함께 제공함으로써 PDF 문서의 신뢰성을 확보하고자 하였다. 하지만 ISO 32000-1에 포함된 전자서명 관련 표준은 서명에 사용된 인증서의 유효기간이 만료되면 전자서명의 유효성을 검증할 수 없기 때문에 장기적으로 보존되는 문서의 신뢰성을 보장하는데 적절하지 않다. 따라서 본 논문에서는 PDF 국제 표준인 ISO 32000-1의 전자서명 관련 표준을 분석하고 전자서명 장기검증 기능을 적용할 수 있는 방안을 제시한다. 본 논문에서 제안한 내용을 활용한다면 다양한 PDF 소프트웨어에서 호환 가능한 전자서명 장기검증 기능을 제공할 수 있을 것이며, 이를 통해 PDF 문서의 신뢰성을 향상시킬 수 있을 것이다.

  • PDF

전자문헌 개발도구에 관한 고찰 - SGML, HTML과 PDF를 중심으로 - (A Study on Tools to Develop Electronic Documents)

  • 김용;남궁황
    • 정보관리연구
    • /
    • 제29권1호
    • /
    • pp.1-19
    • /
    • 1998
  • 정보의 이용과 보존에 따른 시간적, 공간적 한계를 극복하기 위해서 컴퓨터와 네트워크 기술을 기반으로 하는 전자도서관에 대한 국가적인 관심과 지원이 더욱 증대되고 있다. 전자도서관의 궁극적 목적인 정보의 자유로운 유통과 관리를 위한 전자문헌형식과 이에 대한 표준화는 오늘날 중요한 논점으로서 부각되고 있다. 현재, 디지털 정보를 담을 수 있는 다양한 전자문헌개발을 위한 도구들이 있으며, 여러 분야에서 활용되고 있다. 그러나, 단지 특정한 전자문헌개발도구만이 전자도서관을 구축하기 위한 도구로서 기능적인 측면에서나 전자문헌의 제작에 있어서 절대적인 우위성을 갖고 있지는 못하다. 즉, 개개의 도구들은 전자문헌의 형식과 기능 및 정보량에 따른 검색의 효율성에 따라서 상대적인 장, 단점을 가지고 있다. 본 연구에서는 향후의 전자도서관에서 전자문헌이 갖추어야 할 기본조건들과 전자문헌의 개발을 위한 도구로서 사용되어질 대표적인 전자문헌개발도구인 SGML, HTML과 PDF에 의한 전자문헌의 제작 방법과 특징들을 살펴보고, 각각의 상대적인 장, 단점을 비교, 분석함으로써 미래의 전자도서관에서의 자료유형에 따라 적응될 수 있는 적절한 전자문헌개발도구를 제안하였다.

  • PDF

전자기록물의 장기보존을 위한 보존포맷 선정 방안에 관한 연구 (A Study on the Selection of Preservation Format for Long-Term Preservation of Electronic Records)

  • 한희정;오효정;양동민
    • 한국기록관리학회지
    • /
    • 제20권1호
    • /
    • pp.69-87
    • /
    • 2020
  • 문서 유형의 전자기록물 장기보존을 위해 국가기록원에서는 PDF/A-1을 보존포맷으로 선정하였고 문서보존포맷으로 명명하여 공공표준으로 제정하였다. 문서 중심의 하나의 보존포맷인 PDF/A-1를 선택할 수 밖에 없기 때문에, IT 발전과 업무 변화에 따라 실제 업무에 적용할 수 있거나 적용해야만 하는 다양한 전자파일 포맷들을 활용하는데 제약을 주고 있으며, 문서 이외에 다른 유형의 전자기록물(행정정보데이터세트, 시청각기록물, 웹기록물 등)에는 적용되기 어렵다. 그러므로 전자기록물의 보존포맷을 다양화할 수 있는 방안이 필요하다. 본 논문에서는, 우선 전자기록물의 보존포맷을 다양화할 수 있는 보존포맷 선정체계를 제시한다. 또한, 보존포맷을 선정할 때, 모든 전자기록물에 공통으로 적용되는 기준인 공통기준 및 평가방식, 그리고 전자기록물 유형별로 적용되는 고유기준을 도출하기 위한 방법론을 제안하고자 한다.

PDFindexer: Distributed PDF Indexing system using MapReduce

  • Murtazaev, JAziz;Kihm, Jang-Su;Oh, Sangyoon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제4권1호
    • /
    • pp.13-17
    • /
    • 2012
  • Indexing allows converting raw document collection into easily searchable representation. Web searching by Google or Yahoo provides subsecond response time which is made possible by efficient indexing of web-pages over the entire Web. Indexing process gets challenging when the scale gets bigger. Parallel techniques, such as MapReduce framework can assist in efficient large-scale indexing process. In this paper we propose PDFindexer, system for indexing scientific papers in PDF using MapReduce programming model. Unlike Web search engines, our target domain is scientific papers, which has pre-defined structure, such as title, abstract, sections, references. Our proposed system enables parsing scientific papers in PDF recreating their structure and performing efficient distributed indexing with MapReduce framework in a cluster of nodes. We provide the overview of the system, their components and interactions among them. We discuss some issues related with the design of the system and usage of MapReduce in parsing and indexing of large document collection.