• 제목/요약/키워드: document file format

검색결과 54건 처리시간 0.024초

클라우드 환경에서 공문서 파일포맷의 선택 전략 (Selection Strategy for the File Format of Official Documents in a Cloud Environment)

  • 임진희
    • 기록학연구
    • /
    • 제66호
    • /
    • pp.5-35
    • /
    • 2020
  • 디지털 시대에 기록관리의 가장 기본 단위는 문서파일이 된다. 각 문서파일이 개방형 표준 포맷으로 생산되느냐 배타적 독점 포맷으로 생산되느냐에 따라 활용과 장기보존 과정에 비용 차이가 발생한다. 정부기관들이 클라우드 기반의 업무관리시스템으로 이전하면서 웹기안기를 새로 채택하고. 기안문 파일포맷을 새로 선택하는 기회를 갖게 되었다. 기존의 공문서 생산 방식을 존중하면서 개방형 표준포맷이 갖는 이점을 최대한 살리기 위한 전략을 다룬다. 개방형 표준포맷으로 ISO/IEC 26300:2006 ODF, ISO/IEC 29500:2008 OOXML, KS X 6101 OWPML 등을 소개하고, 포맷과 웹기안기의 선택시 고려사항을 살펴본다. 또한, 클라우드 스토리지에서 공유하는 문서파일의 포맷도 개방형 표준포맷으로 유지하는 전략을 제안한다.

MS 엑셀 파일의 텍스트 셀 입력 순서에 관한 연구 (A Study on Edit Order of Text Cells on the MS Excel Files)

  • 이윤미;정현지;이상진
    • 정보보호학회논문지
    • /
    • 제24권2호
    • /
    • pp.319-325
    • /
    • 2014
  • 스마트폰이나 태블릿 PC 사용이 보급화 되면서 장소에 구애받지 않고 실시간으로 문서의 생성과 편집이 일어나고 있다. 이처럼 학교나 회사에서 업무처리 방법의 한 부분을 차지하고 있는 문서 파일들을 분석하여 데이터가 입력되거나 편집된 흐름을 추적할 수 있다면 디지털 포렌식 수사에서 증거 자료로 활용될 수 있을 것이다. 대표적인 문서 프로그램으로 Microsoft 사의 Office 시리즈를 꼽을 수 있다. MS Office 프로그램은 복합 문서 파일 형식(Compound Document File Format)을 사용하는 97-2003 버전, OOXML 파일 형식(Office Open XML File Format)을 사용하는 2007-현재 버전까지 두 가지 파일 형식으로 구성된다. 지금까지 연구된 MS 파일에 대한 디지털 포렌식 분석 방법은 파일에 은닉된 정보를 탐지하거나 문서의 속성 정보를 통해 위변조 여부를 판단하는 것이었다. 본 논문에서는 디지털 포렌식 관점에서 MS 엑셀 파일에 텍스트 셀이 입력된 순서를 분석하여 문서의 입력 순서와 마지막으로 수정한 셀을 파악하는 방법을 연구하였다.

인터넷 원거리출판의 응용과 PDF의 인쇄활용에 관한 연구 (A Study on the online of PDF Electronic Documents System)

  • 유영수;강영립;김병현;이광수
    • 한국인쇄학회:학술대회논문집
    • /
    • 한국인쇄학회 2001년도 국제학술발표회
    • /
    • pp.63-77
    • /
    • 2001
  • PDF(Portable Document Format) is a file format that Adobe advances postscritp technique and use in managing document information or electric publishing(internet, CD-ROM, DVD). PDF is a devised document type for being able to read and print anywhere, independent of OS, printer type, resolution, and the kind of computer etc. Because this includes a compressing function, it transfers document through a small size of file in internet or intranet. In addition, that is a file format has various advantages-sharing of information and transfering documents in on line or off line environment. In this paper, we developed electronic document system using PDF format. Electronic document system consists of filter, automatic indexing, special searching system and web server. The information used in this paper is database made using Zwon\`s DocuCom. The filter recognizes various kinds of document structure. And according to property of document, it produces ASCII output. In addition to processing various formats of document, the filter can extract keywords in documents of MS WORD, Excel, Powerpoint, PDF, CAD etc. This filter uses the structure of window printer drive and can extract the information for text, page, font type and size from relevant document. The automatic indexing recognizes the formatted tag of document form ASCII text produced by filter and extracts adequate keyword to structure and property of document. PDF electronic document systems proposed in this paper can be used in Internet, PC communication. Users can choose and read electronic documents by two ways. First, users can choose and read relevant books using PDF electronic document homepage. Second, users can use PDF integrated-search system. User can search after inputing keyword and choose reference field and type of data. But, now, PDF products of Adobe can\`t support the Korean character. If this problem is resolved, we thick that PDF applications system looks active. Although there is limited function in case of using Zwon DocuCom used in this study, we think that there isn\`t a great deal of difficulty in electronic document and building digital database.

  • PDF

복합문서 파일에 은닉된 데이터 탐지 기법에 대한 연구 (An effective detection method for hiding data in compound-document files)

  • 김은광;전상준;한재혁;이민욱;이상진
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1485-1494
    • /
    • 2015
  • 기존 데이터 은닉은 대용량 멀티미디어 파일에 데이터를 삽입하는 방식으로 이루어졌다. 하지만 최근 Microsoft Office 2003 이하 버전 제품의 문서파일은 구조가 파일시스템과 유사하여 데이터 은닉이 비교적 용이해 커버데이터(Cover data)로 사용되고 있다. 데이터가 은닉된 문서파일을 MS Office 프로그램으로 실행할 경우 은닉 사실을 모르는 사용자는 은닉 데이터를 눈으로 쉽게 확인할 수 없다. 이에 본 논문에서는 Microsoft Office 2003 이하 버전과 한컴오피스 문서파일에서 사용되는 복합문서 파일 이진형식(Compound File Binary Format) 파일 포맷 구조를 분석하여 데이터 삽입이 가능한 공간을 살펴보고 이를 탐지하기 위한 방안을 제시하고자 한다.

문서교환을 위한 ODIF 테이터 스트림 변환 시스템 설계 및 구현 (The Design and Implementation of the ODIF Data Stream Translation System for Document Interchange)

  • 정회경;김용호;김진수
    • 공학논문집
    • /
    • 제1권1호
    • /
    • pp.71-80
    • /
    • 1997
  • 본 논문은 서로 다른 시스템들과 응용들 간의 문서 정보 교환을 위해 기존의 워드프로세서(wordprocessor) 화일을 국제 표준 형식인 ODIF(Open Document Interchange Format) 데이터 스트림(stream)으로 변환하는 시스템에 관한 것이다. 이를 위해 본 논문에서는 국제 기본 표준인 ODA(Open Document Architecture)와 기능 표준인 FOD 26을 채택하며, 기존의 문서 화일은 보석글V 화일을 채택한다. 구현 단계에서 국제 표준의 기능 표준에 기본해 설계함으로써 국제 환경 속에서 문서 교환이 가능하며, 멀티미디어 문서 정보통신 분야에 크게 기여할 수 있으리라 본다. 본 시스템은 PC 환경에서 Windows, ODAC(ODA Consortium) 툴킷(toolkit)을 사용한다.

  • PDF

비할당 영역 데이터 파편의 문서 텍스트 추출 방안에 관한 연구 (A Study on Extracting the Document Text for Unallocated Areas of Data Fragments)

  • 유병영;박정흠;방제완;이상진
    • 정보보호학회논문지
    • /
    • 제20권6호
    • /
    • pp.43-51
    • /
    • 2010
  • 디지털 포렌식 관점에서 디스크의 비할당 영역의 데이터를 분석하는 것은 삭제된 데이터를 조사할 수 있다는 점에서 의미가 있다 파일 카빙(Carving) 을 이용하여 비할당 영역의 데이터를 복구할 경우 일반적으로 연속적으로 할당된 완전한 파일은 복구 기능하지만, 비연속적으로 할당되거나 완전하지 않은 형태의 단편화된 데이터 파편(Fragment)은 복구하기 어렵다. 하지만 데이터 파편은 많은 양의 정보를 포함하고 있기 때문에 이에 대한 분석이 필요하다. Microsoft Word. Excel, PowerPoint, PDF 문서 파일은 텍스트와 같은 정보들을 압축된 형태로 저장하거나 문서 내부에 특정 형식을 이용하여 저장한다. 앞서 언급한 문서 파일의 일부분이 데이터 파편에 저장되어 있을 경우 해당 데이터 파편에서 데이터의 압축 여부를 판단하거나 문서 내부 형식을 이용하여 텍스트 추출이 가능하다. 본 논문에서는 비할당 영역 데이터 파편에서 특정 문서파일의 텍스트를 추출하는 방안을 제시한다.

사회기반시설물 안전관리 지원 데이터베이스 구축을 위한 구조계산서의 XML 문서화 방법론 (A methodology for XML documentation of the structural calculation document to build database supporting safety management of infrastructures)

  • 이진훈;박상일;김봉근;이상호
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2007년도 정기총회 및 학술발표대회
    • /
    • pp.414-417
    • /
    • 2007
  • A methodology for XML documentation of the structural calculation document is presented to support manipulation of the design information on the internet. The text file format is chosen as a neutral format because it can be easily translated from office documents generated from engineering practice. The first word of each line is compared with the reserved numbering groups, and relative levels among the lines are defined to generate the hierarchically structured XML document of the text file. The demonstration subjected to sample general documents and structural calculation documents shows that the prototype application module based on the developed methodology can be adopted to build the database of design information which supports the safety management of infrastructures.

  • PDF

전자기록물의 장기보존을 위한 보존포맷 선정 방안에 관한 연구 (A Study on the Selection of Preservation Format for Long-Term Preservation of Electronic Records)

  • 한희정;오효정;양동민
    • 한국기록관리학회지
    • /
    • 제20권1호
    • /
    • pp.69-87
    • /
    • 2020
  • 문서 유형의 전자기록물 장기보존을 위해 국가기록원에서는 PDF/A-1을 보존포맷으로 선정하였고 문서보존포맷으로 명명하여 공공표준으로 제정하였다. 문서 중심의 하나의 보존포맷인 PDF/A-1를 선택할 수 밖에 없기 때문에, IT 발전과 업무 변화에 따라 실제 업무에 적용할 수 있거나 적용해야만 하는 다양한 전자파일 포맷들을 활용하는데 제약을 주고 있으며, 문서 이외에 다른 유형의 전자기록물(행정정보데이터세트, 시청각기록물, 웹기록물 등)에는 적용되기 어렵다. 그러므로 전자기록물의 보존포맷을 다양화할 수 있는 방안이 필요하다. 본 논문에서는, 우선 전자기록물의 보존포맷을 다양화할 수 있는 보존포맷 선정체계를 제시한다. 또한, 보존포맷을 선정할 때, 모든 전자기록물에 공통으로 적용되는 기준인 공통기준 및 평가방식, 그리고 전자기록물 유형별로 적용되는 고유기준을 도출하기 위한 방법론을 제안하고자 한다.

OOXML형식을 사용하는 MS 파워포인트 파일에 대한 편집 이력 조사 방법 (Methods for Investigating of Edit History about MS PowerPoint Files That Using the OOXML Formats)

  • 윤지혜;박정흠;이상진
    • 정보처리학회논문지C
    • /
    • 제19C권4호
    • /
    • pp.215-224
    • /
    • 2012
  • 개인 및 기업의 업무 처리 시 컴퓨터 사용이 일반화됨에 따라 각종 문서 파일들이 디지털 형태로 생성되고 이메일, USB등 다양한 매체를 통해 이동, 복사되고 있다. 이러한 디지털 자료를 면밀히 분석하면 문서 작업 중 발생한 편집 이력을 추적할 수 있다. 이에 관하여 복합문서 파일 형식에 대한 연구는 있었으나 새로운 OOXML형식에 대해서 파일의 작성 과정을 파악하기 위한 저장되지 않은 파일을 찾거나 내부 작성 순서를 추적하고 서로 다른 문서 파일간의 연관성을 분석하는 방법에 대한 연구는 없었다. 향후 OOXML형식 디지털 문서의 사용이 더욱 증가할 것이며, 이러한 편집이력 추적 연구는 문서 파일에 대한 디지털 포렌식 수사에 큰 도움이 될 것이다. 따라서 본 논문은 OOXML형식 문서에 대해서 포렌식 관점을 가지고 문서파일의 내부 작성순서를 분석하고 파일 간 연관성을 추적하는 조사 방법을 제시한다.

공문서 컴포넌트 오픈포맷 채택이 기록관리에 미치는 영향 분석 (Effects of Adopting the Open Document Format in Public Records Management)

  • 정미리;오세라;임진희
    • 한국기록관리학회지
    • /
    • 제16권2호
    • /
    • pp.29-55
    • /
    • 2016
  • 전자정부 추진 이래 공공기관은 전자문서시스템이나 업무관리시스템을 통하여 문서를 생산하고 있으며, 대부분의 공문서가 개발사 의존적 독자포맷인 hwp로 저장되고 관리되고 있다. 이러한 독자포맷은 특정 소프트웨어에 의해서만 내용 확인이 가능하므로 해당 소프트웨어의 구매는 불가피하다. 라이선스를 구매하였다 할지라도 과거 또는 향후 버전에 대한 지원 여부가 불확실하므로 장기보존 대책이 요구된다. 기관 간 문서 유통 시 독자포맷과 XML 기반의 유통 규격 간 변환 과정에서 서식 누락, 대응 규격 부재로 인해 변환 실패나 원문서 변형을 초래하기도 한다. 본 연구는 개방형 문서 포맷(ODF)을 소개하고 공공영역에서의 문서 생산, 유통, 관리, 활용과 보존에 ODF 도입 시 예상되는 영향을 검토하였다.