• 제목/요약/키워드: Document Image

검색결과 300건 처리시간 0.03초

문서영상의 낱자 단위 언어 구분 (Language Identification of Character-level in Document Image)

  • 권세광;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.613-615
    • /
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

  • PDF

웹 기반 영상과 문서의 자동결합기법에 관한 연구 (A Study of Development on technique for document & image unite)

  • 나종원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.187-190
    • /
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

  • PDF

이진 대역분할과 Zerotree 기반 산술부호기를 이용한 문서 영상 압축 (Document Image Compression Using Binary Subband Analysis and Zerotree-based Arithmetic Coder)

  • 김정권;김승환;이충웅
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.45-50
    • /
    • 1999
  • 이진 영상의 압축은 디지털 도서관, 팩시밀리 전송, 문서 입출력 시스템과 같이 한정된 대역폭과 저장 공간을 가진 응용 분야에서 절실히 요구되고 있다. 현재 많은 영상 압축 알고리즘이 채택하고 있는 대역분할 기법을 문서와 같은 이진 영상의 압축에 적용한다면, 점진적 전송, 축소영상을 통한 빠른 검색 등의 장점을 얻을 수 있다. 그러나, 이진 영상 신호가 두 단계의 휘도 값을 가지므로, 이에 적합한 대역분할 방법과 산술부호기를 선택하여야 한다. 본 논문에서는 표본화-XOR 대역분할 기법을 선택하여, 알파벳 수의 증가를 막고 공간영역에서 국부적인 성질을 얻을 수 있다 또한, 넓은 단일-색 영역을 Zerotree로 대표하여 부호화 되는 신호의 수를 줄이고, 대역분할 구조에서 예측성의 저하를 막기 위한 적절한 조건화문맥과 새로운 부호를 선택한다. 이진 영상에 적합한 대역분할 방법과 산술부호기를 선택하여, 대역분할의 장점과 우수한 압축 성능을 달성할 수 있다.

  • PDF

분류시스템 개발과정에서의 협력에 대한 연구 (A Study on Collaboration in Classification System Development Practice)

  • 박옥남
    • 한국문헌정보학회지
    • /
    • 제42권4호
    • /
    • pp.181-199
    • /
    • 2008
  • 본 연구는 실제 분류 시스템 개발자들의 행태를 이해하는 데 그 목적이 있다. 이를 위하여, 협력행태를 중심으로 협력의 유형, 협력에 영향을 미치는 요인, 협력이 분류 시스템 개발에 미치는 영향 등을 조사하였다. 또한 협력에 대한 이해가 분류 교육자, 연구자, 개발자에게 제공하는 의의를 논의하였다. 자료는 문헌조사, 현장인터뷰, 관찰법, 이메일의 방법을 통하여 수집되었다. 본 연구는 이미지 분류 시스템 개발팀을 대상으로 조사하였으며 사회과정모델을 연구의 프레임워크로 채택하였다.

Development of Standard Hill Technology for Image Encryption over a 256-element Body

  • JarJar, Abdellatif
    • Journal of Multimedia Information System
    • /
    • 제8권1호
    • /
    • pp.45-56
    • /
    • 2021
  • This document traces the new technologies development based on a deep classical Hill method improvement. Based on the chaos, this improvement begins with the 256 element body construction, which is to replace the classic ring used by all encryption systems. In order to facilitate the application of algebraic operators on the pixels, two substitution tables will be created, the first represents the discrete logarithm, while the second represents the discrete exponential. At the same time, a large invertible matrix whose structure will be explained in detail will be the subject of the advanced classical Hill technique improvement. To eliminate any linearity, this matrix will be accompanied by dynamic vectors to install an affine transformation. The simulation of a large number of images of different sizes and formats checked by our algorithm ensures the robustness of our method.

이미지데이터 활용을 위한 지능형 인식 라이브러리 연구 개발 (R&D of Intelligent Document Recognition Library for utilizing image data)

  • 곽희규;김성헌;이정우;유지훈;이현주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.329-330
    • /
    • 2009
  • 본 연구는 공공기관이 소장한 이미지데이터 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화에 있으며, 주요한 연구방향은 공공기관이 소장하고 있는 데이터의 분석을 통해 이미지분석 기술 및 라이브러리를 개발하고 특화된 지식베이스를 구성하는 것이다. 또한, 향후 확장성을 고려하여 지식베이스를 지속적으로 관리할 수 있는 툴을 개발하는 것이다. 본 연구는 현재 지능형 인식 라이브러리를 결합한 프로토타입(prototype) 시스템 개발이 완료된 바, 방대한 국가기록원내 소장자료를 대상으로 다양한 성능평가를 위한 테스트베드 구축이 진행되고 있다.

영상 분할을 활용한 화학 구조 문서 이해 (Understanding Documents With Chemical Structures Using Image Segmentation)

  • 양혜윤;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF

패션 디자이너 브랜드의 디지털 스토리텔링 유형과 특성 (Study on the Digital Storytelling Types and Characteristics of Fashion Designer Brands)

  • 홍윤정;김영인
    • 복식
    • /
    • 제63권8호
    • /
    • pp.43-57
    • /
    • 2013
  • The purpose of this research is to systemize the fashion digital storytelling by analyzing the communication method and its elements, and extracting the characteristics and processes of digital storytelling. Based on the previous study on the characteristics and types of storytelling the following things have been researched: 1) the process of digital storytelling in the communication process, 2) the concept and the feature of the academia of digital storytelling 3) storytelling in the document research. On the groundwork of the document research, we were able to sort out the various types, and formed a system of the features in the fashion digital storytelling cases, mainly in the four collections (Milan, Paris, London, New York) from 2000's to recent years of 2010. The types of fashion digital storytelling are episode type, narrative type, and creative type. The characteristics of each of the types are as follows. Firstly, the episode type communicates through the digital media based on the information or fact of the fashion designer brand. Secondly, narrative type communicates with the consumers using previous literature or an existing idea of the original cultural form that is rearranged in digital story expressed by the digital media. Lastly, creative type makes the designer's and consumer's susceptibility and creativity communicate through the newly made story, which expresses the unique originality of the designer. It seems that the cases and studies of using the fashion digital storytelling will increase because of its short history and lack of the case study. Fashion designer brands will show their brand image using the digital storytelling because they are able to better express originality, creativity and imagination of the fashion designer, which were factors that could not be conveyed through fashion alone.

실시간으로 영상 정보을 이용한 3D 가상공간 문서의 디스플레이 구현 (Implementation of 3D Virtual Space Documents using Image Information in Real Time)

  • 정하영;김태우;최종환
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.40-44
    • /
    • 2018
  • IoT 기반 정보화 사회가 급속하게 발전함에 따라 우리가 일상생활에서 접하는 여러 IT사무 가전과 함께 사무용 소프트웨어가 출시되어 보다 편리한 서비스를 제공하게 되었다. 이는 기록용 문서 작성 외에도 효과적인 기록 발표와 정보 전달을 위한 문서 작성이 매우 중요시 되고 있기 때문이다. 본 논문에서는 실시간으로 효과적인 정보전달을 위한 2D기반 3D 가상공간용 설계를 제시한다. 설계의 일부를 구현한 프로그램은 가상의 3D 공간에서 문서를 편리하게 탐색하거나 보여주면서 음성정보와 시각정보를 동시에 효과적으로 전달할 수 있게 하였다. 제시된 프로그램과 구현을 통하여 문서들을 3D 가상공간에 자동으로 배치하는 방법과, 이를 효과적으로 탐색하는 가상의 카메라 움직임에 대한 설계를 제시하고, 각 문서별로 음성정보를 연결하는 방법을 제시한다.