• 제목/요약/키워드: document image processing

검색결과 105건 처리시간 0.028초

카메라 기반 문서 인식을 위한 적응적 이진화 (Adaptive Binarization for Camera-based Document Recognition)

  • 김인중
    • 한국산업정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.132-140
    • /
    • 2007
  • 카메라 영상은 명도의 변화와 부정확한 초점으로 인해 스캐너 영상에 비하여 화질이 저하된다. 본 연구에서는 카메라 영상에서 자주 발생하는 화질 저하에 대한 적응력을 강화하여 카메라기반 문서 인식에 적합한 이진화 방법을 제안한다. 기존의 평가에서 우수하다고 보고된 이진화 방법을 기반으로 하되, 낮은 조도와 부정확한 초점으로 인해 명도 대비가 낮은 영상에 대한 적응력을 강화하였다. 또한 이진화 시 국소 윈도우를 이용하여 기존의 방법에서 뭉개지기 쉬운 문자의 세부 구조를 섬세하게 추출하도록 개선하였다. 실험에서는 기존에 우수하다고 평가된 이진화 방법들과 제안하는 방법을 문서 인식에 적용하여 다양한 카메라 문서 영상에 대한 성능을 비교하였는데, 그 결과 제안하는 방법이 카메라로 입력받은 문서 영상의 인식에 효과적임을 확인하였다.

  • PDF

MathML 수식 구조 표현을 지향하는 XML 문서 편집 시스템의 설계 및 구현 (Design and implementation of XML document edit system that intend to MathML mathematical formula structure representation)

  • 김철순;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.363-367
    • /
    • 2002
  • 컴퓨터를 이용한 전자문서처리에 이용되는 기존의 문서편집 시스템에서는 비구조적인 문서구조를 다루게 됨으로써 시스템 내에서 사용되는 수학식의 표현은 이미지나 텍스트 등의 비구조적인 방법에 의해 표현되거나 처리된다. 이렇게 사용된 수학식은 문서의 가독성과 재사용성 그리고 문서의 처리와 교환에 상대적인 불편을 초래하게 된다. 그러므로 이러한 단점을 극복하고 효율적으로 구조적인 문서상에 MathML(Mathematical Markup Language) 수식 구조를 적용시킬 수 있는 문서편집 시스템이 요구된다. 이에 본 논문에서는 MathML을 기반으로 한 수학식의 표현을 구조적으로 처리할 수 있는 MathML 수식 편집이 가능한 XML(eXtensible Markup Language) 기반의 구조적 문서생성을 위한 문서 편집 시스템을 설계 및 구현하였다.

  • PDF

화질 분석을 통한 카메라 문서 영상의 적응적 이진화 (An Adaptive Binarization of Camera Document Image by Image Quality Estimation)

  • 김인중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.797-803
    • /
    • 2007
  • 카메라 기반 문서 인식을 위해서는 화질 변화에 적응할 수 있는 이진화 기술이 매우 중요하다. 본 논문에서는 화질 분석을 통해 다양한 화질의 카메라 영상에 효과적으로 적응할 수 있는 이진화 방법을 제안한다. 먼저 이진화 파라미터가 이진화 결과에 미치는 영향을 분석하고, 카메라 영상의 화질을 측정하는 방법을 제안한다. 그리고, 측정된 화질과 이진화 파라미터간의 상관 관계를 통계적으로 분석하여 반영함으로써 화질 변화에 자동으로 적응하는 이진화 방법을 제안한다. 실험을 통해 화질과 이진화 파라미터간에는 유의한 상관 관계가 있으며, 제안하는 방법이 화질에 따라 적절한 파라미터를 추정함으로써 화질변화에 적응함을 확인하였다.

Mongolian Traditional Stamp Recognition using Scalable kNN

  • Gantuya., P;Mungunshagai., B;Suvdaa., B
    • International journal of advanced smart convergence
    • /
    • 제4권2호
    • /
    • pp.170-176
    • /
    • 2015
  • The stamp is one of the crucial information of traditional historical and cultural for nations. In this paper, we purpose to detect official stamps from scanned document and recognize the Mongolian traditional, historical stamps. Therefore we performed following steps: first, we detect official stamps from scanned document based on red-color segmentation and document standard. Then we collected 234 traditional stamp images with 6 classes and 100 official stamp images from scanned document images. Also we implemented the processing algorithms for noise removing, resize and reshape etc. Finally, we proposed a new scale invariant classification algorithm based on KNN (k-nearest neighbor). In the experimental result, our proposed a method had shown proper recognition rate.

시그니쳐를 이용한 2차원 아이코닉 이미지 색인 방법의 설계 및 구현 (Design and Implementation of Two Dimensional Iconic Image Indexing Method using Signatures)

  • 장기진;장재우
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.720-732
    • /
    • 1996
  • 아이콘 이미지를 위한 공간 매치 검색기법은 이미지를 몇개의 인식가능한 심볼로 인식하고, 이것을 도큐먼트를 대표하는 값으로 받아들여 인덱싱한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면, 질의에 있는 이미지를 심볼로 변환한 후 접근기법을 통해 원하는 이미지를 검색한다. 따라서 본 연구에서는 이미지의 내용-본위 검색을 효율적으로 지원하기 위하여, 시그니쳐를 이용한 아이콘 이미지의 공간 매치 검색 기법을 제안하다. 이를 위하여 2차원 아이코닉 이미지에 대한 새로운 색인 표현 방법을 제시하며, 구현한 전체 시스템 구성을 설명한다. 아울러 기존의 9-DLT 방법과 정확률과 검색율면에서 성능평가를 수행하여, 제안하는 기법이 이미지의 내용-본위 검색에 효율적임을 보인다.

  • PDF

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.

카메라 획득 문서영상에서의 글자모양 왜곡보정 (Character Shape Distortion Correction of Camera Acquired Document Images)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.680-686
    • /
    • 2006
  • 스캐너로 획득한 문서영상을 대상으로 문자인식을 하는 경우와 달리 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 카메라 렌즈의 특성과 카메라와 피사체간의 위치와 각도의 불일치에 의해 글자모양의 왜곡이 발생한다. 따라서 이러한 왜곡들로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 문서 영상을 카메라로 획득할 때 발생하는 3차원의 비선형적 왜곡을 2차원의 선형 변환을 이용하여 근사화함으로써 왜곡된 글자모양을 교정한다. 또한 변환과정에서 글자와 글자줄을 추출하여 상하로는 글자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 왜곡으로 인해 사변형 형태로 변형된 글자영역 즉 변환영역을 자동으로 설정함으로써 부가적인 정보의 획득 없이 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

문서 영상의 기울기 검출을 위한 기준선 탐색 기법 (Baseline Searching Method for Document Skew Detection)

  • 신명진;김도연;차의영
    • 한국멀티미디어학회논문지
    • /
    • 제10권2호
    • /
    • pp.218-225
    • /
    • 2007
  • 본 논문은 문자 인식 등을 통한 문서 자동 처리 시스템을 위해서 스캔 과정에서 발생할 수 있는 문서의 기울기를 정확하게 검출하는 기법을 제안한다. 제안한 알고리즘은 처리 속도 향상을 위해 영상을 축소한 다음 형태학적 연산과 연결 성분 분석 방법으로 기울기 검출 대상 영역(ROI)을 먼저 설정한 후 설정된 영역 내에서 문서의 기울기 정보를 가지고 있는 기준선을 탐색하는 방법으로 정확하게 기울어진 각도를 검출할 수 있게 하였다. 기존의 형태학적 연산을 기반으로 한 기울기 검출 기법과 비교하고 다양한 종류의 대용량 문서 영상을 대상으로 한 실험 및 분석을 통해 제안한 기울기 검출 방법의 정확도 및 효율성을 증명하였다.

  • PDF

모폴로지 연산을 이용한 문서 이미지의 고속 기울기 검출 기법 (Fast Skew Detection of Document Image Using Morphological Operation)

  • 신명진;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.796-799
    • /
    • 2006
  • 본 논문은 스캔한 문서 및 전자 문서 등과 같은 문서 이미지에서의 기울기를 검출하는 기법을 제안하고 있다. 제안한 알고리즘은 처리 속도 향상을 위해 일정 비율로 축소된 이미지를 사용한다. 하지만 여전히 문서 전체를 대상으로 기울기를 검출하는 것은 많은 계산량을 요구하므로 대상영역(ROI)을 선택한다. 대상 영역은 모폴로지 연산을 통해 문자열을 하나의 긴 component로 연결하고 Labeling 과정을 통해 선택된다. 그리고 원본 이미지에서 문자의 baseline을 바탕으로 대상 영역에서 기울기를 검출한다. 실험결과를 통하여, 제안한 방법은 표나 그래프가 포함된 여러 종류의 문서 이미지에서 빠르고 정확한 기울기 값을 검출함을 확인할 수 있다.

  • PDF

대용량 텍스트를 위한 손실 없는 영상 은닉기술 (Simple Image Stenography Technology for Large Scale Text)

  • 이근무
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.1104-1107
    • /
    • 2008
  • 이미지 혹은 문서 은닉기술은 문서, 영상, 오디오 등 모든 종류의 디지털 데이터에 대하여 연구가 진행되고 있다. 이들은 다양한 목적과 용도로 이용되고 있다. 본 연구에서는 낮은 수준의 보안을 요하는 텍스트를 대용량으로 은닉하여 전달할 수 있는 단순하고 단순한 기법을 구현하였다. 먼저 텍스트 이미지를 결합하고 이를 24 비트 심도의 칼라이미지에 인코딩하여 복구하였다. 결과는 상관기법을 이용하여 분석하였으며 텍스트 이미지의 손실율이 미미한 것으로 판명되었다.