• 제목/요약/키워드: 문서영상

검색결과 381건 처리시간 0.032초

효과적인 이진화를 위한 영상개선기법의 정의 및 구현 (Definition and Implementation of Image Enhancement Techniques for Efficient Binarization)

  • 최경주;변혜란;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권2호
    • /
    • pp.284-296
    • /
    • 1999
  • 문자 인식 및 영상 인식 분야의 대부분의 연구들은 이진영상(binary image)을 바탕으로 이루어진다. 하지만, 입력영상에서 보다 많은 정보를 얻기 위해 명도영상(grayscale image) 으로 입력받아 필요한 정보를 추출한후 이진영상으로 변환하여 처리하는 방법도 많이 사용되고 있다. 이런 경우, 명도영상으로부터의 보다 깨끗한 이진영상의 획득 여부는 시스템의 성능과도 밀접한 관계가 있다. 본 논문에서는 기존의 대부분의 이진화 방법과는 달리, 실제 이진화를 수행하기 이전에 여러 가지 필터링 기법을 사용하여 영상의 질을 개선시키는 영상개선기법을 사용한후, 기존의 이진화방법을 사용하여 명도영상을 이진화하는 방법을 제안하고자 한다. 영상의 질을 개선시키기 위해서 BM 필터링, 경게선 개선 필터링, Erosion필터링 방법을 사용하였으며 , 기존의 이진화방법으로는 전역적 이진화 방법중 하나로써 클래스간 분산을 이용한 Ostu 방법[1]을 사용하였다. 다양한 종류의 문서를 대상으로 실험하였는데 평가실험에 사용된 영상은 문서 특성에 따라 균일하지 않은 배경을 가진 영상, 순수하게 텍스트로만 구성된 영상, 선성분이 많으며 명도값이 다양하게 나타나는 영상, 텍스트와 선성분이 함께있는 영상 등 크게 4가지 부류로 구분하였고, 평가대상 영상에 대해 매개변수의 개수, 끊어진/잃어버린 /뭉게진 물체가 적은 정도, 실행속도, 매개변수 결정의 용이성, 잡영이 적은 정도를 평가기준으로 선정한 후, 정량적인 평가가 어려운 항목에 대해서는 9개의 등급으로 나누어 이진화 된 영상의 특성을 분석, 평가하였다.

문서영상의 낱자 단위 언어 구분 (Language Identification of Character-level in Document Image)

  • 권세광;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.613-615
    • /
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

  • PDF

웹 기반 영상과 문서의 자동결합기법에 관한 연구 (A Study of Development on technique for document & image unite)

  • 나종원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.187-190
    • /
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

  • PDF

대표 Unigram 군집화를 통한 유사중복문서 검출 최적화 (The Optimization of Near Duplicate Detection Using Representative Unigram Grouping)

  • 권영현;윤도현;안영민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.291-293
    • /
    • 2012
  • SNS, 블로그의 이용이 늘어나면서, 문서의 복제와 재생산이 빈번하게 발생함에 따라 대용량 문서에서의 유사중복문서 검출이 큰 이슈로 제기되고 있다. 본 논문에서는 한국어 문서를 대상으로 이러한 문제를 해결하기 위해 품질을 유지하면서 신속하게 문서집합 중 유사중복문서를 검출하는 방법에 대해 제안한다. 제안하는 알고리즘에서는 문서를 대표하는 고빈도 Unigram Token을 활용하여 문서를 군집화함으로써 비교 대상을 최소화 하였다. 실험결과, 76만 문서에서 기존 방법 대비 평균 0.88의 Recall을 유지하면서도 중복을 검출하는데 있어서 십수초내에 처리가 가능함을 보였다. 향후 대용량 검색시스템 및 대용량 이미지, 동영상 유사중복 검출에도 활용할 수 있을 것으로 기대한다.

투영 프로파일의 간략화 방법을 이용한 인쇄체 한글 문서 영상에서의 문자 분할 (Character Segmentation on Printed Korean Document Images Using a Simplification of Projection Profiles)

  • 박상철;김수형
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.89-96
    • /
    • 2006
  • 본 논문에서는 한글 문서 영상에서의 문자 분할을 위한 2가지 알고리즘을 제안한다. 첫째는 투영 프로파일 기반 개선된 문자 분할 알고리즘이다. 이 알고리즘은 크게 문자수 추정, 분할 점 획득 및 문자 경계 탐색, 그리고 최적의 문자 분할 결과 선택으로 구성된다. 두 번째는 근접한 문자들이 서로 연결된 저 품질 문서 영상에 적합한 분할 알고리즘이다. 이 경우 연결요소를 제거하기 위해 투영 프로파일의 일부를 잘랐는데, 이를 ${\alpha}$-cut이라 한다. 그 후 전자의 방법을 변형하여 문자 분할을 수행한다. 다양한 폰트 속성을 갖고 품질이 낮은 43,572개의 한글 단어 영상을 대상으로 실험한 결과, 투영 프로파일 기반 개선된 문자 분할 알고리즘이 91.81%, 투영 프로파일에 ${\alpha}$-cut을 적용한 알고리즘이 99.57% 의 문자 분할 성공률을 나타내어 저 품질 한글 문서 영상에서 ${\alpha}$-cut을 이용한 문자 분할 알고리즘이 효과적임을 입증하였다.

HOG 기반의 적응적 평활화를 이용한 스캔된 하프톤 영상의 잡음 제거 (Noise Removal in Scanned Halftone Images using HOG-based Adaptive Smoothing)

  • 허규성;백열민;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.256-259
    • /
    • 2010
  • 본 논문에서는 적응적 평활화 필터를 이용한 스캔된 하프톤 문서의 하프톤 잡음 제거 방법을 제안한다. 하프톤 잡음은 잡음의 편차가 커서 에지 영역과 유사한 특성을 나타내므로 일반적인 에지 보존 평활화 필터를 적용할 경우에는 잡음 제거 효과가 떨어진다. 또한 인쇄물에 주로 사용되는 집중형 도트 방식의 하프톤은 컬러 영상에서 채널간의 간섭 현상으로 인해 모아레 패턴을 생성한다. 따라서 본 논문에서는 스캔된 하프톤 문서의 하프톤 잡음과 모아레 패턴을 효과적으로 제거하기 위해 하프톤 잡음의 방향성에 기반한 적응적 평활화 필터 방법을 제안한다. 하프톤 잡음의 경우 영상의 에지와 달리 등방성을 가지므로 영상을 블록 단위로 나누어 지배적인 에지의 크기와 방향성을 살핌으로써 적응적 평활화 필터를 구성할 수 있다. 실험 결과, 제안하는 방법은 다양한 인쇄 매체를 통해 생성된 하프톤 문서에 대하여 효과적으로 하프톤 잡음을 제거하면서도 영상의 에지를 보존하는 것을 확인할 수 있었다.

  • PDF

k-평균 클러스터링을 이용한 필기 문서 영상의 단어 분리법 (Word Segmentation Algorithm for Handwritten Documents based on k-means Clustering)

  • 류제웅;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.38-41
    • /
    • 2014
  • 본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.

  • PDF

문서 영상에서의 테이블 벡터화에 관한 연구

  • 심진보;김우성;박용범;오원근
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1995년도 제4회 멀티미디어 산업기술 학술대회 논문집
    • /
    • pp.177-182
    • /
    • 1995
  • 본 논문에서는 문서 인식 시스템에서 정확한 문서 인식의 기본이 되고 인식 결과에 중요한 영향을 미치는 전처리 알고리즘 중 테이블 입력의 효율적인 처리 방법을 연구한다. 테이블 내의 문자를 인식하기 위해서는 테두리선과 문자부분을 먼저 분리하는 작업이 필요하다. 왜냐하면, 테이블을 인식하기 위해서는 테두리선에 의해 블록화된 테두리선 안의 문자를 인식해야 하며 또한 테두리선을 효율적으로 벡터화하는 방법이 필요하다. 따라서 테이블을 벡터화하는 방법으로 8방향 체인 코드를 이용하여 테이블 선 성분을 추출하는 방법과 히스토그램을 이용하여 테이블의 수평, 수직 성분을 추출하여 얻어진 교차점을 이용하여 대각선 성분을 찾아내는 방법 및 화소의 run-length를 이용하여 수평, 수직 성분을 추출하여 얻어진 교차점을 이용해 대각선 성분을 찾아내는 방법 등이 있다. 본 논문에서는 문서 영상 내의 테이블을 효율적으로 벡터화하기 위한 방법을 연구한다.

  • PDF

비디오 문서의 구조 정보를 이용한 메타데이터 모델링에 관한 연구 (A study on Metadata Modeling using Structure Information of Video Document)

  • 권재길
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.10-18
    • /
    • 1998
  • 비디오 정보는 전자도서관이나 WWW 및 주문형 비디오(VOD) 시스템과 같은 다양한 분야에서 중요한 요소로 부각되고 있으며, 시청각적(audio-visual), 시공간적(spatial-temporal), 의미적(semantics) 정보를 모두 포함하고 있어 사용자에게 다양한 형태의 정보를 제공할 수 있다. 또한 대부분의 경우 비디오 문서 전체를 검색하는 대신 비디오의 원하는 장면만을 검색할 수 있는 기능이 요구되고 있다. 따라서 본 논문에서는 이러한 검색의 다양성을 지원하기 위해 계층적으로 구성되어 있는 동영상 문서의 구조 정보를 이용하여 메타데이터를 모델링하고, 이를 통하여 동영상 문서를 통합적으로 다룰 수 있는 데이터베이스 스키마를 설계한다.

  • PDF

OSD 메뉴 자동검증을 위한 작업스케줄링 및 패턴 인식 기법 (Job Scheduling and Pattern Recognition for Auto OSD Verification System)

  • 이진석;김호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.379-381
    • /
    • 2006
  • 본 연구는 디스플레이 제품의 OSD(On Screen Display) 메뉴의 문자 오류 검사 과정을 자동화하는 방법과 FMM 신경망을 이용한 실시간 문자인식 방법을 제안한다. 이는 일반적인 문자인식 문제와는 달리 시스템 환경에 대한 몇 가지 가정과 제약조건을 고려해야 한다. 예컨대 문제의 특성상 카메라 및 TV제어 기기부의 동작과 연동하는 작업 스케줄링 기능과 실시간 분석기능 등의 요건은 시스템개발을 복잡하게 하는 반면, 주어진 OSD 메뉴 데이터로부터 검증과정은 미지 패턴에 대한 인식과정을 단순화하여 일종의 판정(decision) 문제로 고려될 수 있게 한다. 본 연구에서는 디스플레이 제품의 OSD 메뉴와 같이 특수한 구조를 갖는 문서영상에 대한 논리적인 구조분석을 통해서 연속적인 문서영상을 발생시켜서 검증과정을 자동화하는 작업스케줄링 방법을 제안하고 인식의 방법론으로서 수정된 구조의 FMM신경망을 적용한다. 또한 실제 데이터를 사용한 실험결과를 통해 시스템의 유용성을 고찰한다.

  • PDF