• 제목/요약/키워드: Text Segmentation

검색결과 140건 처리시간 0.022초

문서의 효율적 영역 분할과 JBIG2 CODEC의 구현 (Implementation of JBIG2 CODEC with Effective Document Segmentation)

  • 백옥규;김현민;고형화
    • 한국통신학회논문지
    • /
    • 제27권6A호
    • /
    • pp.575-583
    • /
    • 2002
  • JBIG2는 2진 영상과 문서 압축을 위한 국제 표준이다. JBIG2 표준은 2진 영상과 문서를 고압축으로 부호화하기 위해 영역 특징에 따라 세 가지 부호화 모드를 제공한다. MMR이나 산술 부호화를 이용하여 비트맵(bitmap)의 부호화를 위한 제너릭 영역(Generic region) 부호화를 한다. 그리고, 텍스트 영역의 부호화를 위해 패턴 매칭(Pattern Matching) 부호화를 하고, 하프톤 영역(Halftone region) 부호화를 위해 하프톤 패턴 부호화(Halftone Pattern Coding)를 한다. 본 논문에서는 JBIG2 부호화를 위해 문서를 라인아트, 하프톤, 텍스트 영역으로 분할한 후 각 영역에 제너릭 영역 부호화, 심벌 매칭 부호화, 하프톤 패턴 부호화를 하는 JBIG2 CODEC을 구현하였다. 문서의 효율적 영역 분할을 위해 윤곽선 추출법을 이용한 영역분할 방법과 웨이브릿 계수분표를 이용한 영역 분할 방법을 함께 적용하여 facsimile 테스트 영상(IEEE-167a)의 경우 2% 정도의 압축률 개선과 주관적 화질의 향상을 얻었다. 또한 임의 모양 하프톤 영역의 부호화를 제안하여 기존 영역 분할 방법에서 인지할 수 없는 임의 모양 하프톤 영역 주변 텍스트의 주관적 화질을 개선하였다.

영역정보기반의 유전자알고리즘을 이용한 텍스트 후보영역 검출 (Detection of Text Candidate Regions using Region Information-based Genetic Algorithm)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.70-77
    • /
    • 2008
  • 본 논문은 화소 단위의 정보가 아닌 분할된 영역들의 정보를 기반으로 유전자 알고리즘을 이용한 텍스트 후보영역 검출방안을 제안한다. 먼저, 영상분할을 수행하기 위해 색상별 화소분류와 비동질적인 군집의 감소를 위한 영역 단위의 재분류 알고리즘을 수행한다. 색상별 화소분류에 이용되는 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘은 공간정보를 추가한 개선된 FCM 알고리즘으로써, 잡음에 강건한 특징을 가진다. EWFCM 알고리즘에 의해 분류된 화소들의 군집정보를 기반으로 수행되는 영역 단위의 재분류는 화소나 군집 단위의 재분류에 비해 효과적으로 영상에 존재하는 비동질적인 군집들을 감소시킬 수 있다. 그리고 텍스트 후보영역 검출은 분할된 영역들로부터 추출한 방향성 에지 성분에 대한 분산값 및 에너지, 크기, 개수 등의 정보를 기반으로 유전자알고리즘에 의해 수행된다. 이는 화소 단위의 정보를 이용한 방법보다 더 명확한 텍스트 영역정보를 획득할 수 있으며, 향후 자동문자인식에서 좀 더 손쉽게 이용될 수 있다. 실험 결과 제안한 분할방법은 기존 방법이나 화소나 군집 기반의 재분류보다 좋은 결과를 보였으며, 텍스트 후보영역 검출에서도 화소 단위의 정보를 이용한 기존 방법보다 더 좋은 결과를 보여 제안방법의 유효성을 확인하였다.

스크린 이미지 부호화를 위한 에지 정보 기반의 효과적인 형태학적 레이어 분할 (Effective Morphological Layer Segmentation Based on Edge Information for Screen Image Coding)

  • 박상효;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.38-47
    • /
    • 2013
  • 다중 레이어 영상 모델인 Mixed Raster Content 모델 (MRC) 기반의 영상 부호화는 스크린 이미지와 같은 혼합 영상을 전경 레이어, 이진 마스크 레이어, 배경 레이어로 재구성한 뒤, 각 레이어마다 그 레이어의 신호 특성에 적합한 부호화기를 이용하여 영상을 압축하는 기법이다. 문자와 같은 계단 형태의 강한 에지를 갖는 영역의 위치 정보를 마스크 레이어에 저장하고, 그 위치의 색상 신호는 전경 레이어에 저장한다. 그리고 나머지 영역인 배경 영역의 색상 신호는 배경 레이어에 저장한다. 따라서 마스크 레이어가 전경과 배경의 분할 정보를 담게 되며, 이 분할 정보의 정확도에 따라 전체 부호화기의 압축 효율이 직접적인 영향을 받는다. 본 논문은 MRC 기반의 영상 부호화를 위한 새로운 레이어 분할 알고리즘을 제안한다. 제안 방법은 형태학적 필터인 top hat 변환을 이용하여 문자를 배경신호로부터 분할한다. 이때 문자의 경계를 에지 맵으로부터 추정하여 문자 색상과 배경과의 상대적 밝기를 결정하고 이를 통해 형태학적 필터링에 필요한 top hat 변환의 종류를 정확히 선택하도록 하였다. 실험을 통해 제안 방법이 비교 대상 알고리즘에 비해 우수한 분할 성능을 가짐을 보인다.

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF

Research on Keyword-Overlap Similarity Algorithm Optimization in Short English Text Based on Lexical Chunk Theory

  • Na Li;Cheng Li;Honglie Zhang
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.631-640
    • /
    • 2023
  • Short-text similarity calculation is one of the hot issues in natural language processing research. The conventional keyword-overlap similarity algorithms merely consider the lexical item information and neglect the effect of the word order. And some of its optimized algorithms combine the word order, but the weights are hard to be determined. In the paper, viewing the keyword-overlap similarity algorithm, the short English text similarity algorithm based on lexical chunk theory (LC-SETSA) is proposed, which introduces the lexical chunk theory existing in cognitive psychology category into the short English text similarity calculation for the first time. The lexical chunks are applied to segment short English texts, and the segmentation results demonstrate the semantic connotation and the fixed word order of the lexical chunks, and then the overlap similarity of the lexical chunks is calculated accordingly. Finally, the comparative experiments are carried out, and the experimental results prove that the proposed algorithm of the paper is feasible, stable, and effective to a large extent.

공간 정보와 투영 프로파일을 이용한 문서 영상에서의 타이틀 영역 추출 (Automatic Title Detection by Spatial Feature and Projection Profile for Document Images)

  • 박효진;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.209-214
    • /
    • 2010
  • 본 논문은 형태 처리기법과 연결요소 분석을 이용한 문서 영상의 분할과 구조적인 특징과 투영 프로파일 분석을 이용하여 문서영상에서 제목영역 추출방안을 제안한다. 문서 영상의 처리는 영상 분할과 제목 추출, 두 단계로 이루어진다. 영상 분할의 단계에서는 문서 영상을 구성요소 영역들로 나눈다. 영상 분할이 끝나면 분할된 영역들을 대상으로 구조적인 정보를 이용하여 제목이 될 후보 영역을 추출한다. 제목이 아닌 영역을 제거하여 제목 후보영역을 추출하고 난 후 투영 프로파일을 분석하여 제목 영역을 최종적으로 추출한다. 본 논문에서 제시된 투영 프로파일 분석을 이용한 제목 추출 방법은 다양한 문서 영상의 분할 및 제목 추출 결과를 보였으며, 문서 제목 인식, 멀티미디어 데이터 검색, 실시간 영상처리와 같은 다양한 응용분야에 활용될 것으로 기대된다.

구문 분석의 결과로 나타나는 구조의 모호성을 해결하기 위한 방법 연구 (A Study of Disambiguation Method To Improve The Syntactic Analysis System)

  • 박용욱
    • 한국산학기술학회논문지
    • /
    • 제16권4호
    • /
    • pp.2764-2769
    • /
    • 2015
  • 본 논문에서는 형태소 단위의 입력요소에 대해 의존규칙을 적용하여 가능한 모든 구분분석 구조를 생성할 수 있는 알고리즘을 적용한 구문분석기를 구현하였다. 따라서 형태소의 수가 증가함에 따라 생성되는 구문분석 트리의 개수가 기하급수적으로 증가할 수 있다. 이를 해결하기 위하여 본 논문에서는 주어진 문장에 대해 문장의 기본 구성요소들에 대하여 구간을 나누고, 나누어진 구간에서 최대연결단위를 구성하였다. 최대연결단위는 한 구간에 존재하는 모든 형태소가 결합된 것을 의미한다. 입력되는 문장에 따라서 한 구간에 하나 이상의 최대연결단위가 구성될 수 있다. 중학교 교과서에서 임의로 추출한 10어절 이내의 516문장에 대하여 실험한 결과 제안한 방법을 사용하지 않은 방법에 비해 약 28%의 개선효과가 있었다.

전화망을 위한 어구 종속 화자 확인 시스템 (Text-dependent Speaker Verification System Over Telephone Lines)

  • 김유진;정재호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.663-667
    • /
    • 1999
  • In this paper, we review the conventional speaker verification algorithm and present the text-dependent speaker verification system for application over telephone lines and its result of experiments. We apply blind-segmentation algorithm which segments speech into sub-word unit without linguistic information to the speaker verification system for training speaker model effectively with limited enrollment data. And the World-mode] that is created from PBW DB for score normalization is used. The experiments are presented in implemented system using database, which were constructed to simulate field test, and are shown 3.3% EER.

  • PDF

Text Extraction from Complex Natural Images

  • Kumar, Manoj;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제6권2호
    • /
    • pp.1-5
    • /
    • 2010
  • The rapid growth in communication technology has led to the development of effective ways of sharing ideas and information in the form of speech and images. Understanding this information has become an important research issue and drawn the attention of many researchers. Text in a digital image contains much important information regarding the scene. Detecting and extracting this text is a difficult task and has many challenging issues. The main challenges in extracting text from natural scene images are the variation in the font size, alignment of text, font colors, illumination changes, and reflections in the images. In this paper, we propose a connected component based method to automatically detect the text region in natural images. Since text regions in mages contain mostly repetitions of vertical strokes, we try to find a pattern of closely packed vertical edges. Once the group of edges is found, the neighboring vertical edges are connected to each other. Connected regions whose geometric features lie outside of the valid specifications are considered as outliers and eliminated. The proposed method is more effective than the existing methods for slanted or curved characters. The experimental results are given for the validation of our approach.

문자 영역을 강조하기 위한 적응적 오차 확산법 (Adaptive Error Diffusion for Text Enhancement)

  • 권재현;손창환;박태용;조양호;하영호
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.9-16
    • /
    • 2006
  • 본 논문에서는 최대 기울기 차이(maximum gradient difference, MGD)를 이용한 효과적인 문자 분할과 문자 영역을 강조하기 위한 적응적 오차 확산법을 제안한다. 스캔 라인을 따라 기울기를 계산하고, 잠재적 문자 영역을 융합하기 위해 국부적 윈도우 내에 MGD 값을 채운다. 노이즈 필터링을 거친 후, 배경에는 기존 오차 확산법, 문자에는 경계 향상 오차 확산법을 적용한다. 서로 다른 하프토닝 알고리즘의 사용으로 눈에 거슬리는 결함이 발생하기 때문에 경계 결함을 줄이기 위해 단계적 팽창(gradual dilation)을 적용한다. 단계적으로 팽창된 문자 영역(gradually dilated to저 region, GDTR)에 기반한 샤프닝(sharpening)은 문자 영역의 경계에서 연속적으로 점이 찍히는 것을 막을 수 있다. 제안한 적응적 오차 확산법은 일반적인 오차 필터를 이용하여 경계 향상 정도를 조절할 수 있는 칼라 하프토닝 방법이다. 경계 향상 정도와 색차를 분석하여 경계 향상 계수를 정하고, 경계 향상 오차 확산법의 사용으로 인해 점이 찍히지 않는 결함을 줄이기 위하여 추가적인 오차 요소를 반영하였다. 스캔한 영상을 제안한 방법을 이용하여 하프토닝하면 배경의 변화 없이 문자 부분이 선명한 결과를 얻을 수 있다.