• 제목/요약/키워드: 문자열 영역

검색결과 73건 처리시간 0.029초

수취인 주소 영역의 영상매칭에 기반 한 유사 우편물 추출 방법 (Postal Image Filtering Method based on ROI Image Matching)

  • 정창부;박상철;손화정;김수형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.793-795
    • /
    • 2004
  • 우편물을 배달순서대로 정렬하는 과정을 순로구분이라고 하는데, 우편물의 처리과정에서 가장 많은 시간이 소요되는 부분이 바로 이 순로구분 과정이다. 우정선진국의 순로구분 자동화 시스템은 바코드를 이용하여 순로구분를 자동으로 처리하고 있지만, 국내의 시스템은 순로구분의 전 단계까지만 수행하고 나머지 과정은 배달원이 자신의 경험에 의해 수작업으로 처리하고 있다. 본 논문에서는 우편물을 자동 검증하는 방법으로 바코드 대신에 우편영상 특징기반의 Virtual ID 사용을 위한 유사한 우편영상 추출방법을 제안한다. 제안 방법은 질의영상과 후보영상간의 유사성을 판별할 때, 각 영상의 수취인 영역에서 추출된 문자열 Bounding Box들의 대응되는 쌍을 결정하고 그 쌍들의 영역이 겹치는 정도를 유사도로 측정하는 방법이다 291개의 우편영상에 대하여 실험한 결과, 289개의 영상이 정상적으로 유사한 우편영상으로 추출되었다. 또한, 유사한 우편영상으로 추출된 영상의 평균개수는 3.78개로 비교적 높게 나왔지만 이는 실험 데이터에 동일 DM 발송 우편물이 연속적으로 위치한 경우가 많았기 때문이다.

  • PDF

모폴로지 연산을 이용한 문서 이미지의 고속 기울기 검출 기법 (Fast Skew Detection of Document Image Using Morphological Operation)

  • 신명진;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.796-799
    • /
    • 2006
  • 본 논문은 스캔한 문서 및 전자 문서 등과 같은 문서 이미지에서의 기울기를 검출하는 기법을 제안하고 있다. 제안한 알고리즘은 처리 속도 향상을 위해 일정 비율로 축소된 이미지를 사용한다. 하지만 여전히 문서 전체를 대상으로 기울기를 검출하는 것은 많은 계산량을 요구하므로 대상영역(ROI)을 선택한다. 대상 영역은 모폴로지 연산을 통해 문자열을 하나의 긴 component로 연결하고 Labeling 과정을 통해 선택된다. 그리고 원본 이미지에서 문자의 baseline을 바탕으로 대상 영역에서 기울기를 검출한다. 실험결과를 통하여, 제안한 방법은 표나 그래프가 포함된 여러 종류의 문서 이미지에서 빠르고 정확한 기울기 값을 검출함을 확인할 수 있다.

  • PDF

CCD 기반 바코드 관심대상영역 고속 추출에 관한 연구 (A Study on the High-Speed Extraction of Bar Code ROI based on the CCD)

  • 박문성;최호석;김진석;김혜규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1103-1106
    • /
    • 2002
  • 현재, 컨베이어 벨트시스템에 소포를 직재하고, 우편번호를 운영자가 입력하여 구분한다. 구분된 소포 중에서 기록관리 대상의 경우에는 바코드를 판독하여 처리하고 있다. 이에 따라, 본 논문에서는 2m/sec 이내로 이송되는 소포를 라인 CCD(Charged Coupled Device) 카메라에 의해 이미지 획득한 후, 바코드 ROI 추출 방법을 위해 $32{\times}32$ 미세블룩 검사 방법을 적용하였다. ROI 추출 절차는 최대-최소 차이값과 동적 인계값 기준으로 바탕면 제거, 문자열과 바코드 영역을 판단하기 위한 대각선(diagonal) 검사방법 적용, 바코드 영역인지 검증하기 위해 수평으로 5 라인을 검사하고 에지의 수와 폭의 변화량 비교 등의 과정으로 수행하였다. 그리고 바코드 ROI 추출은 레이블링 과정에 의해 바코드 영역의 보정과 그룹크기 비교에 의한 ROI 영역의 구체화와 정보 해석을 위하여 ROI 외곽좌표 8개중에서 가장 간 중심축 라인으로 생성하는 방법 등을 적용하였다. ROI 추출과 중심축 시험결과에 의하면 $50{\sim}180msec$이내에 가능하게 되었다. 그리고, ROI 추출의 정확도는 99.994% 이상을 만족한다.

  • PDF

신경망과 그래픽 기법을 이용한 심전도 결과지 이미징 시스템 (An ECG Document Imaging System based on Neural Network and Graphic Techniques)

  • 김진상;최상열;배인호;김윤년
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.269-272
    • /
    • 2006
  • 병원의 각종 측정 장비에서 출력되는 결과지나 의사들이 작성한 기록지를 스캔하여 이미지형태로 저장하는 이미징 시스템 개발이 크게 요구되고 있다. 본 논문에서는 신경망과 그래픽 기법을 사용하여 대학병원 심전도실에서 사용되는 여섯 종류의 심전도 출력지를 이미지 형태로 저장하고 검색하는 이미징 시스템의 설계와 구현에 대해 논하였다. 구현된 시스템은 여섯 종류의 심전도 출력지를 분류하고, 분류된 각 출력지에 인쇄된 중요한 측정 데이터를 인식하여 데이터베이스에 저장한다. 심전도 출력지의 분류는 각 샘플 서식들의 평균 히스토그램을 구한 다음 새로운 출력지가 들어올 때 평균 히스토그램과의 거리가 가장 가까운 출력지로 분류하는 nearest-neighbor 방법을 사용하였다. 출력지에 인쇄된 데이터의 인식을 위해 먼저 XML로 작성한 출력지별 추출 정보를 기반으로 스캔한 이미지의 영역 분할 작업을 수행한다. 분할된 영역들은 신경망을 이용해 문자 인식을 하고, 인식된 문자들이 데이터베이스의 해당 속성값으로 저장된다. 스캔한 출력지는 의사들이 주석을 붙이거나 조건 검색을 위해 이미지 형태로 저장된다.

  • PDF

국부적 명암도 대비를 이용한 자동차 번호판 검출 기법 (A Method of Detecting Car Number Plate Using Local Intensity Contrast)

  • 김재도;한영준;한헌수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.181-184
    • /
    • 2009
  • 본 논문은 번호판 내 명암도 대비를 이용한 자동차 번호판 검출 기법을 제안한다. 평균값 필터와 라플라시안 필터를 사용하여 영상의 잡음을 제거하는 동시에 에지 성분을 향상시킨 후 조명 환경 변화에 강인한 번호판 내 명암도 대비 특징을 이용하여 문자 후보를 검출한다. 다음으로 검출된 문자 후보가 열을 이루는 텍스트 후보를 검출하고, 이 영역을 Otsu 이진화 기업을 사용하여 x축에 투영하였을 시 나타나는 패턴을 평가함으로써 최종적으로 자동차 번호판을 검출하게 된다. 제안하는 기법의 성능을 평가하기 위해 다수의 데이터를 사용하여 실험하였고, 이를 분석하여 제안하는 기법의 우수성을 검증하였다.

  • PDF

서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선 (Video character recognition improvement by support vector machines and regularized discriminant analysis)

  • 임수열;백장선;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.689-697
    • /
    • 2010
  • 본 연구에서는 비디오이미지로부터 추출된 텍스트영역으로부터 문자인식을 수행하였다. 비디오영상으로부터 추출된 문자열은 한글, 영어, 숫자, 특수문자 등으로 혼합되어 있거나, 또는 다양한 폰트와 크기, 그래픽 형태의 글자 존재, 영상의 기울어짐, 끊김, 잡영, 접촉, 저해상도의 글자 등으로 인하여 일반적인 문자인식에 비해 많은 어려움이 존재한다. 이와 같은 어려움을 극복하기위해 본 연구에서는 모든 글자에 대해서 인식하지 않고 가장 빈번하게 등장하는 글자만을 인식하고 나머지는 버리는 방법을 사용하였으며 지지도벡터기계와 정칙화판별분석의 2단계 문자인식 방법을 이용하여 인식률을 개선하였다. 또한 인식률이 좋지 못한 4형식과 5형식 글자에 대해 모음별로 중분류를 실시하였다. 실험결과 지지도벡터기계와 정칙화판별분석을 동시에 사용하는 방법이 다른 문자인식의 방법들보다 인식률이 우수하였으며, 부분적인 중분류의 방법을 이용한 경우 향상된 인식 성능을 나타냈다.

그리드 시스템에서 텍스트 파일 영역 관리 (Text File Region Management on Grids)

  • 김승민;유석인;김일곤
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권7호
    • /
    • pp.499-507
    • /
    • 2007
  • 프로그래밍 언어에서 변수를 사용하여 메모리의 특정 영역을 접근하는 것처럼, 텍스트 파일의 특정 영역도 문자열 이름을 가지는 변수로 표현하여 해당 영역의 값을 읽고 수정할 수 있는 텍스트 파일 인터페이스를 지원할 수 있다. 이것을 CAE, CAD, CAO 통합 자동화 시스템 분야에서는 파일 랩핑 (File Wrapping) 이라 한다. 파일 랩핑은 CAE, CAD, CAO 통합 자동화의 핵심 기술 중 하나이면서, 파일의 크기와 영역의 개수 및 분포에 따라서 통합 자동화 시스템의 실행 속도에 큰 영향을 미친다. 본 논문에서는 파일 랩핑의 핵심 기능을 일반화한 텍스트 파일 영역 관리 모델을 정의하고, 이를 그리드 서비스로 구현한 프로토타입의 구조를 설명한다. 그리고 구현된 프로토타입의 실행 결과 분석을 통하여, 제안된 모델과 텍스트 파일 영역 관리 서비스의 효용성을 검증한다.

부호 영역 DNA 시퀀스 기반 강인한 DNA 워터마킹 (Robust DNA Watermarking based on Coding DNA Sequence)

  • 이석환;권성근;권기룡
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.123-133
    • /
    • 2012
  • 본 논문에서는 DNA 시퀀스의 불법 복제 및 변이 방지와 개인 정보 침해 방지, 또는 인증을 위한 DNA 워터마킹에 대하여 논의하며, 변이에 강인하고 아미노산 보존성을 가지는 부호영역 DNA 시퀀스 기반 DNA 워터마킹 기법을 제안한다. 제안한 DNA 워터마킹은 부호 영역의 코돈 서열에서 정규 특이점에 해당되는 코돈들을 삽입 대상으로 선택되며, 워터마크된 코돈이 원본 코돈과 동일한 아미노산으로 번역되도록 워터마크가 삽입된다. DNA 염기 서열은 4개의 문자 {A,G,C,T}로 (RNA은 {A,C,G,U}) 구성된 문자열이다. 제안한 방법에서는 워터마킹 신호처리에 적합한 코돈 부호 테이블을 설계하였으며, 이 테이블에 따라 코돈 서열들을 정수열로 변환한 다음 원형 각도 형태의 실수열로 재변환한다. 여기서 코돈은 3개의 염기들로 구성되며, 64개의 코돈들은 20개의 아미노산으로 번역된다. 선택된 코돈들은 아미노산 보존성을 가지는 원형 각도 실수 범위 내에서 인접 코돈과의 원형 거리차 기준으로 워터마크에 따라 변경된다. HEXA와 ANG 시퀀스를 이용한 $in$ $silico$ 실험을 통하여 제안한 방법이 기존 방법에 비하여 아미노산 보존성을 가지면서 침묵 변이와 미스센스 변이에 보다 강인함을 확인하였다.

연결특성함수를 이용한 문서화상에서의 영역 분리와 문자열 추출 (Segmentation of region strings using connection-characteristic function)

  • 김석태;이대원;박찬용;남궁재찬
    • 한국통신학회논문지
    • /
    • 제22권11호
    • /
    • pp.2531-2542
    • /
    • 1997
  • This paper describes a method for region segmentation and string extractionin documents which are mixed with text, graphic and picture images by the use of the structural characteristic of connceted components. In segmentation of non-text regionas, with connection-characteristic functions which are made by structural characteristic of connected components, segmentation process is progressed. In the string extraction, first we organize basic-unit-region of which vertical and horizontal length are 1/4 of average length of connection components. Second, by merging the basic-unit-regions one other that have smaller values than a given connection intensity threshold. Third, by linking the word blocks with similar block anagles, initial strings are cresed. Finally the whold strings are generated by merging remaining word blocks whose angles are not decided, if their height and prosition are similar to the initial strings. This method can extract strings that are neither horizontal nor of various character sizes. Through computer exteriments with different style documents, we have shown that the feasibility of our method successes.

  • PDF

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.