• 제목/요약/키워드: 문자영역 추출

검색결과 288건 처리시간 0.022초

다중색상 모델과 문자배치 정보를 이용한 복잡한 배경 영상에서의 자동차 번호판 추출 (A License Plate Detection Method Using Multiple-Color Model and Character Layout Information in Complex Background)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1515-1524
    • /
    • 2008
  • 본 논문에서는 복잡한 배경이 나타나는 자동차 영상에서 다중색상 모델과 문자배치 정보를 이용한 번호판 추출 방법을 제안한다. 녹색 번호판과 흰색 번호판에 나타나는 문자의 배치 형태가 다르기 때문에, 먼저 번호판 색상을 추정한 후 해당 색상 번호판의 문자배치 정보를 최대한 활용하는 접근 방식을 사용하였다. RGB 색상 모델에 HSI와 YIQ 색상 모델을 결합한 다중색상 모델을 이용하여 녹색 영역이 추출되면, 해당 영역에서 추출된 연결요소를 분석하여 녹색 번호판의 문자배치 형태를 탐색한다. 이때 번호판이 추출되지 않으면, 전체 영역에서 추출된 연결요소를 분석하여 흰색 번호판의 문자배치 형태를 탐색한다. 마지막으로 번호판 문자배치 형태와 유사한 연결요소들을 묶어 번호판을 추출한다. 4개 영상에 대한 실험 결과 98.1%의 번호판 추출 성공률을 얻었으며, 제안된 방법이 빛의 세기, 그림자, 그리고 날씨의 변화에도 강건함을 알 수 있었다.

  • PDF

Client/Server 구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Localization System Using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2004
  • PDA에서 사용하는 대부분의 CPU는 실수 연산 구성요소(float computation component)가 없는 정수(integer) CPU를 사용한다. 인공 신경망(neural network)과 같은 실수 연산이 많은 알고리즘은 PDA에서 많은 수행시간을 가진다. 본 논문에서는 이런 단점을 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/Server(PC) 구조를 이용한 효과적인 문자 추출 시스템을 제안한다. Client(PDA)는 대략적인 문자 추출 결과를 JPEG으로 압축하여 전송속도를 최소화한다. Server(PC)는 Client(PDA)의 결과를 바탕으로 정밀한 문자 영역 추출을 위해, 텍스춰 분류 방법과 연결 성분 분석 방법을 이용한다. 실험에서 제안한 방법은 속도뿐만 아니라 문자 추출에서도 효과적이었다.

  • PDF

손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화 (Documentation of Printed Hangul Images of the Selected Area by Finger Movement)

  • 백승복;손영선
    • 한국지능시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.306-310
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글 영상을 편집 가능 한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손 영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트 럼으로 손가 락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출 된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다.

비디오 자막 추출 기법에 관한 연구 (Extraction of open-caption from video)

  • 김성섭;문영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2001
  • 본 논문에서는 동영상으로부터 색상, 서체, 크기와 같은 사전 지식 없이도 글자/자막을 효율적으로 추출하는 방법을 제안한다. 해상도가 낮고 복잡한 배경을 포함할 수 있는 비디오에서 글자 인식률 향상을 위해 먼저 동일한 텍스트 영역의 존재하는 프레임들을 자동적으로 추출한 후 이들의 시간적 평균영상을 만들어 향상된 영상을 얻는다. 평균영상의 외각선 영상의 투영 값을 통해 문자영역을 찾고 각 텍스트 영역에 대해 1차 배경제거 과정인 region filling을 적용하여 글자의 배경들을 제거 함으로써 글자를 추출한다. 1차 배경제거의 결과를 검증하고 추가적으로 k-means를 이용한 color clustering을 적용하여 남아있는 배경들을 효율적으로 제거 함으로써 최종 글자영상을 추출한다.

  • PDF

개선된 퍼지 RBF 네트워크를 이용한 여권 인식 (Recognition of the Passport by Using Enhanced Fuzzy RBF Networks)

  • 류재욱;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.147-152
    • /
    • 2003
  • 출입국 관리 시스템은 위조 여권 소지자, 수배자, 출입국 금지자 또는 불법 체류자 등의 출입국 부적격자를 검색하여 출입국자를 관리하고 있다. 이러한 출입국 관리 시스템은 위조 여권 판별이 중요하므로 위조 여권을 판별하는 전 단계로 퍼지 RBF 네트워크 제안하여 여권을 인식하는 방법을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다. 추출된 문자열 영역을 사다리꼴 타입의 소속 함수를 이용한 퍼지 이진화 방법을 제안하여 이진화하고 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM 마스크를 적용한 후에 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크를 제안하여 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권영상을 대상으로 실험한 결과, 제안된 방법이 여권 인식에 우수한 성능이 있음을 확인하였다.

  • PDF

모폴로지을 이용한 비디오 영상에서의 자동 문자 추출 (Automatic Text Extraction in Video Images using Morphology)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.418-420
    • /
    • 2001
  • 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 본 논문에서는 일차적으로 입력 컬러 영상을 그레이 영상으로 변환한 후 입력 영상의 명암 대비를 강화시키기 위해 명암 대비 스트레칭을 적용한다. 이후 명암 대비 스트레칭된 영상의 분할을 위해 적응적 임계값을 적용하고 다음 단계에서 문자와 유사한 영역들을 적당한 크기 의 structuring element를 이용하여 제거하는 1차 하부 단계와 모폴로지 녹임(erosion)을 적용한 영상과 모폴로지(열림닫힘[OpenClose]+닫힘열림[CloseOpen])/2가 적용된 영상 사이의 차이 영상을 구하는 2차 하부 단계를 적용시킨다. 마지막 단계에서 각 후보 영역들 중 실제 자막 영역을 추출해내기 위해, 후보 문자 영역의 화소수 비율과 외곽선의 화소수의 비율, 그리고 장축과 단축간의 비율 등에 대해 필터링을 적용한다. 본 논문에서는 임의의 300개의 뉴스영상을 입력 값으로 실험한 결과 93.6%의 우수한 인식률을 얻을 수 있었다. 또한 본 논문에서 제안한 방법은 structuring element의 크기 조절을 통해 크기가 다른 다양한 이미지에서도 좋은 성능을 거둘 수 있다.

  • PDF

Mean Shift 알고리즘을 이용한 효율적인 문자 추출 (An Efficient Text Location using Mean Shift Algorithm)

  • 정기철;김광인;한정현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.123-126
    • /
    • 2001
  • 영상내의 문자 정보는 색인에 필요한 유용한 정보를 제공하므로, 이를 이용한 멀티미디어 데이터의 인덱싱기법이 최근 많이 연구되고 있다. 본 논문은 mean shift 알고리즘을 이용한 텍스춰 기반의 문자 영역 추출 방법을 제안한다. 다양한 크기와 모양의 문자에 적응성을 가지는 필터를 만들기 위해 신경망을 이용한다. 문자 영역의 위치와 크기는 문자 확률 영상상에서 mean shift 알고리즘을 이용하여, 국소 탐색만으로 별도의 후처리 과정 없이 기존의 문자 추출 방법보다 우수한 성능을 보인다.

  • PDF

저해상도 카메라를 이용한 차량번호판의 추출 (Vehicle License Plate Extraction using Low Resolution Camera)

  • 구경모;김하영;안명석;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.802-804
    • /
    • 2004
  • 번호판 인식시스템의 개발에 있어서 번호판 영역의 추출단계는 시스템의 성능에 큰 영향을 미치는 단계이며 문자인식단계 이상으로 중요하다. 본 논문에서는 웹 카메라를 이용하여 얻어진 저해상도 영상으로부터 번호판 고유의 색상과 텍스쳐를 이용하여 번호판영역을 추출하고, 허프변환을 이용한 기울어진 영상의 회전을 통해 번호판 문자 영역화 및 인식에 용이한 차량번호판 영상을 추출하는 기법을 제안한다.

  • PDF

코호넨 알고리즘을 이용한 자동차 번호판 인식 (Recognition of Car License Plate using Kohonen Algorithm)

  • 임은경;허남숙;김광백
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.896-901
    • /
    • 2000
  • 차량 번호판 인식 시스템은 크게 번호판 영역의 추출과 인식 단계로 구분된다. 본 논문에서는 전처리단계로써 임계화 방식을 이용하여 번호판 영역을 추출한다. 차량 영상을 임계화하고 영상에서 발생되는 잡음을 제거한다. 잡음이 제거된 차량 영상에서 각 라인의 밀도비율을 계산하여 번호판 영역에서 나타나는 밀도의 비율과 비슷하게 나타나는 영역을 후보영역으로 설정한다. 설정된 후보영역이 번호판 영역의 특징과 유사하게 나타나는 부분을 추출한다. 그리고 추출된 번호판 영역은 코호넨 알고리즘의 2${\times0}$2마스크에 적용시켜서 윤곽선을 추출하고, 번호판의 문자와 숫자를 인식한다. 코호넨 알고리즘의 2${\times0}$2마스크를 이용하게 되면, 윤곽선의 잡음을 최대한으로 줄여주는 특성을 가진다. 잡음이 제거된 후에, 번호판의 문자와 숫자들을 코호넨 알고리즘을 이용하여 인식하였다. 실험 결과에서는 임계화 작업을 이용한 번호판 추출과 코호넨 알고리즘을 이용한 번호판 인식이 우수하는 것을 알 수 있다.

  • PDF

비디오 영상 정보 검색을 위한 문자 추출 및 인식 (Caption Detection and Recognition for Video Image Information Retrieval)

  • 구건서
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권7호
    • /
    • pp.901-914
    • /
    • 2002
  • 본 논문에서는 비디오에서 입력된 영상으로부터 내용기반 검색을 위해 자동으로 자막을 추출하여 특징 추출을 기반의 단층 연결 신경망 인식기(FE-MCBP)에 의해 자막 문자를 인식하여 영상 자막의 내용을 검출하는 방법을 제시하였다. 비디오에서 자막 추출은 먼저, 비디오에서 일정한 시간 간격으로 획득한 프레임 중에서 히스토그램 분석을 통하여 키 프레임을 찾는 과정을 수행하며, 그 다음에 각각의 키 프레임에 대하여 칼라 세그먼테이션 후 라인 검사 방법 통하여 자막 영역을 추출하도록 하였다. 마지막으로 추출된 자막영역에서 개별문자를 분리하였다. 본 연구에서는 칼라 히스토그램을 분석 후 지역 최대값을 이용하여 세그먼테이션 후 라인 검사를 수행함으로써 처리 속도와 자막영역 검출의 정확도를 개선하였다. 비디오에서 자막 추출은 비디오 정보를 멀티미디어 데이터베이스화하는 초기 단계로 추출된 자막은 바로 문자 인식기의 입력이 된다. 또한 인식된 자막정보는 데이터베이스로 구축되며 내용기반 검색 기법에 의해 검색되도록 하였다.

  • PDF