• 제목/요약/키워드: 문자패턴

검색결과 297건 처리시간 0.023초

문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에세 텍스트 영역 추출 (Text Region Extraction Using Pattern Histogram of Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;전병민
    • 한국산학기술학회논문지
    • /
    • 제7권6호
    • /
    • pp.1167-1174
    • /
    • 2006
  • 자연이미지로부터 텍스트 영역 추출은 자동차 번호판 인식 등과 같은 많은 응용프로그램에서 유용하다. 따라서 본 논문은 문자-에지 맵의 패턴 히스토그램을 이용한 텍스트 영역을 추출하는 방법을 제안한다. 16종류의 에지맵을 생성하고, 이것을 조합하여 문자 특징을 갖는 8종류 문자-에지 맵 특징을 추출한다. 문자-에지 맵의 특징을 이용하여 텍스트 후보 영역을 추출하고, 텍스트 후보 영역에 대한 검증은 문자-에지 맵의 패턴 히스토그램 및 텍스트 영역의 구조적 특징을 이용하였다. 실험결과 제안한 방법은 복잡한 배경, 다양한 글꼴, 다양한 텍스트 컬러로 구성된 자연이미지로부터 텍스트 영역을 효과적으로 추출하였다.

  • PDF

네트워크 침입 탐지 시스템에서 고속 패턴 매칭기의 설계 및 구현 (Design and Implementation of High-Speed Pattern Matcher in Network Intrusion Detection System)

  • 윤여찬;황선영
    • 한국통신학회논문지
    • /
    • 제33권11B호
    • /
    • pp.1020-1029
    • /
    • 2008
  • 본 논문은 네트워크 침입 탐지 시스템에서 고속 패턴 매칭 알고리듬과 그 구조를 제안한다. 제안된 알고리듬은 실시간 입력 패킷에서 특정 패턴을 검사하며 정확한 문자열, 문자열 값의 범위, 그리고 문자열 값의 조합 등을 검색한다. 본 연구에서는 입력 패킷과 패턴은 동시에 겹치는 문자열들을 검색하기 위해 상태 전이 그래프로 모델링 하였으며 상태 전이 그래프는 구현 복잡도를 줄이기 위해 입력 임플리컨트 단위로 분할하였다. 제안된 패턴 매칭구조는 상태 전이 그래프와 입력된 문자열을 입력으로 사용한다. 제안된 패턴 매칭기는 VHDL 언어로 모델링하여 구현하였으며, 성능 분석을 통하여 제안된 기법의 적절성을 검증하였다.

색상 단순화와 윤곽선 패턴 분석을 통한 이미지에서의 글자추출 (Text extraction in images using simplify color and edges pattern analysis)

  • 양재호;박영수;이상훈
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.33-40
    • /
    • 2017
  • 본 논문은 이미지에서 효과적인 문자검출을 위해 색상단순화 및 윤곽선에서의 패턴 분석을 통한 문자 검출방법을 제안한다. 윤곽선 기반방법을 사용하는 문자검출 알고리즘은 단순한 배경의 이미지에서는 우수한 성능을 보이지만, 복잡한 배경의 이미지에서는 성능이 떨어지는 단점이 있다. 따라서 제안하는 방법은 복잡한 배경에서의 비문자영역을 최소화하기 위해 이미지 단순화 및 패턴분석을 통한 문자 검출 알고리즘을 제안한다. 먼저 이미지에서의 문자영역 부분을 검출하기 위하여 전처리 과정으로 K-means 군집화를 사용하여 이미지의 색상을 단순화하고, 색상 단순화 과정에서의 물체의 경계의 흐릿해짐을 개선하기 위해 고주파통과필터를 통해 물체의 경계를 강화한다. 그 후 모폴로지 기법의 팽창과 침식의 차이를 이용하여 물체의 윤곽선을 검출하고, 획득한 영역의 윤곽선 부분의 정보(높이, 너비 면적)를 구한 후 패턴분석을 통해 조건을 줌으로써 문자 후보영역을 판별하여 문자가 아닌 불필요한 영역(그림, 배경)을 제거한다. 최종 결과로 라벨링을 통해 불필요한 영역이 제거된 결과를 보여준다.

다양한 크기 및 활자체를 갖는 인쇄체 한글 영상의 문서화에 관한 연구 (A Study on Documentization of Printed Hangul Image with Multi-size and Multi-style)

  • 김장욱;김경숙;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.295-298
    • /
    • 2001
  • 본 논문에서는 CCD카메라로 입력 받은 다중 크기 및 활자체로 구성된 한글문서의 화상 데이터를 편집기에서 수정 가능한 문자로 변환시키는 시스템을 구현하였다. 먼저 Dynamic 이 진화 처리 과정을 거친 화상을 흑백 화소의 누적분포에 따라 문자단위로 분할한 후, 다양한 크기로 분할된 문자를 표준패턴 크기로 표준화 시켰다. 한글을 자소 간 공백 위치의 특징에 따라서 6가지 유형으로 분류한 후, 퍼지 이론을 접목시킨 원형 패턴 벡터 알고리즘을 사용해서 표준벡터와 입력된 글자의 특징벡터를 비교하여 문자로 인식하게 하였다. 각 6가지 유형에서 서로 다른 자소로 결합된 문자들을 30개 선정하여 여러 가지 활자체 및 크기에 적용해 본 결과, 모두 문서화가 가능함을 알 수 있었다.

  • PDF

초등학생과 외국인을 위한 한글 문자 익히기 시스템의 개발 (A Development of Hanguel Learning System for Elementary School Students and Foreigners)

  • 조동욱
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권3호
    • /
    • pp.285-296
    • /
    • 2001
  • 본 논문에서는 초등학교 학생이나 외국인을 위해 한글을 익히는 교육용 시스템을 개발하고자 한다. 모델이 될 수 있는 표준 문자 패턴을 선정하고 이의 특징을 추출하여 데이터베이스화한다. 이를 위해 환경에 불변인 전처리과정의 수행과 특징 추출 그리고 유사도 함수를 정의한다. 최종적으로 초등학생이나 외국인이 쓴 문자에 대해 표준 문자 패턴과의 유사도를 계산하여 필기체 문자의 미적 평가를 행한다. 본 시스템은 특정 서체에 대해서도 표준 문자 패턴을 선정하여 서체 익히기까지 행할 수 있도록 확정이 가능한 시스템이며 실험에 의해 본 논문의 유용성을 입증하고자 한다.

  • PDF

술어-논항 구조의 어휘 패턴을 이용한 스트링 커널 기반 관계 추출 (String Kernel-based Relation Extraction using Lexical Patterns of Predicate-Argument Structure)

  • 정창후;최성필;전홍우;홍순찬;정한민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.327-329
    • /
    • 2012
  • 문서 내에 존재하는 중요한 개체들 간의 관계를 자동으로 추출할 때 개체와 개체 사이의 상호작용 표현에 중요하게 관여하는 핵심자질을 잘 선택할수록 빠르고 정확하게 관계 추출을 수행할 수 있다. 본 논문에서는 개체 쌍 사이에 존재하는 술어-논항 구조의 어휘 패턴 문자열을 정규화해서 스트링 커널에 적용하는 관계 추출 방법을 제안한다. 제안된 시스템의 성능 평가를 위해서 과학기술문헌에 존재하는 중요한 개체들 간의 연관관계 추출 성능 평가를 수행하는 테스트컬렉션을 자체적으로 구축하였으며 실험을 통하여 제안된 방법의 성능을 측정하였다. 정확도 실험 결과, 스트링 커널의 입력으로 문장 전체를 사용한 경우에는 55.0693%, 개체 쌍 사이의 문자열을 사용한 경우에는 61.0331%, 그리고 술어-논항 구조의 어휘 패턴 문자열을 사용한 경우에는 69.14%로, 술어-논항 구조의 어휘 패턴 문자열을 사용했을 때 성능이 가장 좋게 나타났다. 결론적으로 문장 내의 술어-논항 구조를 분석하여 정규화된 어휘 패턴을 생성하고 이렇게 생성된 문자열을 스트링 커널에 적용하는 방법이 관계 추출에 유용한 방법임을 알 수 있었다.

와일드카드 문자를 포함하는 스트링 데이터 사이의 포함관계 확인을 위한 효율적인 알고리즘 (An Effective Algorithm for Checking Subsumption Relation on String Data Containing Wildcard Characters)

  • 김도한;박희진;백은옥
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권9호
    • /
    • pp.475-482
    • /
    • 2005
  • 와일드카드 문자를 포함하는 스트링 데이타는 텍스트에 나타나는 특정 패턴을 표현하는 데에 사용될 수 있다. 임의의 두 패턴 사이의 포함 관계는 각 패턴과 매칭이 가능한 모든 스트링의 집합 사이의 포함관계로 나타낼 수 있으며, 포함 관계를 결정하는 것은 패턴이 나타내는 스트링의 집합을 중복성없이 표현하기 위해 필요하다. 본 논문에서는 이와 같이 패턴의 중복성을 판단하기 위해 와일드카드 문자를 포함하는 스트링 데이타 사이의 포함 관계를 결정하기 위한 효율적인 알고리즘을 제안한다. 먼저 기존의 접미사 트리 알고리즘을 단순하게 확장하여 와일드카드 문자를 포함하는 스트링 데이타 사이의 포함 관계를 확인할 수 있도록 하는 방법과 이러한 접미사 트리를 스트링 데이타의 각 위치 별로 나누어 구성하여 포함 관계를 확인하는 방법을 제안한다.

적응적 탬플릿 마스킹과 패턴 벡터 기법을 이용한 일본 차량 번호판 인식 (Japanese License Plate Recognition Using Adaptive Template Masking and Pattern Vector Method)

  • 김미진;김국성;이응주
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.635-640
    • /
    • 2003
  • 본 논문에서는 일본 차량 번호판 인식에 적응적 탬플릿 마스킹 방법을 이용하여 번호판 문자, 숫자를 분할하고 패턴벡터기법을 이용하여 인식하는 방법을 제안하였다 주, 야간과 거리에 따른 일본 차량 번호판 영상을 입력받아 전처리 과정을 수행한 후 에지 정보와 명도값 변화의 빈도수를 이용하여 번호판 영역을 검출하였다 검출된 번호판 영역에서 각 문자 및 숫자의 위치정보와 적응적 탬플릿을 이용하여 분할하고 번호판의 지역문자를 무게중심 패턴으로 분류 한 다음 크기와 이동에 무관한 특실을 가지는 패턴 벡터를 적용하여 문자를 인식하였으며, 숫자는 Four Segment Pattern을 이용하여 인식하도록 하였다 본 논문에서 제안한 방법을 실제 일관 차량 번호판 인식에 적용한 결과 98.8% 추출율과 96.6%의 인식율을 나타내었다.

  • PDF

한글의 미적 평가를 위한 특징 추출 및 유사도 함수 정의 (Feature Extraction and Similarity Measure Function Define For Beauty Evaluation of Korean Character)

  • 한군희;오명관;이형우;전병민
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.59-67
    • /
    • 2002
  • 본 논문에서는 입력의 자동화 및 교육을 위한 문자 익히기 시스템을 위하여 자소의 특징 추출과 유사도 함수를 정의하여 한글에 대한 미적평가를 수행하였다. 이를 위해 한글 문자의 자소에 대한 특징 추출 및 유사도 함수를 정의 한 후 표준 문자와 입력 문자가 얼마나 유사한지를 평가하는 방법을 제안하였다. 표준 문자와 입력 문자의 획에 대한 특징 추출 및 유사도 함수를 정의하였으며, 다양한 입력 문자 패턴에 대해 표준 문자 패턴과 얼마나 유사한지를 실험한 결과 예상한 값과 유사하게 일치하는 실험 결과를 얻을 수 있었다. 또한 일반 사람들의 미적 평가 결과와 제안한 방법의 실험 결과가 유사하게 일치한다는 결과도 얻을 수 있었다.

  • PDF

손가락 이동에 의해 선택된 영역의 인쇄체 한글 영상 문서화 (Documentation of Printed Hangul Images of the Selected Area by Finger Movement)

  • 백승복;손영선
    • 한국지능시스템학회논문지
    • /
    • 제12권4호
    • /
    • pp.306-310
    • /
    • 2002
  • 본 논문은 글자 문서를 배경으로 사용자의 손가락 이동에 의하여 일정한 영역을 그린 후, 영역내의 한글 영상을 편집 가능 한 에디터에 출력하는 시스템을 구현하였다. 영상의 전처리 단계에서는 문서 배경과 손 영역을 분리하고 최대 원형 이동법을 이용하여 손의 무게 중심점을 추출한다. 원형 패턴 벡터 알고리즘을 사용하여 손을 인식한 후, 거리 스펙트 럼으로 손가 락 위치를 찾는다. 손가락의 움직임에 의해 선택되어진 문자 영역을 추출한 후, 한글 자소 간 히스토그램을 이용하여 추출 된 문자 이미지 영역에서 문자단위로 분할하고 다양한 크기의 문자를 표준화한다. 퍼지 추론을 적용한 원형 패턴 벡터 알고리즘을 이용하여 표준 패턴문자와 입력문자의 특징벡터를 비교하여 문자를 인식하게 함으로써 사용자가 원하는 영역의 문자들을 수정 가능한 문서로 변환하였다.