• 제목/요약/키워드: 문자전(文字塼)

검색결과 169건 처리시간 0.022초

측면 윤곽 패턴을 이용한 접합 문자 분할법 (Character Segmentation Using Side Profile Pattern)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 춘계학술발표논문집
    • /
    • pp.260-263
    • /
    • 2003
  • 본 연구에서는 접합 문자를 분할하는 알고리듬을 소개한다. 문자 인식기는 문자를 인식하기 위해 문자 분할을 전 처리 단계에 필요로 하는데, 문자 분할은 높은 수행력을 위해 문자 인식 결과를 필요로 한다. 이 딜레마를 해결하기 위해서는 문자 분할과 문자 인식, 이 두 문제를 동시에 해결하는 방법이 필요하다. 이를 위해 본 논문에서는 문자 분할 전에 접합 문자 내에 있는 소속 문자를 인식하고 문자를 분할하는 새로운 문자 분할 방법을 제시한다. 본 연구에서 제시한 문자 분할 알고리즘은 접합 문자 내에 있는 소속 문자를 문자 분할 전에 인식하기 위해 측면 윤곽을 정의하고, 그 히스토그램을 구해 프로토타입에 있는 단일 문자의 측면 윤곽 히스토그램과 비교 계산하여 가장 적은 거리차를 가지는 단일 문자를 분할 문자의 일차 후보로 내정하여, 분할 비용을 가지고 접합문자를 분할한다.

  • PDF

측면 윤곽 패턴을 이용한 접합 문자 분할법 (Character Segmentation Using Side Profile Pattern)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.248-251
    • /
    • 2003
  • 본 연구에서는 접합 문자를 분할하는 알고리듬을 소개한다. 문자 인식기는 문자를 인식하기 위해 문자 분할을 전처리 단계에 필요로 하는데, 문자 분할은 높은 수행력을 위해 문자 인식 결과를 필요로 한다. 이 딜레마를 해결하기 위해서는 문자 분할과 문자 인식, 이 두 문제를 동시에 해결하는 방법이 필요하다. 이를 위해 본 논문에서는 문자 분할 전에 접합문자 내에 있는 소속 문자를 인식하고 문자를 분할하는 새로운 문자 분할 방법을 제시한다. 본 연구에서 제시한 문자 분할알고리즘은 접합 문자 내에 있는 소속 문자를 문자 분할 전에 인식하기 위해 측면 윤곽을 정의하고, 그 히스토그램을 구해 프로토타입에 있는 단일 문자의 측면 윤곽 히스토그램과 비교 계산하여 가장 적은 거리차를 가지는 단일 문자를 분할 문자의 일차 후보로 내정하여, 분할 비용을 가지고 접합 문자를 분할한다.

  • PDF

한글 TTS 시스템에서 문자열-발음열 변환기의 ㄴ-소리 첨가 전 처리기 (Ni-eun Addition Preprocessing of Grapheme to Phoneme Conversion for Koran TTS)

  • 정경석;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.370-372
    • /
    • 2001
  • 본 논문은 ㄴ-첨가 규칙을 전 처리를 통한 문자열-발음열 변환 기법을 소개한다. 한국어 TTS 시스템에서의 고질적인 문제는 문자열-발음열 변환이라고 할 수 있는데, 그 이유는 한국어의 특징상 음운적 조건과 형태론적 조건등에 의해 다양한 방법과 예외처리를 요구하기 때문이다. 그 중 ㄴ-첨가 규칙은 위와 같은 대표적인 현상으로 많은 문제점과 그에 따른 연구를 필요로 하고 있다. 이 시스템은 형태소 분석을 선행한 후, 특수문자나 숫자를 정규화하고 ㄴ-첨가 규칙을 전 처리한 후, 음운변화 현상을 분석하여 선택적으로 규칙을 적용하여 발음열을 생성한다. 제안된 시스템은 기존의 시스템에 비해 더욱 효과적인 음운, 형태소 변화를 가져옴과 함께, 특히 ㄴ-첨가가 적용되는 문장을 효과적으로 해결할 수 있어 TTS시스템에 좋은 결과를 가져오게 될 것이다.

  • PDF

문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구 (A Study on the Education System for People Who Don't Have Their Own Letters, SOUL)

  • 함혜령;노용덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.

네트워크 침입 탐지 시스템에서 고속 패턴 매칭기의 설계 및 구현 (Design and Implementation of High-Speed Pattern Matcher in Network Intrusion Detection System)

  • 윤여찬;황선영
    • 한국통신학회논문지
    • /
    • 제33권11B호
    • /
    • pp.1020-1029
    • /
    • 2008
  • 본 논문은 네트워크 침입 탐지 시스템에서 고속 패턴 매칭 알고리듬과 그 구조를 제안한다. 제안된 알고리듬은 실시간 입력 패킷에서 특정 패턴을 검사하며 정확한 문자열, 문자열 값의 범위, 그리고 문자열 값의 조합 등을 검색한다. 본 연구에서는 입력 패킷과 패턴은 동시에 겹치는 문자열들을 검색하기 위해 상태 전이 그래프로 모델링 하였으며 상태 전이 그래프는 구현 복잡도를 줄이기 위해 입력 임플리컨트 단위로 분할하였다. 제안된 패턴 매칭구조는 상태 전이 그래프와 입력된 문자열을 입력으로 사용한다. 제안된 패턴 매칭기는 VHDL 언어로 모델링하여 구현하였으며, 성능 분석을 통하여 제안된 기법의 적절성을 검증하였다.

연역적이고 국부적인 영문자의 폰트 분류법 (A Priori and the Local Font Classification)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2002년도 추계학술발표논문집
    • /
    • pp.205-208
    • /
    • 2002
  • 본 연구에서는 영문 단어로부터 폰트를 분류하기 위해 연역적이고 국부적인 폰트 분류 방법을 제안한다. 이는 문자 인식 전에 한 단어에서 폰트를 분류하는 것을 말한다. 폰트 분류를 위해 활자 특성인 Ascender, Descender와 Serif가 사용된다. 입력 단어로부터 Ascender, Descender와 Serif가 추출되어 특징 벡터가 추출되고, 그 특징 벡터는 인공 신경망에 의해 입력 단어에 대한 폰트 그룹, 폰트 이름이 분류된다. 제안된 연역적이고 국부적인 폰트 분류 방법은 폰트 정보가 문자 분할기와 문자 인식기에 사용될 수 있게 한다 나아가, 특정 폰트에 따른 Mono-font 문자 분할기와 Mono-Font 문자 인식기로 구성되는 OCR 시스템을 구성할 수 있는 것을 가능하게 한다.

한영 혼용 문서에서의 효과적인 문자 분할을 위한 언어 인식에 관한 연구 (Language Recognition for Effective Character Segmentation in the mixed Korean-English Documents)

  • 최원효;양병석;성기준;강재우;하진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.439-444
    • /
    • 2008
  • 본 논문은 한영 혼용 문서에서의 문자 분할을 위한 효율적인 언어 인식기를 고안하였다. 한영 혼용 문서를 스캔한 후, OCR(광학 문자 판독, Optical Character Recognition)을 할 때, 문자 분할의 중요성은 상당히 크다. 인식 없이 문자를 분할하는 external segmentation 방법에서는, 인식할 언어가 한글 혹은 영어인가에 따라 문자 분할 방법이 달라진다. 그러므로, 한영 혼용 이미지를 인식하기 위해서 문자 분할을 하기 전에 언어를 미리 결정해야 한다. 본 논문에서는 문자 분할 방법을 효율적으로 하기 위한 언어 인식기를 제안하고 그 방법을 적용하였다. 그 결과 한영 혼용된 책 이미지에서 94.09%의 문자 분할 성공률을 보였다.

  • PDF

임계 획 밀도를 이용한 한글, 한자, 영문구분 (A Distinction of the Korean Character, Chinese Character and English Character using the Threshold Stroke Density)

  • 원남식
    • 한국산업정보학회논문지
    • /
    • 제5권4호
    • /
    • pp.32-38
    • /
    • 2000
  • 다중 문자 환경의 문서인식 시스템에서 문자를 인식하기 전에 문자의 종류를 먼저 구분하는 것은 인식률의 향상에 중요한 요인이 된다. 각 나라의 문자는 그 문자마다 고유의 구성상의 다양한 특징을 가진다. 본 연구에서는, 문자를 구분하기 위한 방법으로 획 밀도 값을 이용하였고, 대상 문자는 한글, 영문과 한자로 하였다. 다양한 형태의 활자가 사용되는 문서에 적용하기 위해 입력 데이터는 정규화 과정을 거친 후 처리되었다. 제안된 방법은 80% 이상의 높은 확률로 구분이 가능함을 실험 결과로써 입증하였다.

  • PDF

비전시스템을 이용한 빌렛영상 문자인식기 개발 (Development of character recognition system for the billet image by use vision system)

  • 박상국;박수영;이문락
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2006년도 춘계 국제학술대회 논문집
    • /
    • pp.197-200
    • /
    • 2006
  • 본 논문은 철강공장의 연주공정에서 만들어진 빌렛 소재의 관리를 위해 사용되는 소재 관리문자를 실시간으로 인식하기 위한 빌렛 소재 관리문자 인식용 비전시스템 개발 결과에 대해 기술한다. 빌렛 재질의 단면에 마킹된 소재 관리문자는 소재가 다음 공정으로 이동하기 전에 공정상에서 실시간으로 인식된다. 문자인식 시스템은 영상획득을 위한 카메라 시스템, 영상을 장거리로 고속 전송하기위한 영상전송 시스템, 기존 시스템과의 인터페이스를 위한 입. 출력 장치로 구성된다. 개발된 문자인식 시스템을 실제 철강공장에 설치하여 운용테스트를 실시했다. 테스트 기간 중에 시스템의 내구성과 신뢰성을 검증하고 최종적으로 문자 인식률을 검증했다. 개발된 시스템에 대해 현장 테스트 결과 실험실 수준과 비슷한 수준의 인식률을 가졌다.

  • PDF

디지털영상신호처리에 의한 금석문 음각문자 신호 패턴 분석 (Digital Image Processing in Analyzing the Signal Pattern of Rock-Inscribed Letter)

  • 황재호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 B
    • /
    • pp.758-761
    • /
    • 2003
  • 금석문의 영상데이터를 디지털 형태로 검출하고, 영상신호처리 알고리즘을 사용하여 신호의 특성을 분석하고 그 결과를 제시하였다. 대상체는 비석에 음각된 문자로 하였다. 대전 주변의 백제권에서 몇몇 유형의 음각 문자를 형태별로 분류하여 디지털 이미지화한 다음, 문자가 각인된 정보영역과 바탕영역의 신호패턴을 추출하였다. 먼저 칼라 이미지를 grey tone으로 변환한 후, 전처리 과정을 거쳐 이미지의 노이즈나 불명확성을 제거하고 히스토그램 전 영역에 걸쳐 스케일 확장시켰다. 문자가 각인된 정보영역과 바탕영역을 구분하여 무작위로 소이미지 샘플을 취득하고 각 소이미지의 신호패턴을 분석하였다. 그 결과를 중첩의 원리를 이용하여 합성한 후 영역별 신호분석 패턴을 정형화하였다. 유형별로 다소 차이를 보이나 두 영역의 이미지 분석 결과는 차별성을 보였다. 문자 영역은 grey level 범위가 좁고 한정되며 일관성을 보이는데 비해, 바탕영역은 범위가 넓고 광범위하였다. 두 영역의 교차 레벨 범위는 극히 제한적이었으며 패턴 분리에 큰 영향을 끼치지 못하였음이 밝혀졌다. 이 일련의 과정은 알고리즘화되어, 1-2분 정도의 사전 작업만 하면 프로그램에 의해 문자를 추출할 수 있다. 이러한 사실들은 종래 무리한 탁본 작업에만 전적으로 의존하던 금석학 분야의 디지털화를 가능케 할 수 있다.

  • PDF