• Title/Summary/Keyword: 문자형

Search Result 291, Processing Time 0.023 seconds

An Efficient Correction Method for Misrecognized Words in Off-line Hangul Character Recognition (오프라인 한글 문자 인식을 위한 효율적인 오인식 단어 교정 방법)

  • Lee, Byeong-Hui;Kim, Tae-Gyun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.6
    • /
    • pp.1598-1606
    • /
    • 1996
  • In order to achieve high accuracy of off-line character recognition(OCR) systems, the recognized text must be processed through a post-processing stage using contextual information. In this paper, we reclassify Korean word classes in terms of OCR word correction. And we collect combinations of Korean particles(approximately 900) linguistic verbal from(around 800). We aggregate 9 Korean irregular verbal phrases defined from a Korean linguistic point of view. Using these Korean word information and a Head-tail method, we can correct misrecognized words. A Korean character recognizer demonstrates 93.7% correct character recognition without a post-processing stage. The entire recognition rate of our system with a post-processing stage exceeds 97% correct character recognition.

  • PDF

Recognition of Printed Hangul Text Using Circular Pattern Vectors (원형 패턴 벡터를 이용한 인쇄체 한글 인식)

  • Jeong, Ji-Ho;Choe, Tae-Yeong
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.38 no.3
    • /
    • pp.269-281
    • /
    • 2001
  • This thesis deals with a novel font-dependent Hangul recognition algorithm invariant to position translation, scaling, and rotation using circular pattern vectors. The proposed algorithm removes noise from input letters using binary morphology and generates the circular pattern vectors. The generated circular pattern vectors represent spatial distributions on several concentric circles from the center of gravity in a given letter. Then the algorithm selects the letter minimizing the distance between the reference vectors and the generated circular pattern vectors. In order to estimate performances of the proposed algorithm, the completed Batang Hangul 2,350 letters were used as test images with scaling and rotational transformations. Experimental results show that the proposed algorithm are better than conventional algorithm using the ring projection in the recognition rates of Hangul letters with scaling and rotational transformation.

  • PDF

Matrix Character Relocation Technique for Improving Data Privacy in Shard-Based Private Blockchain Environments (샤드 기반 프라이빗 블록체인 환경에서 데이터 프라이버시 개선을 위한 매트릭스 문자 재배치 기법)

  • Lee, Yeol Kook;Seo, Jung Won;Park, Soo Young
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.11 no.2
    • /
    • pp.51-58
    • /
    • 2022
  • Blockchain technology is a system in which data from users participating in blockchain networks is distributed and stored. Bitcoin and Ethereum are attracting global attention, and the utilization of blockchain is expected to be endless. However, the need for blockchain data privacy protection is emerging in various financial, medical, and real estate sectors that process personal information due to the transparency of disclosing all data in the blockchain to network participants. Although studies using smart contracts, homomorphic encryption, and cryptographic key methods have been mainly conducted to protect existing blockchain data privacy, this paper proposes data privacy using matrix character relocation techniques differentiated from existing papers. The approach proposed in this paper consists largely of two methods: how to relocate the original data to matrix characters, how to return the deployed data to the original. Through qualitative experiments, we evaluate the safety of the approach proposed in this paper, and demonstrate that matrix character relocation will be sufficiently applicable in private blockchain environments by measuring the time it takes to revert applied data to original data.

Recognition of Digit Strings from Celluar Phone image by Sequential Color Clustering (순차적 칼라 클러스터링에 기반 한 휴대폰 카메라 영상에서의 숫자열 인식)

  • 박현일;김수형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.766-768
    • /
    • 2004
  • 자연영상에서 획득된 문자를 인식하는 연구는 대부분 디지털 카메라나 캠코더를 이용하여 획득된 고해상도 영상을 입력영상으로 사용하고 있다. 본 논문에서는 휴대폰 카메라로 획득된 저해상도 영상을 입력영상으로 사용하였다. 저해상도의 영상은 적은 수의 픽셀로 정보를 표현하고 있기 때문에 기존에 제시되었던 다양한 이진화 방법으로는 문자와 배경을 깨끗하게 분리해 낼 수 없다. 본 논문은 입력영상의 이진화를 위친 K-Means 알고리즘을 이용하여 칼라 클러스터링을 하였으며, 이진화 성능을 향상시키기 위해 지능형 주파수 필터를 사용하였다. 이진화된 영상을 파이프라인 구조의 인식 시스템에 인식시킴으로써 기존의 제안 방법들에 비하여 인식 성능을 향상시킬 수 있었다.

  • PDF

Structure-Adaptive Self-Organizing Neural Network : Application to Hangul Character Recognition (구조적응 자기조직화 신경망 : 한글 문자인식에의 적용)

  • Lee, Kyoung-Mi;Cho, Sung-Bae;Lee, Yill-Byung
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.137-142
    • /
    • 1995
  • 코호넨의 SOFM(Self-Organizing Feature Map)온 빠른 검증 학습이 가능하여 다층 퍼셉트론의 단점을 보완할 수 있는 패턴분류기로 부각되고 있다. 그러나 기본적으로 고정된 크기와 구조의 네트워크를 사용하기 때문에 실재 문제에 적용하기가 쉽지 않다는 문제가 있다. 본 논문에서는 패턴에 대한 사전 정보없이 복잡한 패턴공간을 적응적으로 분할하기 위해 구조적응되는 자기조직화 신경망을 소개하고 이를 인쇄체 한글 문자의 인식에 적용한 결과를 보여준다. 여기에서 제안하는 신경망은 SOFM의 각 셀이 좀더 자세한 SOFM으로 확장될 수 있도록하며, 확률분포가 0인 셀을 제거함으로써 패턴 공간에 보다 근사한 분류를 가능하게 한다. 실제로 이러한 방식이 한글과 같은 복잡한 분류 문제에서 어떻게 작동하는지 설명하고, 한글 완성형 2350자에 대해 실험한 결과를 보여준다.

  • PDF

Word superiority effect based on the Hangout font types (한글 글꼴 동일성 여부에 따른 단어 우월 효과)

  • Park, Soo-Jin;Jung, Woo-Hyun
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.73-76
    • /
    • 2005
  • 한글의 글꼴 동일성 여부가 단어 우월 효과에 미치는 영향을 알아보기 위해 두 편의 실험을 수행하였다. 첫 번째 실험에서는 바탕체 글꼴을 탐사 자극으로 사용하여 검사 자극과의 글꼴 일치 여부가 단어 우월 효과에 미치는 영향을 자극 제시 시간에 따라 알아보았다. 두 번째 실험에서는 첫 실험에서 얻어진 결과를 토대로 탐사 자극의 글꼴을 각각 바탕체와 세벌체로 하고, 검사 자극이 탐사 자극과 일치하는 경우와 그렇지 않은 경우의 단어 우월 효과에 대해 알아보았다. 두 실험 결과, 탐사 자극과 검사 자극의 글꼴 일치 여부는 한글 단어 우월 효과에 영향을 주지 않는 것으로 나타났다. 이는 탐사 자극과 검사 자극의 문자형이 서로 달라도 단어 우월 효과가 나타날 수 있음을 의미하는 것으로 단어 우월 효과가 국지적인 시각 자극의 속성에 영향을 받지 않음을 보여주는 것이다.

  • PDF

A Chinese Character(Hanja) Input System Based on Unicode 3.0 (유니코드 3.0 한자 입력시스템)

  • 윤지헌;변정용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.375-377
    • /
    • 2000
  • 인터넷의 급속한 보급은 인간 생활의 많은 부분을 바꾸어 놓고있는데, 가장 대표적인 예로 전자상거래와 온라인 문서를 들 수 있다. 전자상거래와 온라인 문서는 과거 자국의 문자위주 PC통신상에서만 이루어지고 있었지만 현재는 대부분이 인터넷과 연동되어있다. 따라서 전자상거래와 온라인 문서 등을 전세계 사람들이 이용하기 위해서 만국 공통의 코드가 필요하게 되었다. 이러한 요구로 ISO10646 코드가 제정되고 발전하여 현재의 유니코드 3.0에 이르게 되었다. 유니코드 3.0에는 세계각국의 문자가 포함되어있고, 한국, 중국, 일본 등 한자문화권에서 공통적으로 많이 사용하는 한자 2만 7천여자도 포함되어있다. 이것은 과거 국내 표준인 완성형 한자 4천 8백여자와 비교하면 무척 많은 양이라 할 수 있다. 이러한 유니코드의 출현으로 국내외의 고문헌과 법전 등의 한자가 포함된 각종 문서를 인터넷상에서 제공할 수 있지만, 현재 유니코드 한자를 입력하기위한 방법은 MS Word2000의 한자 입력기만 있고 다른 운영체제나 인터넷 환경에서는 거의 전무한 상태이다. 본 논문에서는 운영체제에 독립적으로 작동하는 유니코드 한자입력시스템에 관하여 연구 개발하였다.

  • PDF

A Study on Pattern Recognition of Dynamic Object (동적인 생물체의 패턴 인식)

  • 강동구;차의영;전태수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.437-439
    • /
    • 2000
  • 본 논문은 연층형 생물체의 형태를 인식하는 방법을 제안한다. 고정된 카메라에 제약된 공간상에서 움직이는 생물체를 인식하기 위하여 다음과 같은 과정을 거친다. 먼저 배경 영상을 추출한 후 배경 영상과 현재 영상의 차영상을 통하여 물체의 이진화 영상을 생성하여 세선화 작업을 거친 후 마지막으로 변환된 이미지에서 대표점을 추출하여 패턴 생성기의 입력 데이터로 사용한다. 생물체의 형태 인식 방법은 문자 인식 방법과 몇 가지 차이점을 가지는데 문자의 경우 'q'와 'b'가 다르게 인식되지만 생물체의 경우 이 두 형태는 단지 하나의 형태가 회전한 결과이므로 두 형태를 동일하게 인식해야 한다. 그러므로 패턴 생성을 위한 입력 데이터도 다른 형태를 띄게 된다. 본 논문에서 제안한 방법은 지렁이, 뱀 등과 같은 물체의 행동 분석을 하기 위한 기초 데이터를 생성하는 좋은 방법이 될 수 있다.

  • PDF

Recognition of Digit String from Low Resolution Image by using Color Clustering and Anisotropic Diffusion (칼라 군집화 및 비등방성확산필터를 이용한 저해상도 영상에서의 숫자열 인식)

  • Park Hyun-Il;Kim Soo Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.839-842
    • /
    • 2004
  • 자연영상에서 문자를 인식하는 연구는 활발히 진행되고 있지만 대부분 디지털 카메라나 캠코더 등으로 획득한 고해상도의 영상에서의 연구에 국한되어 있다. 휴대폰 카메라로 획득된 저해상도의 영상은 아주 적은 수의 픽셀로 정보를 표현하기 때문에 기존의 이진화 알고리즘으로는 문자와 배경을 깨끗하게 분리해 낼 수 없다. 본 논문은 영상의 칼라정보를 K-Means 클러스터링을 이용하여 전경과 배경으로 이진화 하였으며, 이진화 성능을 향상시키기 위해 지능형 주파수 필터와 비등방성 확산 필터를 사용하였다. 또한 입력영상을 파이프라인 구조의 이진화 및 인식 시스템에 인식시킴으로써 인식성능을 향상시켰다.

  • PDF

A Voice-enabled Chatbot Mobile Application (음성지원 챗봇 모바일 애플리케이션)

  • Choi, In-Kyung;Choi, Yun-Jeong;Lee, Ye-Rin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.438-439
    • /
    • 2019
  • 사회적 문제와 인공지능 기술의 발달로 챗봇 서비스에 대한 관심이 점점 증가하고 있으며, 그 결과 TTS(Text to Speech) 및 STT(Speech to Text) 기술을 기반으로 한 보조형 프로그램에 대한 개발이 다양한 모바일 환경에서 진행중이다. 본 논문에서는 문자를 소리로 변환해주는 TTS(Text to Speech) 기술과 소리를 문자로 변환해주는 STT(Speech to Text) 기술을 사용하여 음성지원 챗봇 시스템을 제작하고 이를 안드로이드 기반의 모바일 애플리케이션으로 구현한 '음성지원 챗봇 모바일 애플리케이션'을 제안하고, 이와 관련하여 관련 기술 및 기대효과에 대해 소개한다.