통합 검색 | Korea Science

인간에게 친밀한 인쇄체 한글 영상의 문서화 시스템 (Human Friendly Documentation System of the Printed Hangul Images)

곽주원;강순대;백승복;박상욱;박정현;박홍선;손영선
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
- /
- pp.361-364
- /
- 2002
본 논문에서는 일반적인 문서를 CCD 카메라로 입력 받은 후, 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 사용자의 손가락 움직임을 검출하고, 손가락으로 선택되어진 영역을 인식한 후, 선택되어진 영역으로 카메라를 이동시켜 획득된 영상을 문자 인식 가능한 크기로 확대/축소하며, 확대된 영상에 문자인식 알고리즘을 적용하여 문서로 변환하는 시스템을 구현하였다 최종적으로 사용자가 이 시스템의 존재를 인지하지 못할 만큼 자연스럽게 사용할 수 있는 시스템을 구현하고자 하였다.

유사 문자쌍을 구분하기 위한 한글 인식의 후처리 (Post-processing of Hangul Recognition for Discriminating Pairs of Characters)

장승익;김진형
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
- /
- pp.388-393
- /
- 2001
유사한 형태의 필기 한글 문자쌍은 한글 인식 시 발생하는 오류의 많은 부분을 차지한다. 이는 유사한 문자들의 작은 차이를 인식기가 충분히 반영하기 어렵기 때문이다. 본 논문에서는 최근 주목 받고 있는 Support Vector Machine을 이용해 유사한 문자쌍을 검증하는 한글 인식 후처리 방법을 제안한다. 제안하는 방법은, 대부분의 문자 유사쌍이 한 두개의 자모만이 상이한 점에 착안하여 자모 단위로 문자 유사쌍을 구분한다. 기존 랜덤그래프를 이용한 한글 인식기를 이용하여 자모 분할을 수행하고, Support Vector Machine을 이용하여 분할된 결과를 검증한다. 제안한 방법은 유사쌍 구분에 중요한 자모만을 선택적으로 고려하여, 기존 한글 인식기의 부족한 점을 보완한다. 실험 결과, 자주 혼동되는 문자쌍들의 인식 오류가 정정되는 것을 볼 수 있었으며 그에 따라 한글 인식의 전체 성능이 향상되었다.
PDF

문자 인식 기술을 이용한 데이터베이스 구축 (Building Database using Character Recognition Technology)

한선화;이충식;이준호;김진형
- 한국정보처리학회논문지
- /
- 제6권7호
- /
- pp.1713-1723
- /
- 1999
문자 인식 기술은 인쇄도니 형태로 존재하는 수많은 정보를 데이터베이스화 할 수 있는 가장 유용한 대안이다. 본 논문에서는 문자 인식 기술을 사용한 데이터베이스 구축의 타당성을 조사하기 위하여, 문자인식기를 사용한 데이터베이스를 시범적으로 구축하였다. 우선 데이터베이스를 구축할 때 문자 인식기의 선택 시 고려하여야 할 사항들을 살펴보고, 이를 기준으로 4가지의 상용 문자 인식기에 대한 인식 실험을 거친 후 그 중 인식 성능이 가장 좋은 것을 선택하였다. 대상 문서로는 다양한 인쇄 품질 및 특성을 갖는 실제 논문집의 초록을 대상으로 삼았으며, 대량 데이터에 대한 인식률 계산을 위해 수작업된 데이터베이스가 있는 KT 테스트 컬렉션[1]을 선택하였다. 실험은 실제 대용량 데이터베이스 구축과 유사한 환경을 만들기 위해, 문서별 학습이나 기울기 보정 등의 사전 작업을 생략하였다. 실험 결과 970편의 논문 요약문에 대해 평균 문자 인식률 90.5%를 보여, 한글 문자 인식 기술이 아직 데이터베이스 구축에 활용되기에는 이르다는 것을 보였다. 문자 인식에 의한 인식 오류에서는 수작업 한 문서에서 발견되는 오류와는 상이한 유형이 많이 발견된다. 본 논문에서는 추후의 연구를 위하여 문자 인식 텍스트에서 나타나는 오류의 유형을 분류하였다.
PDF

운송 컨테이너 영상의 효율적인 문자인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Efficient Character Recognization of Shipping Container Image)

최재영;김낙빈
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
- /
- pp.1077-1083
- /
- 2000
본 논문은 운송 컨테이너 식별자의 자동화 처리를 위한 문자 인식의 단계중 최종 문자 인식 전단계 까지의 처리 과정을 컨테이너의 특성에 맞게 제안하였으며, 이러한 전처리 과정은 문자 인식 시스템의 성능에 중요한 영향을 미친다. 제안한 방법은 먼저 입력된 컨테이너 컬러 영상을 명암 영상으로 바꾸고 전체 영상중 인식에 필요한 식별자 영역만을 경계선 검출과 형태학적 연산을 이용하여 추출한다. 이어서 다양한 배경색과 문자색을 판단하여 일반 문서와 같이 일관성있게 통일한 후, DCT를 이용한 명암도별 이진영역으로 분할한 후에 Otsu방법과 새로운 이진화방법을 자동으로 선택하여 효율적인 이진화가 이루어지도록 하였다. 이렇게 얻어진 이진 영상은 문자인식 단계로 넘어갈 수 있도록 개별 문자로 분할한다. 이 방법은 컨테이너 영상의 불균등한 배경색과 잡음으로 인하여 문자인식에 오류가 생기는 단점을 보완하였으며 컨테이너 특성을 최대한 반영함으로써 효과적인 전처리 결과를 얻을 수 있었다. 또한, 제안한 방법의 응용은 컨테이너 이외의 다른 상황에서도 매우 효과적으로 사용될 수 있으리라 본다.
PDF

중간값 필터와 형태학 필터를 이용한 실시간 영상 잡음 제거 (The Real-time Image Noise Cancellation using Median and Morphological Filters)

심성균;정원용
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
- /
- pp.205-208
- /
- 2000
문자영상의 인식분야에서는 다양한 잡음으로 인해 손상된 영상을 개선하는 영상의 전처리 과정을 아주 중요시하고 있다. 본 논문에서는 영상의 객체 윤곽을 보호하면서 충격잡음에 효과적인 비선형 중간값(median) 필터를 먼저 적용하고, 영상객체에 대해 선택적으로 축소하고 확대하는 형태학(morphological) 필터를 직렬로 조합함으로서 선명한 문자 영상을 획득하였고, 좀 더 현실적인 문자를 인식하도록 Genesis 영상처리 보드와 이를 제어하는 MIL(Matrox Image Library) 패키지를 사용하여 실시간적으로 구현해 보았다.
PDF

2차원 웨이브렛 패킷에 기반한 필기체 문자인식의 특징선택방법 (A Feature Selection for the Recognition of Handwritten Characters based on Two-Dimensional Wavelet Packet)

김민수;백장선;이귀상;김수형
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제29권8호
- /
- pp.521-528
- /
- 2002
본 논문에서는 문자인식의 특징선택방법으로 2차원 웨이브렛 패킷을 이용하는 새로운 방법을 제안한다. 영상자료의 특징들로부터 중심특징을 선택하기 위한 차원축소 기법으로 주성분분석 기법이 주로 사용된다. 하지만, 주성분분석 기법은 고유시스템에 의존하기 때문에, 이상치나 잡음 등에 민감할 뿐만 아니라, 전역적 특징만을 선택하는 경향이 있다. 때때로, 영상자료의 중요한 특징이 가장자리 부분이나 뽀족한 부분 같은 지역적 정보일 수 있다. 이러한 경우, 주성분분석 기법은 좋은 결과를 줄 수 없다. 또한 고유시스템은 많은 계산시간을 요구한다. 본 논문에서 원 자료는 2차원 웨이브렛 패킷기저에 의해 변환되고, 최적 판별 기저가 탐색된 후, 그것으로부터 적절한 특징이 선택된다. 주성분분석 기법과 비교하여, 제안된 방법은 웨이브렛의 좋은 특성에 의해 전역적 특징뿐만 아니라 지역적 특징의 선택이 빠른 계산시간으로 이루어진다. 제안된 방법의 성능을 보이기 위해 PCA와 제안된 방법의 인식률의 실험결과가 분석되었다.
PDF KSCI

인간에게 친밀한 한글 인식 및 편집 지원시스템 (Human Friendly Recognition and Editing Support System of Korean Language)

손영선
- 한국지능시스템학회논문지
- /
- 제17권4호
- /
- pp.494-499
- /
- 2007
본 논문에서는 책 또는 논문을 읽을 때 중요한 부분 또는 정리해야 할 부분의 영역을 선택하면, 해당영역의 문자들을 문서편집기에 순차적으로 출력시킴으로써 수정 저장 가능하게 하여 공부한 부분을 정리하는 시스템을 구현하였다. 이 시스템은 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 손가락 움직임을 검출하여 선택된 영역을 인식한다. 선택된 영역의 가로, 세로 거리를 펄스 수로 변환한 후 모터를 제어하여 그 위치만큼 카메라를 이동시킨다. 문자인식이 가능하도록 줌을 확대/축소하고 조정된 줌에 맞는 초점으로 근접 제어한 후, 더욱 선명한 영상을 얻기 위해 명암차이를 이용하여 미세조정을 하였다. 획득된 영상에 문자인식 알고리즘을 적용하여 문서로 변환시켜서 중요 부분들을 정리케하는 한글 인식 및 편집지원 시스템을 구현하였다
https://doi.org/10.5391/JKIIS.2007.17.4.494 인용 PDF KSCI

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발 (Text/Voice Recognition & Translation Application Development Using Open-Source)

윤태진;서효종;김도헌
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
- /
- pp.425-426
- /
- 2017
본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.
PDF

개선된 퍼지 ART 기반 RBF 네트워크와 PCA 알고리즘을 이용한 여권 인식 및 얼굴 인증

장도원;김광백
- 한국지능정보시스템학회:학술대회논문집
- /
- 한국지능정보시스템학회 2005년도 공동추계학술대회
- /
- pp.547-556
- /
- 2005
본 논문에서는 출입국자 관리의 효율성과 제계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하고 위조 여권을 판별할 수 있는 여권 인식 및 얼굴 인증 방법을 제안한다. 여권 이미지가 기울어진 상태로 스캔되어 획득되어질 경우 개별 코드 인식과 얼굴 인증에 많은 영향을 미칠 수도 있으므로 기울기 보정은 문자 분할 및 인식, 얼굴 인증에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 모드 추출은 소벨 연산자와 수평 스미어링, 8 방향 윤곽선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이지화 방법을 적용하여 코드의 문자열 영역을 이진화한다. 이진화된 문자열 영역에 대해 CDM 마스크를 적용하여 문자열의 코드들을 복원하고 8 방향 윤곽선 추적 알고리즘을 적용하여 개별 코드를 추출한다. 추출된 개별 코드 인식은 개선된 RBF 네트워크를 제안하여 적용한다. 제안된 RBF 네트워크는 퍼지 논리 접속 연산자를 이용하여 경계변수를 통적으로 조정하는 개선된 퍼지 ART 알고리즘을 제안하여 RBF 네트워크의 중간층으로 적용한다. 얼굴 인증을 위해서는 얼굴 인증에 가장 보편적으로 사용되는 PCA 알고리즘을 적용한다. PCA 알고리즘은 고차원의 벡터를 저 차원의 벡터로 감량하여 전체 입력 영상들의 직교적인 공분산행렬을 계산한 후 그것의 고유 값에 따라 각 영상의 고유벡터를 구하므로 PCA 알고리즘을 적용하여 얼굴의 고유 벡터를 구한 후 특징 벡터를 추출한다. 따라서 여권 영상에서 획득되어진 얼굴 영상의 특징벡터와 데이터베이스에 있는 얼굴 영상의 특징벡터와의 거리 값을 계산하여 사진 위조 여부를 판별한다. 제안된 여권 인식 및 얼굴 인증 방법의 성능을 평가를 위하여 원본 여권에서 얼굴 부분을 위조한 여권과 기울어진 여권 영상을 대상으로 실험한 결과, 제안된 방법이 여권의 코드 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다.
PDF

FPGA와 OpenCV를 이용한 실시간 눈동자 모션인식과 효율적인 문자 선택 시스템 (Real-time pupil motion recognition and efficient character selection system using FPGA and OpenCV)

이희빈;허승원;이승준;유윤섭
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2018년도 추계학술대회
- /
- pp.393-394
- /
- 2018
본 논문은 이전에 발표한 "FPGA와 OpenCV를 이용한 눈동자 모션인식을 통한 의사소통 시스템"을 보완하고, 몸이 불편한 환자를 위한 문자 선택 시스템을 소개한다. OpenCV를 이용해 눈 영역을 검출하고, 눈동자의 위치를 파악하여 FPGA로 보내 문자를 선택한다. 본 논문에서는 환자의 눈동자 움직임을 최소화하는 방법으로 사용자의 의도에 맞는 문자를 출력한다. 쉽게 접근할 수 있고, 다양한 알고리즘을 사용할 수 있는 OpenCV와 비교적 개발 비용이 저렴하고, 수정가능한 FPGA를 사용하여 구현한 눈동자 모션 인식 및 문자 선택 시스템을 제안한다.
PDF

검색결과 47건 처리시간 0.029초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)