• 제목/요약/키워드: Handwritten Character Recognition,

검색결과 83건 처리시간 0.02초

딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구 (A Study on Improvement of Korean OCR Accuracy Using Deep Learning)

  • 강가현;고지현;권용준;권나영;고석주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.693-695
    • /
    • 2018
  • 다음은 본 논문에서는 딥러닝을 통한 한글 OCR 정확도 향상을 제안한다. OCR은 인쇄되거나 손으로 쓴 문자를 광학적 방법으로 감지 인식하여 디지털로 인코딩하는 프로그램이다. 현재 가장 많이 쓰이는 tesseract OCR의 경우, 영문 인식의 정확도가 높다. 하지만 한글은 복잡한 구조에 비해 학습 데이터가 적어 정확도가 떨어진다. 따라서 이 연구에서는 이미지 프로세싱을 통해 원하는 이미지에서 글자 영역을 추출하고, 이를 학습 데이터로 활용한 딥러닝으로 한글 OCR의 정확도를 향상시키는 방법을 제안한다. 기존 영문과 숫자 및 몇 가지 언어에만 국한되어 발전해왔던 OCR을 다양한 언어에도 응용할 수 있을 것으로 기대된다.

  • PDF

기계학습 알고리즘 기반 하자 정보 관리 시스템 개발 - 공동주택 전용부분을 중심으로 - (A Developing a Machine Leaning-Based Defect Data Management System For Multi-Family Housing Unit)

  • 박다슬;차희성
    • 한국건설관리학회논문집
    • /
    • 제24권5호
    • /
    • pp.35-43
    • /
    • 2023
  • 공동주택 하자 분쟁의 증가와 함께, 하자관리의 중요성 또한 커지고 있다. 그러나 기존의 연구는 '공용 부분'에 초점을 맞추어 진행되었다. 또한 하자관리의 주체인 '관리사무소'를 위한 시스템 연구도 부족한 실정이다. 이는 관리사무소의 하자관리 능력의 부족과 관리 품질의 저하를 초래한다. 따라서, 본 논문에서는 관리사무소를 위한 기계학습 기반의 하자 정보 관리 시스템을 제안한다. OCR과 NLP 모듈을 사용하여 관리상의 불편한 점을 해소하는 것을 목표로 한다. OCR을 통해 수기로 작성된 하자 정보를 디지털 문서로 변환한다. 이후 언어모델을 이용하여 사용자가 지정한 양식과 함께 하자 정보를 재생성한다. 최종적으로 생성된 텍스트를 데이터베이스에 저장하고 이를 기반으로 통계적 분석을 실행한다. 이러한 일련의 과정을 통해, 관리사무소의 하자관리 역량을 향상할 수 있도록 돕고, 의사결정을 지원할 수 있을 것으로 기대한다.

온라인 흘림체 한글 인식을 위한 곡률획 모델링 기법 (Curvature stroke modeling for the recognition of on-line cursive korean characters)

  • 전병환;김무영;김창수;박강령;김재희
    • 전자공학회논문지B
    • /
    • 제33B권11호
    • /
    • pp.140-149
    • /
    • 1996
  • 흘림체 필기 문자는 문자의 가능한 한도 펜의 움직임을 줄이려는 경제성의 원칙에서 비롯된다. 즉, 다음 획을 쓰기 위해 이동할 때 펜을 들지 않거나, 아예 이동을 생략하거나, 또는 연결된 두 획이 서로 닮아가면서 필기하기 쉬운 단순간 형태로 변화한다. 이러한 변화로 인해, 획이나 자소의 형태가 달라질 뿐만 아니라, 획간이나 자소간의 구분이 매우 어려워진다. 따라서 흘림체의 효과적인 인식을 위해서는 획이나 자소의 정확한 분할에 의존하지 않으면서, 일정한 단위로 분할하여 매칭할 수 있는 방법이 필요하다. 이 연구에서는 구조적인 형태의 단위로 분할하고 매칭하는 '곡률획 모델링 방법(curvature stroke modeling method)'을 제안한다. 곡률획(curvature stroke)은 필기의 회전 방향이 바뀌지 않는 부분획으로 정의되며, 곡률에 따라 선분, 호, 원 등의 형태를 갖는다. 흘려 써진 입력 획들을 곡률획의 나열로 변환하기 위해서는, 필기의 회전을 변화시키는 곳, 급격한 방향 변화를 일으키는 곳, 그리고 지나친 회전을 일으키는 곳 등을 분할한다. 각 참조 자소는 정자체로 입력하여 분할 과정에 의해 생성된 곡률획의 나열로 저장되어 있으며, 인식중에 융합과정을 수행함으로써 매칭을 위한 다양한 곡률획의 나열을 만들어낸다. 이때, 가상 획이 필기되거나 생략될 가능성도 고려한다. 인식의 기본 단위로 곡률획을 사용함으로써, 입력 문자의 불필요한 분할점들을 효과적으로 줄일 수 있고, 또한 자소간의 연결점을 찾기 어려운 경우에도 인접한 두 자소에 걸치는 참조 곡률획을 생성해내기 때문에 정확한 매칭이 가능해진다. 실험 결과, 83.60%의 제 1후보 인식률과 0.99초/자(CPU 클럭: 66MHz)의 처리 시간을 보였다./atom으로 추출되었다. 한편 별도의 추가적인 공정없이 일반적인 에피 성장법을 사용하여 고농도로 붕소가 도핑된 실리콘층 위에 부정합 전위가 없는 에피 실리콘을 성장시켰으며, 이 에피 실리콘의 결정성은 매우 양호한 것으로 밝혀졌다. 또 부정합 전위가 없는 에피 실리콘에 n+/p 게이트 다이오드를 제작하고 그 전압-전류 특성을 측정한 결과 5V의 역 바이어스에서 0.6nA/$cm^{2}$의 작은 누설 전류값을 나타내었다.이었다 5. 쌀의 알칼리 붕괴도는 밀양 맥후작산미가 가장 높았고 호남평야지산미가 가장 낮았는데 비해 아밀로그래프의 호화개시온도는 수원과 이리산미가 가장 낮았던 반면 밀양산미가 가장 높았다. 강하점도는 밀양산미가 가장 낮았고 다음이 이천산미가 낮았던데 비해 계화 및 이리산미가 가장 높았으며 치반점도는 이와 정반대의 경향을 나타내었다. 밥의 점성 /경도비율은 지역간 차이가 유의하지는 않았으나 남부평야산미가 중부평야산미에 비해 다소 떨어지는 경향이었다. 6. 식미와 관련이 있는 쌀 외관품질 및 이화학적 특성을 이용한 주성분 분석에서 전정보의 약 59% 설명이 가능한 제 1 및 제 2 주성분치상의 7개 품종별 6개 산지미의 분포로 보아 품종에 따라서 산지 반응이 달랐는데 대체로 자포니카와 통일형 품종군간 구분과 밀양, 중부평야 및 호남평야의 세 산지간 구분이 가능하였다. 산지내 품종간 미질변이는 남양간척지와 이리산미가 비교적 작았는데 수원산미는 이천과 남양산미의 미질변이를, 계화산미는 이리산미의 미질변이를 거의 포괄하였다.는 산불위험지역의 격자점(15km)내에 최소한 1대의 AWS 설치방안을 제시하였지만, 금후에는 15km내에서도 능선, 계곡 등 구체적인 위치확정을 위한 선행연구가 실시되어야할

  • PDF