Text/Voice Recognition & Translation Application Development Using Open-Source

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발

  • Yun, Tae-Jin (Dept. of Aeronautics & Software Engineering, Kyungwoon University) ;
  • Seo, Hyo-Jong (Dept. of Aeronautics & Software Engineering, Kyungwoon University) ;
  • Kim, Do-Heon (Dept. of Aeronautics & Software Engineering, Kyungwoon University)
  • 윤태진 (경운대학교 항공소프트웨어공학과) ;
  • 서효종 (경운대학교 항공소프트웨어공학과) ;
  • 김도헌 (경운대학교 항공소프트웨어공학과)
  • Published : 2017.07.12

Abstract

본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

Keywords