Text/Voice Recognition & Translation Application Development Using Open-Source

Yun, Tae-Jin;Seo, Hyo-Jong;Kim, Do-Heon;

Proceedings of the Korean Society of Computer Information Conference (한국컴퓨터정보학회:학술대회논문집)

2017.07a
/
Pages.425-426
/
2017

Korean Society of Computer Information (한국컴퓨터정보학회)

Text/Voice Recognition & Translation Application Development Using Open-Source

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발

Yun, Tae-Jin (Dept. of Aeronautics & Software Engineering, Kyungwoon University) ;
Seo, Hyo-Jong (Dept. of Aeronautics & Software Engineering, Kyungwoon University) ;
Kim, Do-Heon (Dept. of Aeronautics & Software Engineering, Kyungwoon University)

윤태진 (경운대학교 항공소프트웨어공학과) ;
서효종 (경운대학교 항공소프트웨어공학과) ;
김도헌 (경운대학교 항공소프트웨어공학과)

Published : 2017.07.12

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

Proceedings of the Korean Society of Computer Information Conference (한국컴퓨터정보학회:학술대회논문집)

Text/Voice Recognition & Translation Application Development Using Open-Source

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)