BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research

Park, Chanjun;Seo, Jaehyung;Lee, Seolhwa;Moon, Heonseok;Eo, Sugyeong;Jang, Yoonna;Lim, Heuiseok;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
/
Pages.178-185
/
2021
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구

BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research

박찬준 (고려대학교 컴퓨터학과) ;
서재형 (고려대학교 컴퓨터학과) ;
이설화 (고려대학교 컴퓨터학과) ;
문현석 (고려대학교 컴퓨터학과) ;
어수경 (고려대학교 컴퓨터학과) ;
장윤나 (고려대학교 컴퓨터학과) ;
임희석 (고려대학교 컴퓨터학과)

Park, Chanjun (Korea University, Computer science and engineering) ;
Seo, Jaehyung (Korea University, Computer science and engineering) ;
Lee, Seolhwa (Korea University, Computer science and engineering) ;
Moon, Heonseok (Korea University, Computer science and engineering) ;
Eo, Sugyeong (Korea University, Computer science and engineering) ;
Jang, Yoonna (Korea University, Computer science and engineering) ;
Lim, Heuiseok (Korea University, Computer science and engineering)

발행 : 2021.10.14

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

키워드

과제정보

본 연구는 과학기술정보통신부 및 정보통신기술기획평가원의 대학ICT연구센터지원사업의 연구결과로 수행되었음 (IITP-2018-0-01405). 또한 본 연구는 과학기술정보통신부 및 정보통신기획평가원의 ICT명품인재양성 사업의 연구결과로 수행되었음 (IITP-2021-2020-0-01819).

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구

BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)