DOI QR코드

DOI QR Code

Design and Implementation of the Voice Feature Elimination Technique to Protect Speaker's Privacy

사용자 프라이버시 보호를 위한 음성 특징 제거 기법 설계 및 구현

  • Yu, Byung-Seok (Div. of Information & Communication Engineering, Baekseok University) ;
  • Lim, SuHyun (Dept. of Computer and Radio Communications Engineering, Korea University) ;
  • Park, Mi-so (Div. of Information & Communication Engineering, Baekseok University) ;
  • Lee, Yoo-Jin (Div. of Information & Communication Engineering, Baekseok University) ;
  • Yun, Sung-Hyun (Div. of Information & Communication Engineering, Baekseok University)
  • 유병석 (백석대학교 정보통신학부) ;
  • 임수현 (고려대학교 컴퓨터.전파통신공학과) ;
  • 박미소 (백석대학교 정보통신학부) ;
  • 이유진 (백석대학교 정보통신학부) ;
  • 윤성현 (백석대학교 정보통신학부)
  • Published : 2012.11.22

Abstract

음성은 가장 익숙하고 편리한 의사 소통 수단으로 스마트폰과 같이 크기가 작은 모바일 기기의 입력 인터페이스로 적합하다. 서버 기반의 음성 인식은 서버를 방문하는 다양한 사용자들을 대상으로 음성 모델을 구축하기 때문에 음성 인식률을 높일 수 있고 상용화가 가능하다. 구글 음성인식, 아이폰의 시리(SiRi)가 대표적인 예이며 최근 스마트폰 사용자의 증가로 이에 대한 수요가 급증하고 있다. 서버 기반 음성 인식 기법에서 음성 인식은 스마트폰과 인터넷으로 연결되어 있는 원격지 서버에서 이루어진다. 따라서, 사용자는 스마트폰에 저장된 음성 데이터를 인터넷을 통하여 음성 인식 서버로 전달해야 된다[1, 2]. 음성 데이터는 사용자 고유 정보를 가지고 있으므로 개인 인증 및 식별을 위한 용도로 사용될 수 있으며 음성의 톤, 음성 신호의 피치, 빠르기 등을 통해서 사용자의 감정까지도 판단 할 수 있다[3]. 서버 기반 음성 인식에서 네트워크로 전송되는 사용자 음성 데이터는 제 3 자에게 쉽게 노출되기 때문에 화자의 신분 및 감정이 알려지게 되어 프라이버시 침해를 받게 된다. 본 논문에서는 화자의 프라이버시를 보호하기 위하여 사용자 음성 데이터로부터 개인의 고유 특징 및 현재 상태를 파악할 수 있는 감정 정보를 제거하는 기법을 설계 및 구현하였다.

Keywords