• Title/Summary/Keyword: 음성 개선

검색결과 1,032건 처리시간 0.024초

변형된 이득함수를 이용한 잡음 환경에서의 음성인식 (Speech Recognition in Noisy Environments Using Modified Gain Function)

  • 진호성;이상호;홍재근
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.119-123
    • /
    • 2010
  • 본 논문에서는 2단계 잡음제거 방법의 이득함수를 이용한 고조파 복원 잡음제거 방법의 이득함수를 조정하여 기존의 방법보다 음성개선을 향상시켰고, 제안한 방법으로 개선된 음성을 음성인식 기술에 적용하였다. 본 논문에서는 기존 방법으로 음성개선 결과 묵음구간에서 음성구간으로 변화는 구간에서 이전 프레임의 추정된 음성신호로 스펙트럼의 이득함수가 구해져서 음성이 발생하는 구간에서 왜곡이 발생한다. 따라서 본 논문에서는 이러한 현상을 개선시키기 위해 2단계 잡음제거 방법의 이득함수를 추정된 a priori SNR과 비교하여 이득함수를 조정하고, 2단계 잡음제거 방법의 이득함수를 고조파 복원 방법의 이득함수와 비교하여 이득함수를 조정하여 음성을 개선하는 방법을 제안하였다. 그리고 음성인식을 위한 특징벡터 추출을 위해 제안한 방법으로 개선된 음성의 대수 에너지를 정규화 하는 대수 에너지 정규화 방법(Log Energy Normalization)을 음성인식 방법에 적용하였다.

  • PDF

차량환경에서 DMB용 음성명령어기 사용을 위한 음성개선방법 (Speech Enhancement for DMB Voice commander in Car environment)

  • 백승권;한민수;남승현;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.233-236
    • /
    • 2003
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다. 특히 DMB 사용환경에서 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단인 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman Filter를 이용하여 시간상 단구간 정적 잡음을 제거한다. 본 논문의 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다

  • PDF

경피적 근전도 유도하 교원질 주입술을 통한 성대구증의 치료성적

  • 김형태;조승호;김민식;선동일;유우정
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1999년도 제12회 학술대회
    • /
    • pp.177-177
    • /
    • 1999
  • 배경 : 성문폐쇄부전을 나타내는 질환 중 성대구증은 음성개선을 위한 치료면에서 가장 어려운 질환중에 하나다. 성대구증의 음성개선을 위해서 현재 다양한 수술적 방법과 보형물의 주입술이 이용되고는 있으나 만족할 만한 음성개선을 얻기는 힘들었다. 목적 : 진행된 성대구증 환자의 성문폐쇄부전을 치료하기 위한 새로운 방법으로 본 교실에서 시도하고 있는 경피적 근전도유도하 교원질주입술의 치료성적 및 음성 및 음향학적 추적결과와 술기의 유용성에 관하여 알아보고자 하였다. (중략)

  • PDF

실험실 환경 음성을 이용한 전화음성 인식에 관한 연구 (Telephone Speech Recognition Using Laboratory Environment Speech Data)

  • 윤상호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.391-394
    • /
    • 1994
  • 본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.

  • PDF

N-Best Re-ranking에 기반한 한국어 음성 인식 성능 개선 (N-Best Reranking for Improving Automatic Speech Recognition of Korean)

  • 이정;서민택;나승훈;나민수;최맹식;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.442-446
    • /
    • 2022
  • 자동 음성 인식(Automatic Speech Recognition) 혹은 Speech-to-Text(STT)는 컴퓨터가 사람이 말하는 음성 언어를 텍스트 데이터로 전환하는 일련의 처리나 기술 등을 일컫는다. 음성 인식 기술이 다양한 산업 전반에 걸쳐 적용됨에 따라 높은 수준의 정확도와 더불어 다양한 분야에 적용할 수 있는 음성 인식 기술에 대한 필요성이 점차 증대되고 있다. 다만 한국어 음성 인식의 경우 기존 선행 연구에 비해 예사말/높임말의 구분이나 어미, 조사 등의 인식에 어려움이 있어 음성 인식 결과 후처리를 통한 성능 개선이 중요하다. 따라서 본 논문에서는 N-Best 음성 인식 결과가 구성되었을 때 Re-ranking을 통해 한국어 음성 인식의 성능을 개선하는 모델을 제안한다.

  • PDF

차량환경에서 음성명령어기 사용을 위한 음성개선방법 (Speech Enhancement for Voice commander in Car environment)

  • 백승권;한민수;남승현;이봉호;함영권
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-16
    • /
    • 2004
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다 특히 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단일 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman 필터를 이용하여 시간상 단구간 정적 잡음을 제거한다. 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다.

VoIP의 음성품질/대역효율 개선을 위한 음성패킷 처리 (Voice Packet Processing Scheme for Voice Quality and Bandwidth Efficiency in VoIP)

  • 김재원;손동철
    • 한국멀티미디어학회논문지
    • /
    • 제7권7호
    • /
    • pp.896-904
    • /
    • 2004
  • 본 논문에서는 10msec 프레임의 가변전송률 G.729 음성부호화기를 설계하여 VoIP에서의 대역 효율을 개선하고, 부전송률 부호화기 도입을 통한 인터넷 프로토콜에서 발생하는 패킷 손실구간의 음성 품질을 개선할 수 있는 방안을 도출하였다. 가변 전송률 음성부호화기 설계는 음성 통화중 발생하는 약 60% 정도의 묵음 구간을 활용하는 기법으로서 활성 음성구간은 8kbps로 전송하고,비 활성 음성구간은 1kbps로 전송함에 의하여 고정 전송률 방식의 음성 부호화기에 비하여 평균 패킷 전송량을 약 50% 감소시켜 대역 효율을 개선할 수 있다. 제안 방법의 성능은 동일 프레임 크기를 갖는 ITU-T G.729B방식과 감지 활성도의 변화분과 음성품질 손상 구간의 비율을 기준으로 비교 평가하였다. 그리고 인터넷 환경에서의 패킷 손실에 의한 음성 품질 저하 방지는 4kbps 부전송률 음성부호화기 도입과 오류 발생 전후의 패킷에 의한 오류은닉 방법을 활용하였으며, 성능은 재생 음성품질로서 평가하였다. 본 논문에서 설계한 가변 전송률 부호화 방식은 고정 전송률 방식에 대비하여 평균 음성 패킷의 전송량을 1/2로 감소시켜 대역효율 개선이 가능하며, 감소된 전송률을 손실 패킷구간에 활용하는 경우 8kbps 고정 전송률 방식과 동일 대역이용에서 3dB의 음성품질 개선이 가능하여 VoIP 성능 개선이 가능하리라 사료된다.

  • PDF

KAK 필터를 이용한 잡음이 섞인 음성의 음질향상 (On the Use of a KAK Filter for Enhancement of Noisy Speech)

  • 조동호;유득수;은종관
    • 한국음향학회지
    • /
    • 제5권2호
    • /
    • pp.48-57
    • /
    • 1986
  • 광대역 또는 협대역잡음이 섞인 음성의 음질을 개선하기 위해 KAK 필터를 사용하는 방법을 제 안한다. KAK 필터는 그 구조가 간단하지만, 잡음이 섞인 음성의 음질을 개선하는데 있어서 객관적인 음질척도로 볼 때 spectral subtraction 방법과 성능이 비슷하다. 또한 귀로 들어봐도 kak 필터를 사용한 경우와 spectral subtraction 방법을 이용한 경우의 개선된 음질이 거의 비슷하다. 그런데 이 kak 필터는 구조가 다른 기존방법보다 훨씬 간단하며, 다른 음질개선 알고리즘과는 달리 음성과 묵음의 판별이 필 요하지 않다. 또한 kak 필터는 ADPCM과 같은 파형 부호화기와 결합하는 것이 용이하다. 따라서 깨끗 한 음성뿐만 아니라 잡음이 섞인 음성을 부호화하는데 있어서 제안한 kak 필터를 ADPCM과 같은 파형 부호화기에 결합하여 사용하는 것이 적합하다.

  • PDF

전처리 기법에 따른 잡음음성의 인식성능 비교 (Comparison of Recognition Per formance of Noisy Speech Depend ing on Preprocessing Methods)

  • 손종목;이용주;배건성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.31-34
    • /
    • 2000
  • 본 연구에서는 부가잡음에 의한 음성신호의 왜곡에 대해 다양한 음성개선 기법을 전처리기로 도입하여 HMM(Hidden Markov Model)에 기반 한 음성인식 시스템의 인식성능을 평가하였다. 음성개선 기법으로는 MMSE(Minimun Mean Square Error) STSA(Short-Time Spectral Amplitude Estimator) 기법과 웨이브렛 영역에서의 UWD(Undecimated Wavelet Denoising), CWD(Conventional Wavelet Denoising) 기법을 적용하였다. 잡음이 없는 데이터로 훈련한 음성인식시스템에 잡음음성을 입력할 때 각 음성개선기법을 전처리기로 사용하여 신호대잡음비(Signal to Noise Ratio)에 따른 인식 성능을 비교하였다.

  • PDF

이중 여진 음성모델을 이용한 음질개선 (A Voice/Unvoice Decomposition in Noisy Background)

  • 유창동
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.175-178
    • /
    • 1998
  • 음질개선에 이줄 여진(Double Excitation) 음성모델을 적용하는 방법이 있다. 유성음과 무성음 성분들로 분리하는 이 방법은 각 성분들의 고유한 성질을 이용하여 음질을 저하시키는 wideband 잡음을 제거할 수 있다. 이중 여진 음성모델을 이용한 음질개선 시스팀과 기존의 스펙트랄 제거(spectal subtraction) 알고리즘을 비공식적으로 비교한 결과 이중 여진 모델을 이용한 방법이 더 나은 성능을 보였다.

  • PDF