통합 검색 | Korea Science

주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원 (Target Speaker Speech Restoration via Spectral bases Learning)

박선호;유지호;최승진
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제36권3호
- /
- pp.179-186
- /
- 2009
본 논문에서는 학습이 가능한 특정화자의 발화음성이 있는 경우, 잡음과 반향이 있는 실 환경에서의 스테레오 마이크로폰을 이용한 특정화자 음성복원 알고리즘을 제안한다. 이를 위해 반향이 있는 환경에서 음원들을 분리하는 다중경로 암묵음원분리(convolutive blind source separation, CBSS)와 이의 후처리 방법을 결합함으로써, 잡음이 섞인 다중경로 신호로부터 잡음과 반향을 제거하고 특정화자의 음성만을 복원하는 시스템을 제시한다. 즉, 비음수 행렬분해(non-negative matrix factorization, NMF) 방법을 이용하여 특정화자의 학습음성으로부터 주파수 특성을 보존하는 기저벡터들을 학습하고, 이 기저벡터들에 기반 한 두 단계의 후처리 기법들을 제안한다. 먼저 본 시스템의 중간단계인 CBSS가 다중경로 신호를 입력받아 독립음원들을(두 채널) 출력하고, 이 두 채널 중 특정화자의 음성에 보다 가까운 채널을 자동적으로 선택한다(채널선택 단계). 이후 앞서 선택된 채널의 신호에 남아있는 잡음과 다른 방해음원(interference source)을 제거하여 특정화자의 음성만을 복원, 최종적으로 잡음과 반향이 제거된 특정화자의 음성을 복원한다(복원 단계). 이 두 후처리 단계 모두 특정화자 음성으로부터 학습한 기저벡터들을 이용하여 동작하므로 특정화자의 음성이 가지는 고유의 주파수 특성 정보를 효율적으로 음성복원에 이용 할 수 있다. 이로써 본 논문은 CBSS에 음원의 사전정보를 결합하는 방법을 제시하고 기존의 CBSS의 분리 결과를 향상시키는 동시에 특정화자만의 음성을 복원하는 시스템을 제안한다. 실험을 통하여 본 제안 방법이 잡음과 반향 환경에서 특정화자의 음성을 성공적으로 복원함을 확인할 수 있다.
PDF KSCI

이차 통계치를 이용한 블라인드 신호분리 알고리즘 (Blind Source Separation Algorithm using the Second-Order Statistics)

김천수;양완철;이병섭
- 한국전자파학회논문지
- /
- 제13권2호
- /
- pp.107-114
- /
- 2002
미지의 신호원들의z 합성으로부터 관측된 신호만을 이용하여 통계적으로 독립인 원신호를 추출하는 문제를 블라인드 신호분리라 한다. 본 논문에서는 보통의 실내에서 얻어진 비정상(non-stationary) 합성신호로부터 원신호론 추출해내는 블라인드 신호분리 기법을 제안한다. 제안된 기법은 관측 신호들 간의 이타 상호상관 값이 제로가 될 때만 최소값을 가지는 비용함수를 최소화시키는 방식으로 블라인드 신호분리를 구현한다. 제안된 기법의 유효성을 컴퓨터 시뮬레이션과 보통의 실내에서 관측된 2개의 합성신호로부터 2개의 원신호를 추출해내는 실험을 통하여 증명한다.
PDF KSCI

간섭 및 반향신호 제거를 위한 다단계 구조의 다채널 암묵 디콘볼루션 (Multichannel Blind Deconvolution of Multistage Structure to Eliminate Interference and Reverberation Signals)

임정우;정규혁;주기호;김영주;이인성
- 대한전자공학회논문지SP
- /
- 제44권1호
- /
- pp.85-93
- /
- 2007
다채널 암묵 디콘볼루션을 자기상관 값이 큰 신호에 적용할 경우 분리필터행렬의 주대각 성분에 의해서 분리신호의 시간백색화가 발생한다. 이러한 왜곡을 줄이기 위해 분리필터 행렬의 주대각 성분을 강제하거나 선형예측 잔여신호를 이용하여 분리필터 행렬을 구하는 방법들이 제안되었지만 신호자신의 반향성분이나 간섭신호 분리에 있어서 문제점이 발생된다. 본 논문에서는 이러한 문제들을 해결하기 위해서 간섭신호의 분리를 위한 단계와 신호자신의 반향을 감소시키기 위한 단계를 분리하여 처리하는 구조의 다채널 암묵 디콘볼루션 방법을 제안한다. 모의실험 결과 혼합신호에서 간섭신호를 분리해낼 수 있을 뿐만아니라 신호 자신의 반향 또한 감소됨을 확인하였다.
PDF KSCI

멀티채널 비음수 행렬분해와 정규화된 공간 공분산 행렬을 이용한 미결정 블라인드 소스 분리 (Underdetermined blind source separation using normalized spatial covariance matrix and multichannel nonnegative matrix factorization)

오순묵;김정한
- 한국음향학회지
- /
- 제39권2호
- /
- pp.120-130
- /
- 2020
본 논문은 블라인드 소스 분리 분야에서 널리 사용되는 멀티채널 비음수 행렬 분해 기법의 단점을 개선하여 미결정 복잡한 혼합 환경에서 문제를 해결한다. 공간 공분산 행렬에 기반을 둔 기존의 연구들에서, 단일 채널의 파워게인 및 상관관계와 같은 값으로 구성된 행렬의 각 요소는 높은 분산으로 인해 분리된 소스의 품질을 저하시키는 경향이 있다. 이 논문에서는 추정된 소스들을 효과적으로 클러스터링하기 위해 레벨 및 주파수 정규화를 수행한다. 따라서 새로운 공간 공분산 행렬 및 효과적인 클러스터 쌍별 거리함수를 제안한다. 본 논문에서는 제안된 행렬을 공간 모델의 초기화에 활용하여 공간 모델의 향상된 추정과 이를 바탕으로 상향식 접근법에서의 계층적 응집 클러스터링에 활용함으로써 분리된 음원의 품질을 향상시켰다. 제안된 알고리즘은 'Signal Separation Evaluation Campaign 2008 development dataset'을 활용하여 실험을 하였다. 그 결과 객관적인 소스 분리 품질 검증 도구인 'Blind Source Separation Eval toolbox'를 활용하여 대부분의 성능향상지표에서의 향상을 확인하였으며, 특히 대표적인 수치인 SDR의 1 dB ~ 3.5 dB 정도의 성능우위를 검증하였다.
https://doi.org/10.7776/ASK.2020.39.2.120 인용 PDF KSCI

검색결과 4건 처리시간 0.017초

주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원 (Target Speaker Speech Restoration via Spectral bases Learning)

이차 통계치를 이용한 블라인드 신호분리 알고리즘 (Blind Source Separation Algorithm using the Second-Order Statistics)

간섭 및 반향신호 제거를 위한 다단계 구조의 다채널 암묵 디콘볼루션 (Multichannel Blind Deconvolution of Multistage Structure to Eliminate Interference and Reverberation Signals)

멀티채널 비음수 행렬분해와 정규화된 공간 공분산 행렬을 이용한 미결정 블라인드 소스 분리 (Underdetermined blind source separation using normalized spatial covariance matrix and multichannel nonnegative matrix factorization)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)