통합 검색 | Korea Science

청취자 위치 적응 실시간 사운드 재생 시스템의 개발 (Development of a Listener Position Adaptive Real-Time Sound Reproduction System)

이기승;이석필
- 한국음향학회지
- /
- 제29권7호
- /
- pp.458-467
- /
- 2010
본 논문에서는 두 개의 스피커를 이용한 청취 환경에서 좌, 우 채널의 간섭 신호를 제거하기 위한 새로운 오디오 시스템을 개발하였다. 간섭 제거는 청취자의 위치에 따라 적응적으로 이루어져야 하기 때문에, 청취 위치를 추적하기 위한 기법이 적용되었다. 청취자 위치 추적은 2개의 마이크로폰을 통하여 이루어지며 채널 간 시간 지연을 이용하여 청취자의 방향을 추정하도록 하였다. 또한 잔향 환경에서의 사용을 고려하여 선형 예측 기법을 이용한 잔향 제거 기법이 적용되었다. 좌,우 채널의 간섭제거를 위한 음원-귀 간의 경로는 KEMAR 머리전달함수를 이용하여 나타내었다. 사용된 청취자 방향 측정 시스템의 유용성을 평가하기 위해 추정된 위치에서 채널 간섭의 성능을 평가하였다. 평가 척도로 채널 분리 비를 사용하였으며, 실험적인 결과, 사용자의 실제 위치와 추정된 위치 간에 다소 차이가 있더라도 -10 dB의 채널 분리비가 얻어짐을 확인 할 수 있었다. 제안된 알고리즘은 부동소수점 디지털 신호처리 프로세서를 이용하여 실시간 구현되었으며 청취자 평균 방향 오차는 5도, 주관적 간섭 제거율은 평균적으로 80 % 얻어짐을 알 수 있었다.
https://doi.org/10.7776/ASK.2010.29.7.458 인용 PDF KSCI

강화학습 기반의 음성향상기법 (Speech enhancement based on reinforcement learning)

박태준;장준혁
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2018년도 춘계학술발표대회
- /
- pp.335-337
- /
- 2018
음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.
https://doi.org/10.3745/PKIPS.y2018m05a.335 인용 PDF

개선된 3차원 오디오 재생을 위한 크로스토크 제거 기법 (A Cross-talk Cancelling Technique for Improved 3-Dimensional Audio Reproduction)

오승수;김기만
- 한국정보통신학회논문지
- /
- 제5권1호
- /
- pp.8-13
- /
- 2001
일반적으로 라우드 스피커를 이용한 3차원 오디오에서의 크로스토크 제거는 "sweet spot" 이라 부르는 청취자의 위치에 따라 성능이 크게 의존하는 것으로 알려져 있다. 따라서 머리의 움직임, 잔향, 머리모양의 차이 같은 혼란을 주는 요소에 강한 새로운 크로스토크 제거기가 제안되었는데 이는 스피커의 대칭 구조와 비대칭 구조를 합성하여 3개의 라우드 스피커가 필요한 구조로 되어있다. 본 논문은 3개의 스피커가 필요한 기존의 크로스토크 제거기 구조를 2개의 스피커만 사용하여 동등한 성능을 구현할 수 있도록 하였다. 연구된 방법은 청취 실험을 통해 성능을 검증하였다.성능을 검증하였다.
PDF

능동소나 탐지 성능 향상을 위한 피크 신호의 통계적 특징 기반 단일 핑 클러터 제거 기법 (Single Ping Clutter Reduction Algorithm Using Statistical Features of Peak Signal to Improve Detection in Active Sonar System)

서익수;김성원
- 한국음향학회지
- /
- 제34권1호
- /
- pp.75-81
- /
- 2015
능동소나를 이용한 대잠전 환경에서 클러터는 표적탐지 및 추적성능을 저하시키는 가장 큰 원인 중 하나이다. 본 논문에서는 중주파수 능동소나에서 표적 피크 신호의 통계적 특징을 이용한 단일 핑 클러터 제거 기법을 제안한다. 기존의 표적 피크 영역을 제외한 잔향 존재 영역에서 오탐지율을 줄이는 기법이나 여러 핑을 누적하여 기동 패턴을 분석하여 표적과 클러터를 구분하는 기법들의 단점을 보완하기 위하여 단일 핑 데이터의 표적 피크 영역에서 통계적 특징 정보를 이용하여 클러터와 표적신호를 구분한다. 실제 표적을 이용한 해상실험에서 성능을 검증하였으며 기존 대비 클러터가 약 80 % 이상 제거되는 것을 확인하였다.
https://doi.org/10.7776/ASK.2015.34.1.075 인용 PDF KSCI

중첩가산방식의 SSB 필터뱅크와 QMF 필터뱅크를 이용한 서브밴드 음향 반향 신호 제거기에 관한 연구 (A Study on the Subband Acoustic Echo Canceller Using Weighted Overlap-Add SSB and QMF Filter Banks)

차경환;심동연;김천덕
- 전자공학회논문지S
- /
- 제36S권4호
- /
- pp.93-100
- /
- 1999
확성회의 시스템에서 응용되는 반향신호 제거기는 긴 잔향시간을 갖는 실내 공간의 환경변화에 따라 필터 계수의 갱신에 많은 시간이 요구되어 실시간 처리에 문제점으로 지적되고 있다. 본 논문에서는 연산량 저감을 통한 실시간 처리를 위하여 중첩가산방식의 SSB(Single Side Band) 필터뱅크를 사용한 서브밴드 적응 신호처리법을 제안한다. 이 방법은 입력과 출력의 스펙트럼을 몇 개의 주파수 밴드로 분할하여, 각 밴드를 ES-NLMS(Exponential Step-Normalized Least Mean Square) 알고리즘을 이용하여 적응 처리하는 것이다. 시뮬레이션 결과 중첩가산방식의 SSB 필터뱅크가 풀밴드 보다 ERLE(Echo Return Loss Enhancement)가 1∼2㏈ 정도 작을 때 연산량이 풀밴드 보다 약95%, QMF(Quadrature Mirror Filter)필터뱅크보다 약50% 정도 감소하여 우수한 것으로 나타났다.
PDF

차량용 음성인식을 위한 주변잡음에 강건한 브라인드 음원분리 (Robust Blind Source Separation to Noisy Environment For Speech Recognition in Car)

김현태;박장식
- 한국콘텐츠학회논문지
- /
- 제6권12호
- /
- pp.89-95
- /
- 2006
독립성분분석을 사용한 암묵신호분리의 성능은 잔향이 존재하는 환경에서 잔류 누설 성분 (cross-talk) 때문에 현저히 저하된다. 본 논문에서는 잔류 누설 성분을 제거하기 위한 후처리 방법을 제안한다. 제안하는 방법은 주파수 영역에서의 변형된 NLMS(normalized least mean square) 필터를 사용하며 필터의 역할은 잔류 누설 성분을 유발하는 누설 경로를 추정하는 데 있다. 특정 채널에서 잔류하는 누설 성분은 상대 채널의 직접 성분에 해당되므로 관측되는 상대 채널의 입력신호를 이용하여 누설 경로를 추정할 수 있다. 변형된 NLMS 필터는 필터 입력 신호의 전력과 추정 오차 신호의 전력을 함께 고려하여 정규화한다. 특정 채널의 직접 신호 성분은 적응 필터에서 잡음처럼 동작하여 결국 적응필터가 오조정되기 때문에 제안하는 방법을 통해 적응필터의 오조정을 방지할 수 있다. 음성 신호를 사용한 컴퓨터 시뮬레이션 결과를 통해 제안하는 방법이 후처리를 사용하지 않은 경우에 비해 잡음 제거 성능(NRR)이 약 3dB 정도 개선되는 것을 확인 할 수 있다.
PDF

3차원 음상정위 시스템의 구현과 주관 평가 (Implementation of Spatial Sound Localization System and Subjective Test)

이동우
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
- /
- pp.43-46
- /
- 1998
본 논문에서는 헤드폰과 스테레오 스피커를 통하여 가상의 음상을 임의의 위치에 정위시키는 음상정위 시스템을 구현하고, 주관 평가를 통하여 음상정위 성능을 고찰하였다. 음상정위 시스템은 크게 방향감을 제어하는 컨벌루션 처리부와 공간감과 거리감을 처리하는 잔향 처리부, 그리고 스테레오 스피커를 통해 소리를 재생할 때 발생하는 크로스 토크(corsstalk)를 제거하기 위한 트랜스오럴(transaural) 필터부로 나누어진다. 구현된 시스템의 음상정위 성능은 리스링 룸에서 녹음된 음성과 메트로놈 소리를 이용하여 수평각/고도각, 정지음/이동음, 거리감 등을 헤드폰과 스피커를 통하여 각각 실험한 결과 수평각 지각은 스피커 재생보다 헤드폰 재생이 우수했으며, 정지음보다 이동음의 지각 결과가, 고도각 지각은 전.후(0$^{\circ}$~360$^{\circ}$) 방향보다 좌.우(90$^{\circ}$~270$^{\circ}$) 방향의 결과가 우수하게 나왔다.
PDF

HRTF(머리전달함수)의 샘플링를 변환에 따른 입체음향 플레이어 (3D Sound Player with various resampled HRTF′s)

오재경;이동재;임철수;최범석;이원돈
- 한국산학기술학회:학술대회논문집
- /
- 한국산학기술학회 2001년도 춘계학술대회 발표논문집
- /
- pp.199-202
- /
- 2001
본 논문에서는 3D사운드 생성 기술 중 대표적인 방법인 원음에 HRTF(머리전달함수)를 콘볼루션(convolution)하는 방식으로 음상정위 모듈을 구현하였으며 음장감을 부여하기 위하여 잔향(reverberation) 효과를 추가하고 크로스토크 현상을 제거하기 위하여 트랜스오럴 필터를 추가하였다. 본 논문에서는 sampling rate conversion을 사용하여 decimation과 interpolation을 수행하여 44.1KHz의 sampling rate로 된 coefficient를 downsample하거나 upsample한 HRTR(머리전달함수)를 사용하여 콘볼루션(convolution)을 수행했다. 본 논문에서는 3D사운드 생성과정에서 필요한 연산과정을 최소화하여 일반 PC의 computing power로도 sampling rate conversion된 데이터를 처리하여 줄 수 있는 알고리즘을 제시하고 구현하였다.

다채널 음악파일에의 입체음향 적용 (3D Sound Application to N channel Sound File)

김용진;송장호;이동재;이원돈
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2002년도 추계학술발표논문집 (상)
- /
- pp.15-18
- /
- 2002
본 논문에서는 다양한 채널을 가진 음악 과일에 대하여 입체 음향 효과를 줄 수 있는 시스템을 개발 하였다. 그러기 위하여 3D 사운드 기술 중에 가장 대표적으로 알려진 HRTF(머리전달 함수)를 원음에 콘볼루션(Convolution)하는 방식으로 음상정위 모듈을 구현하였으며 음장감을 부여하기 위해 잔향 효과(Reverberation)효과를 추가하고 크로스토크 현상 제거를 위해 트랜스오럴(Transaural) 필터를 추가하였다. 이런 입체음향 기술을 가지고 여러 채널을 가진 음악 파일에 적용시켜서 다채널 입체음향 효과를 낸 수 있는 시뮬레이터를 구현해 보았다. 시스템 구현에는 한정된 채널이 아닌 다양한 채널에 대한 효과를 낼 수 있도록 하였으며 기본적인 실험으로는 미디를 바탕으로한 5개의 채널에 대하여 실험하여 이를 증명해 보았다.
PDF

오디오 업믹스를 위한 효율적인 Primary-Ambient 분리 알고리즘 (Efficient Primary-Ambient Decomposition Algorithm for Audio Upmix)

백용현;이근상;전세운;이석필;박영철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2012년도 하계학술대회
- /
- pp.160-163
- /
- 2012
업믹스(Upmix) 기술은 홈시어터와 같은 다채널 스피커 재생 환경에서 콘텐츠의 대부분을 차지하는 스테레오 음원을 다채널 환경에 재생하기 위한 채널 포맷 변환 기술을 말한다. 업믹스를 위한 전처리 단계로서 특정 방향으로 패닝된 주(primary)성분과 잔향 및 배경음과 같은 Ambient 성분을 분리하는 과정이 필요하다. Primary와 Ambient를 분리하기 위한 방법으로 채널 간의 상관도, 적응 필터 및 주성분 분석법(principal component analysis, PCA)이 널리 이용되고 있다. 이에 본 논문에서는 비교적 정확하게 Primary와 Ambient를 분리한다고 알려진 주성분 분석법을 이용하여 신호를 분리해 내고 이 때 주성분 분석법이 가지는 문제점을 해결한 향상된 Primary-Ambient 분리 알고리즘을 제안하였다. 제안된 알고리즘은 분리 성능이 Primary 성분이 패닝된 각도에 영향을 받지 않으며 또한 Primary 성분에 섞인 잔여 Ambient를 제거함으로써 기존의 주성분 분석법 보다 더 정확하게 Primary와 Ambient를 분리 할 수 있고 상관성이 없는 Ambient 특성을 좀 더 정확하게 반영한다.
PDF

검색결과 33건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)