• 제목/요약/키워드: 음원의 분리

검색결과 89건 처리시간 0.018초

5.1채널 스피커 시스템에서 트랜스오럴 필터 구현에 관한 연구 (A Study on the Transaural Filter Implementation for 5.1 Channel Speaker System)

  • 최갑근;방승범;김순협;정완섭
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.245-255
    • /
    • 2002
  • 5.1채널 스피커 시스템을 이용하여 음향을 재현시 나타나는 현상인 크로스토크를 제거하여 청취자에게 보다 입체적인 음을 재현하는 방법에 관한 것이다. 본 논문에서는 크로스토크를 제거하기 위하여 자유음장 모델을 사용하였다. 이것을 구현함에 있어 주파수 영역에서 심리음향에 기초한 바크 스케일 (bark scale)을 사용한 복소이득 보상을 실시하였으며, 서라운드 채널에 관해서는 밴드패스 필터를 추가하여 주파수 제한적인 음질 보상을 실시하였다. 정면 채널과 서라운드채널의 음원을 제작하여 기존의 2채널 및 5.1 시스템에서 제시하는 음원과 비교하여 객관적인 음질 평가 및 청취자를 대상으로 한 주관 평가를 실시하였다. 제안된 방법에 따라 측정한 결과에 따르면 ±30°의 정면 스피커를 배치한 돌비 표준 스피커 배치에서 38 dB이상의 분리도를 얻었으며 확산감에 대해 전문가를 대상으로 한 주관 평가는 5점 평가를 기준으로 0.4점이 향상되었다.

가상 음원 위치 정보를 이용한 능동 메트릭스 디코더 (A Perception Based Active Matrix Decoder with Virtual Source Location Information)

  • 문한길
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.18-24
    • /
    • 2010
  • 본 논문에서는 돌비 프로로직 II/IIx를 대체하기 위한 가상 음원 위치 정보 기반의 새로운 메트릭스 디코더 시스템을 제안하고자 한다. 제안하는 신규 메트릭스 디코더는 역행렬 계산을 통해 얻어지는 수동 메트릭스 디코딩부와 수동 메트릭스 디코딩을 통해서 얻은 신호들을 멀티채널 신호의 채널간 이미지 특성에 따라서 적응적으로 가변시키는 능동 메트릭스 디코딩부로 구성된다. 멀티채널 환경에서 채널 간에 형성되는 다수의 이미지는 실제 청각 시스템에 의해서 인지되어 만들어지는 가상의 사운드 이벤트와 연결이 되어 있다. 따라서 이 이미지의 위치와 크기에 기반하여 멀티채널 신호를 적응적으로 가변시키면, 인지적인 관점에서 우수한 성능의 메트릭스 디코더를 설계할 수 있다. 더불어 채널간 분리도를 향상시키기 위해서 비선형 삼각함수의 조합을 사용하였다.

크로스토크 제거를 통한 입체 음향 구현에 관한 연구 (A Study on the Implementation of Realistic Sound Through Cross-Talk Cancellation)

  • 김학진
    • 대한전자공학회논문지SP
    • /
    • 제41권2호
    • /
    • pp.99-108
    • /
    • 2004
  • 5.1채널 스피커 시스템을 이용하여 음향을 재현 시 나타나는 현상인 크로스토크를 제거하여 청취자에게 보다 입체적인 음을 재현하는 방법에 관한 것이다. 본 논문에서는 자유음장 모델에 기초하여 5.1채널 스피커 시스템의 보상함수를 해석, 이를 심리음향에 기초한 바크 스케일(bark scale) 등가 보상 밴드패스 필터에 적용하여 주파수 제한적인 음질 보상을 실시하였다. 정면 채널과 서라운드 채널의 음원을 제작하여 기존의 2채널 및 5.1 시스템에서 제시하는 음원과 비교하여 객관적인 음질평가 및 청취자를 대상으로 한 주관 평가를 실시하였다. 제안된 방법에 따라 측정한 결과에 따르면 ±30。의 정면 스피커를 배치한 돌비 표준 스피커 배치에서 38㏈ 이상의 분리도를 얻었으며 확산감에 대해 전문가를 대상으로 한 주관 평가는 5점 평가를 기준으로 0.4점이 향상되었다.

크로스토크 제거를 위한 바크스케일 등가 보상 필터를 이용한 음질 향상에 관한 연구 (A Study on the Sound Quality Improvement Using the Equal Compensation Filter in Bark-scale for the Cross-talk Cancellation)

  • 김학진;김순협
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.345-352
    • /
    • 2004
  • 본 논문에서는 자유음장 모델을 기초로 5.1채널 스피커 시스템의 보상함수를 해석하고, 이를 심리음향에 기초한 바크 스케일(bark scale) 등 가 보상 밴드패스 필터에 적용하여 주파수 제한적인 음질 보상에 대한 실험을 통해 5.1채널 스피커 시스템에서 음향 재현시 나타나는 크로스토크를 제거함으로써 보다 입체적인 음을 재현하는 방법을 제안하였다. 정면 채널과 서라운드 채널의 음원을 기존의 2채널 및 5.1채널 시스템에서 제시하는 음원과 비교를 위하여 음질 평가와 함께 청취자를 대상으로 주관적인 평가를 실시하였다. 실험 결과 \pm30{\circ}$의 정면 스피커를 배치한 돌비 표준 스피커 배치에서 38dB 이상의 분리도를 얻었으며, 전문가 그룹의 음의 확산감에 대한 주관 평가에서는 5점 평가를 기준으로 0.4∼0.5점, 음의 깊이감 평가에서는 0.1∼0.2점이 향상되었다.

에너지와 위상을 고려한 선택적 주파수 차감법을 이용한 보컬 분리 (Vocal Separation Using Selective Frequency Subtraction Considering with Energies and Phases)

  • 김현태;박장식
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.408-413
    • /
    • 2015
  • 최근 원음 반주기에 대한 관심이 증가됨에 따라 고가의 스튜디오 직접 녹음 방법 대신 보다 저렴한 방법을 시도하고 있다. 그 구체적인 방법으로는 가수의 음악 앨범에서 가수의 목소리만 제거하여 원음 반주 음원을 만드는 것이다. 본 논문에서는 보컬이 포함된 구간에서 스테레오로 녹음된 반주음악에서 보컬을 분리하는 시스템을 제안한다. 제안하는 시스템은 두 단계로 구성된다. 첫 단계는 보컬을 검출하는 단계이다. 이 단계에서는 MFCC를 가지고 SVM 방법을 이용하여 입력 신호를 보컬 부분과 비보컬 부분으로 분리한다. 두 번째 단계에서는 보컬 부분에 대해 각 주파수 빈별로 선택적 주파수 차감을 수행한다. 이 때 채널 신호의 주파수 빈별로 에너지 값 뿐만 아니라 위상까지 고려하여 차감 여부를 판별한다. 제안하는 방법으로 보컬을 제거한 음악에 대한 청취 실험에서 상대적으로 높은 만족도를 보여준다.

차량용 음성인식을 위한 주변잡음에 강건한 브라인드 음원분리 (Robust Blind Source Separation to Noisy Environment For Speech Recognition in Car)

  • 김현태;박장식
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.89-95
    • /
    • 2006
  • 독립성분분석을 사용한 암묵신호분리의 성능은 잔향이 존재하는 환경에서 잔류 누설 성분 (cross-talk) 때문에 현저히 저하된다. 본 논문에서는 잔류 누설 성분을 제거하기 위한 후처리 방법을 제안한다. 제안하는 방법은 주파수 영역에서의 변형된 NLMS(normalized least mean square) 필터를 사용하며 필터의 역할은 잔류 누설 성분을 유발하는 누설 경로를 추정하는 데 있다. 특정 채널에서 잔류하는 누설 성분은 상대 채널의 직접 성분에 해당되므로 관측되는 상대 채널의 입력신호를 이용하여 누설 경로를 추정할 수 있다. 변형된 NLMS 필터는 필터 입력 신호의 전력과 추정 오차 신호의 전력을 함께 고려하여 정규화한다. 특정 채널의 직접 신호 성분은 적응 필터에서 잡음처럼 동작하여 결국 적응필터가 오조정되기 때문에 제안하는 방법을 통해 적응필터의 오조정을 방지할 수 있다. 음성 신호를 사용한 컴퓨터 시뮬레이션 결과를 통해 제안하는 방법이 후처리를 사용하지 않은 경우에 비해 잡음 제거 성능(NRR)이 약 3dB 정도 개선되는 것을 확인 할 수 있다.

  • PDF

비음수 행렬 분해 (NMF)를 이용한 악보 전사 (Music Transcription Using Non-Negative Matrix Factorization)

  • 박상하;이석진;성굉모
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.102-110
    • /
    • 2010
  • 악보 전사란, 오디오 파일로부터 음고 (음표의 높낮이)와 리듬 (음표의 길이) 정보를 추출하여 악보를 만드는 것이다. 본 논문에서는 음원 분리 및 데이터 분류에 자주 사용되는 Non-Negative Matrix Factorization (NMF)와 Non-Negative Sparse Coding (NNSC) 방식을 사용하여 오디오 파일을 주파수와 리듬 성분으로 분류하였다. 또한 배음 통합 (subharmonic summation) 방법으로 분류된 주파수들로부터 기본 진동 주파수를 계산하였고, 이로써 악보를 야루는 음표의 높낮이를 정확히 얻을 수 있었다. 제안한 방식으로 악보 전사거 성공적으로 이루어졌고, NMF 혹은 NNSC만 사용하여 악보 전사를 하였던 기존의 논문들에 비해 향상된 결과를 얻을 수 있었다.

천해환경에서 전구음원을 이용한 지음향인자의 역추정 (Inverse Estimation of Geoacoustic Parameters in Shallow Water Using tight Bulb Sound Source)

  • 한주영;이성욱;나정열;김성일
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.8-16
    • /
    • 2004
  • 천해환경에서 저주파 광대역신호와 수직선배열을 이용하여, 퇴적층의 지음향인자(층두께, 종파속도, 종파감쇠계수, 밀도)를 역추정하였다. 역산방법은 모델 기반의 역산으로 유전알고리즘 (Genetic Algorithm)을 이용한 일관적 광대역 정합장처리(Coherent Broadband Matched Field Processing)기법을 사용하였다. 저주파 광대역음원으로 사용된 상업용 전구의 내폭신 호는 짧은 시간동안 많은 변화를 포함하는 천이신호이기 때문에, 분석시 시간과 주파수에 따른 창함수의 조절이 요구되는데, 주기신호분석에 주로 사용되는 퓨리에 기반의 분석방법은 이러한 점에서 많은 어려움이 있다. 본 논문에서는 해양도파관에서 근거리 음파전달 시 계측된 시계열신호로부터 다중경로성분을 구분하고 추출하기 위하여 시간-주파수영역에서 창함수의 크기조절이 가능한 웨이블릿 변환을 통한 신호 분석을 수행하였고, 분석된 실측음장과 계산된 복제음장의 연속웨이블릿 계수를 상호상관 시킴으로써 비용함수를 정의하였다. 비용함수의 전역최고점을 찾는 최적화 과정을 통하여 각 퇴적층의 지음향인자들을 역추정하였다. 특히 역산인자의 민감도에 따른 퇴적층별, 인자별, 분리연산을 수행함으로써 최적화과정에서 참값으로의 수렴효율을 높였다. 역산의 결과 실험해역 퇴적물 상층부에는 두께 44.43m, 음속 1549 m/s의 모래-실트-점토질(sand-silt-clay)층이 존재하고, 그 하부에는 12.28m 음속 1993 m/s의 거친모래질(Coarse sand)층의 존재를 추정해 내었다. 또한 역산 결과를 시추자료 및 탄성파 자료와 비교함으로써 본 논문에서 제안한 역산 방법의 유효성을 확인하였다.

미디어 오디오에서의 DNN 기반 음성 검출 (DNN based Speech Detection for the Media Audio)

  • 장인선;안충현;서정일;장윤선
    • 방송공학회논문지
    • /
    • 제22권5호
    • /
    • pp.632-642
    • /
    • 2017
  • 본 논문에서는 미디어 오디오의 음향 특성 및 문맥 정보를 활용한 DNN 기반 음성 검출 시스템을 제안한다. 미디어 오디오 내에 포함되어 있는 음성과 비음성을 구분하기 위한 음성 검출 기법은 효과적인 음성 처리를 위해 필수적인 전처리 기술이지만 미디어 오디오 신호에는 다양한 형태의 음원이 복합적으로 포함되어 있으므로 기존의 신호처리 기법으로는 높은 성능을 얻기에는 어려움이 있었다. 제안하는 기술은 미디어 오디오의 고조파와 퍼커시브 성분을 분리하고, 오디오 콘텐츠에 포함된 문맥 정보를 반영하여 DNN 입력 벡터를 구성함으로써 음성 검출 성능을 개선할 수 있다. 제안하는 시스템의 성능을 검증하기 위하여 20시간 이상 분량의 드라마를 활용하여 음성 검출용 데이터 세트를 제작하였으며 범용으로 공개된 8시간 분량의 헐리우드 영화 데이터 세트를 추가로 확보하여 실험에 활용하였다. 실험에서는 두 데이터 세트에 대한 교차 검증을 통하여 제안하는 시스템이 기존 방법에 비해 우수한 성능을 보임을 확인하였다.

오디오 컨텐츠를 위한 비음수 행렬 분해 기법 기반의 실시간 단일채널 배경 잡음 추출 기법 (Online Monaural Ambient Sound Extraction based on Nonnegative Matrix Factorization Method for Audio Contents)

  • 이석진
    • 방송공학회논문지
    • /
    • 제19권6호
    • /
    • pp.819-825
    • /
    • 2014
  • 본 논문에서는 비음수 행렬 분해 (NMF) 기법을 이용하여 단일 채널에서 배경음 성분을 추출하는 알고리즘에 대해 서술한다. 이러한 배경음 성분 추출은 오디오 업믹싱 시스템을 고려하여 개발되었으며, 기존의 연구를 통하여 분리된 배경음 신호가 업믹싱 시스템에 적용될 경우 공간감을 향상시킬 수 있다는 사실이 이미 확인된 바 있다. 다만 기존의 기법은 음향 신호를 모두 축적하여 일괄적으로 처리해야 한다는 단점이 있어, 스트리밍 시스템이나 디지털 시그널 프로세서 (DSP) 등을 이용한 시스템에서 사용되기 어렵다. 본 논문에서는 이를 해소하기 위하여 실시간 비음수 행렬 분해 기법을 이용한 배경음 추출 시스템을 고안하여 실험하였다. 실험에서 처리된 음원을 스펙트럼 평활도를 이용하여 분석한 결과, 고안된 배경음 추출 시스템이 기존의 일괄 추출 시스템과 유사한 정도로 배경음 성분을 추출했음을 확인할 수 있었다.