• 제목/요약/키워드: Psychoacoustic model

검색결과 55건 처리시간 0.031초

심리음향모델 기반의 디지털 오디오 워터마킹 (Digital Audio Watermarking Based on Psychoacoustic Model)

  • 송유수;김종환;신경욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.772-775
    • /
    • 2005
  • 본 논문에서는 대역확산 기반 오디오 워터마킹 삽입에 대한 연구를 하였다. 최근 디지털 저작권을 확인하는데 디지털 워터마크가 사용되고, 영상, 문서뿐만 아니라 디지털 오디오 분야에서도 연구가 이루어지고 있다. MP3(MPEG Audio Layer-III)에 사용하는 심리음향모델을 이용함으로써 음질에 영향을 주지 않고 지각 할 수 없는 디지털 저작권을 삽입 할 수 있다. 본 논문에서는 대역확산 기반 오디오 워터마킹을 위한 심리음향모델을 분석하고 Matlab으로 모델링하여 시뮬레이션 하였으며, 이를 대역확산 기반 오디오 워터마크 삽입에 적용하였다.

  • PDF

MPEG-2 AAC Encoder의 심리음향 모델 최적화 (An Optimization on the Psychoacoustic Model for MPEG-2 AAC Encoder)

  • 박종태;문규성;이강현
    • 전자공학회논문지CI
    • /
    • 제38권2호
    • /
    • pp.33-41
    • /
    • 2001
  • 최근 멀티미디어 분야 중에서 가장 중요한 기술 중의 하나가 압축이다. 오디오 파일들은 인터넷을 중심으로 급속히 전파되어가고 있으며, 그 중에서 가장 유명한 것이 MP-3(MPEC-1 Layer3)인데, MP-3는 128Kbps에서 CD음질을 얻을 수 있지만 64Kbps 이하에서는 음질이 급속히 떨어진다. 반면에 MPEG-2 AAC(Advanced Audio Coding)는 MPEG-1과 호환성을 무시하지만 MP 3보다 1.4배의 높은 압축 율을 갖으며, 최대 7.1채널과 96KHz의 샘플 율을 갖는다. 본 논문에서는 MPEG-2 AAC 인코더 부분에서 막대한 연산 량을 갖는 심리음향 모델을 최적화하여 AAC 인코딩 연산 량을 감소시키며 처리속도를 증가하는 알고리즘을 제안한다. 심리음향 모델 최적화 응용 프로그램은 C++언어를 이용하여 구현하였으며, 실험결과 심리음향 모델은 SMR(Signal to Masking Ratio)을 위하여 44.1KHz의 샘플 율을 갖고 2048포인트의 FFT(Fast Fourier Transform)연산을 수행하며, 인코더 블록의 제어를 위하여 서브밴드 필터에 각각의 엔트로피 값들이 입력된다. 제안된 심리음향 모델은 비 예측성 값의 최적화로 인하여 빠른 속도로 수행되었다. 또한 비 예측성 값을 순음지수로 변화 시, 고 주파수 영역의 순음지수 값의 최적화로 연산처리 속도가 증가하였다.

  • PDF

A Perceptually Motivated Active Noise Control Design and Its Psychoacoustic Analysis

  • Bao, Hua;Panahi, Issa M.S.
    • ETRI Journal
    • /
    • 제35권5호
    • /
    • pp.859-868
    • /
    • 2013
  • The active noise control (ANC) technique attenuates acoustic noise in a flexible and effective way. Traditional ANC design aims to minimize the residual noise energy, which is indiscriminative in the frequency domain. However, human hearing perception exhibits selective sensitivity for different frequency ranges. In this paper, we aim to improve the noise attenuation performance in perceptual perspective by incorporating noise weighting into ANC design. We also introduce psychoacoustic analysis to evaluate the sound quality of the residual noise by using a predictive pleasantness model, which combines four psychoacoustic parameters: loudness, sharpness, roughness, and tonality. Simulations on synthetic random noise and realistic noise show that our method improves the sound quality and that ITU-R 468 noise weighting even performs better than A-weighting.

저 전송률 환경에서 선형예측 전처리기를 사용한 HE-AAC의 성능 향상 (Quality Improvement of Low Bitrate HE-AAC using Linear Prediction Pre-processor)

  • 이재성;이건우;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제34권8C호
    • /
    • pp.822-829
    • /
    • 2009
  • 본 논문은 선형예측 전처리기을 이용하여 저 전송률 환경에 적합한 HE-AAC의 구조를 제안한다. 저 전송률 환경에서는 HE-AAC의 적절하지 못한 비트 할당 알고리즘 때문에 많은 스펙트럴 홀(스펙트럼 홀)들이 발생을 하고 있으며, 그로 인해서 심각한 음질의 열화가 발생하고 있다. 이를 해결하기 위해서 선형예측 전처리기을 사용하여 저 전송률에서 비트가 적절하게 할당되도록 하였다. HE-AAC로 들어오는 입력신호는 선형예측 전처리기에 의해서 LP 계수와 레지듀얼 신호로 나눠지게 되며, AAC 부분은 분리된 레지듀얼 신호를 부호화하게 된다. 제안된 방법의 성능 평가를 위해서 지각적 잡음(Perceptual noise)의 측정을 통한 객관적인 실험과 MUSHRA 테스트를 통한 주관적인 실험을 하였고, 그 결과 저 전송률 환경에서 제안된 방법을 사용함으로써 성능을 향상시킬 수 있음을 확인하였다.

가변 전송율 MPEG 오디오 (Variable Bitrate MPEG Audio)

  • 남승현
    • 공학논문집
    • /
    • 제2권1호
    • /
    • pp.57-62
    • /
    • 1997
  • MPEG-1에서 사용하고 있는 두가지 심리음향모델은 서로 다른 매스킹 패턴과 매스킹 인덱스 그리고 매스킹 레벨의 산출 과정을 거친다. 결과적으로 모델 1은 우수한 순음/잡음 판별로 인하여 정확한 매스킹 레벨을 산출하지만 SMR 산출에 worst case를 가정하고 오디오 신호의 동적인 상태를 무시하기 때문에 모델 2보다 저하된 성능을 보여주는 것으로 밝혀졌다. 본 연구에서는 고정 전송율로 설계된 MPEG-1 오디오를 가변 전송율로 변환하였을 때 심리음향모델 1과 2의 성능이 어떻게 나타나는지에 대해 알아보았다. 모의 실험 결과 모델 2는 1에 비해 dual channel 모드에서 평균 30kbps, joint stereo 모드에서 평균 20 kbps 정도 이득을 제공하는 것으로 나타났다. 일반적으로 joint stereo 모드는 dual channel 모드에 비해 많은 이득을 제공하는 것으로 알려져 있는데, 이러한 현상은 attack이 많은 오디오 신호의 경우 모델 1에서 더 심하게 나타남을 알 수 있다. 이는 모델 1이 pre-echo를 줄이기위해 각 채널에서 과도하게 SMR을 산출하기 때문이다.

  • PDF

잡음 형상화에 의한 오디오 워터마크 설계 (Design of Audio Watermarks by Noise Shaping)

  • 이진걸
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1432-1438
    • /
    • 2005
  • 심리음향모델을 기반으로 주파수영역에서 잡음을 형상화하여 오디오 신호에 부가하였을 때 부가된 잡음이 지각되지 않는 방법을 제안하였다. 신호의 마스킹 문턱값으로부터 지각되지 않는 잡음의 준위를 구하는 것은 심리음향모델에서 확산함수와 관련된 디컨버루션을 수반하는데 난제(ill-conditioned Problem)로 알려져 있다. 본 논문에서는 최적화 기법을 적용하여 잡음의 여기준위를 신호의 마스킹 준위에 일치시킴으로써 신호에 부가된 잡음이 청각적으로 지각되지 않는 한도 내에서 최대한의 잡음준위가 되도록 형상화하는 방법을 제시하고 실험적으로 그 타당성을 증명하였다.

  • PDF

Digital Watermarking Using Psychoacoustic Model

  • Poomdaeng, S.;Toomnark, S.;Amornraksa, T.
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.872-875
    • /
    • 2002
  • A digital watermarking technique applying psychoacoustic model for audio signal is proposed in this paper. In the watermarking scheme, the pseudo-random bit stream used as a watermark signal is embedded into the audio signal in both speech and music. The strength of the embedded signal is subject to the human auditory system in such a way that the disturbances on host audio signal are beyond the sensing of human ears. The experimental results show that the quality of the watermarked audio signal, in term of signal to noise ratio, can be improved up to 3.2 dB.

  • PDF

심리음향 모델과 웨이블릿 패킷 변환을 이용한 잡음제거기 (Noise suppressor Using Psychoacoustic Model and Wavelet Packet Transform)

  • 김미선;김영주;이인성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.345-346
    • /
    • 2006
  • In this paper, we propose the noise suppressor with the psychoacoustic model and wavelet packet transform. The objective of the scheme is to enhance speech corrupted by colored or non-stationary noise. If corrupted noise is colored, subband approach would be more efficient than whole band one. To avoid serious residual noise and speech distortion, we must adjust the Wavelet Coefficient threshold. In this paper, the subband is designed matching with the critical band. And WCT is adapted by noise masking threshold(NMT) and segmental signal to noise ratio(seg_SNR). Consequently this work improve the PESQ-MOS about 0.23 in the case of coded speech.

  • PDF

심리음향 모델을 이용한 무선 음성인식 시스템 (Wireless Speech Recognition System using Psychoacoustic Model)

  • 노진수;이강현
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.110-116
    • /
    • 2006
  • 본 논문에서는 무선 음성 센서를 사용하여 스위치 제어나 생체신호 인증과 같은 유비쿼터스 센서 네트워크 응용 서비스를 지원하기 위한 음성인식 시스템을 구현하였다. 제안된 시스템은 무선 음성센서와 심리음향 모델을 이용한 음성인식 알고리즘과 에러정정을 위한 LDPC(Low Density Parity Check) 모듈로 구성된다. 제안된 음성인식 알고리즘은 센서의 소비 에너지를 효율적으로 사용하기 위하여 호스트 컴퓨터에 삽입되며, 음성인식의 정확도를 향상시키기 위하여 전방향 에러정정 알고리즘을 사용하였다. 또한, 효율적으로 무선채널의 잡음을 제거하고 무선채널 에러를 정정하기 위하여 실험 환경과 실험 계수를 최적화하였다. 결과적으로, 센서와 음원 사이의 거리가 1.0m 이하 일 때 FAR 0.126%와 FRR 7.5%를 얻었다.

스포츠웨어용 투습발수직물 소리가 심리음향학적 특성에 미치는 영향 (Effect of Fabric Sound of Vapor Permeable Water Repellent Fabrics for Sportswear on Psychoacoustic Properties)

  • 이지현;이규린;진은정;양윤정;조길수
    • 감성과학
    • /
    • 제15권2호
    • /
    • pp.201-208
    • /
    • 2012
  • 본 연구에서는 심한 소음으로 불쾌감을 주는 스포츠웨어용 PTFE 라미네이팅 투습발수 직물 8종을 대상으로 직물 마찰음의 심리음향학적 특성을 고찰하고, 심리음향학적 특성에 영향을 미치는 직물의 기본 특성과 역학적 특성 간의 관계를 파악함으로써, 직물의 심리음향학적 마찰음을 낮출 수 있는 변인을 찾아내고자 하였다. 직물 마찰음 시뮬레이터를 이용하여 녹음한 직물의 소리에서 Zwicker의 파라미터인 심리음향학적 크기(loudness(Z)), 날카로움(sharpness(Z)), 거칠기(roughness(Z)), 그리고 변동강도(fluctuation strength(Z))를 계산한 뒤, 소리특성에 대한 사후검정 결과에 따라 시료를 덜 시끄러운 PTFE 필름 그룹과 더 시끄러운 PTFE 필름 그룹으로 나누어 마찰음의 심리음향학적 특성과 직물의 역학적 특성, 기본특성간의 관계를 고찰하였다. 심리음향학적 특성 중 loudness(Z)만이 시료의 마찰음과 유의한 관계에 있는 것으로 나타났으며, 분석 결과 직물의 기본 특성에서는 layer가 얇고 필라멘트사를 사용한 직물의 마찰음이 덜 시끄럽게 인지되는 것으로 나타났으며, 직물 마찰음의 심리음향학적 크기에 영향을 미치는 주요변수로는 layer로 것으로 나타났다. 마찰음이 작은 PTFE 필름 그룹의 경우 전단 방향으로의 변형이 어려울수록 마찰음이 시끄나타났다. 시끄러운 마찰음을 갖는 PTFE 필름 그룹의 경우 심리음향학적 크기에 영향을 미치는 주요 변수로 전단이력이 설명 변인으로 포함되었다.

  • PDF