• 제목/요약/키워드: perceptual audio

검색결과 74건 처리시간 0.019초

지각 오디오 부호화기에서의 스펙트럼 에너지 기반 톤 성분 검출 알고리듬 (Tonality Detection based on Spectrum Energy in Perceptual Audio Coder)

  • 이근섭;연규철;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.770-776
    • /
    • 2004
  • 지각 오디오 부호화기는 신호의 지각적 중복성과 함께 지각에 무관한 성분들을 줄이기 위해 인간의 청각 특성인 마스킹 효과를 이용하여 부호화 과정에서 발생하는 양자화 잡음을 귀에 들리지 않는 수준 이하로 낮춘다. 이때 마스킹 하는 주체인 입력 신호의 특성이 들, 잡음 중 어떤 성분에 가까운지에 따라 주위의 작은 신호들을 마스킹하는 양이 달라지기 때문에 입력 신호의 특성을 알아내는 것은 지각 부호화기의 성능을 좌우하는 중요한 요소이다. 본 논문에서는 낮은 복잡도로 구현 가능한 새로운 톤 성분 검출 알고리듬을 제안하였다. 제안한 알고리듬은 MPEG 심리음향 모델-II 비해 초월함수가 적게 사용되며 사용되는 연산도 단순하기 때문에 낮은 복잡도의 부호화기 구현에 적합하다. 제안한 알고리듬은 다양한 신호들에 대해 성능평가가 수행되었으며, DSP를 사용한 구현 결과 약 3 MIPS 정도로 구현 가능하였다.

지각적으로 가중된 매칭 퍼슈잇을 이용한 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Audio Signals Using Perceptually Weighted Matching Pursuit)

  • 김연지;이인성
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.96-103
    • /
    • 2003
  • 본 논문은 매칭 퍼슈잇 (Matching Pursuit)에 인지적인 가중치를 사용하여 오디오 신호를 정현파 모델링하는 것에 대해 기술한다. 매칭 퍼슈잇은 입력 신호에서 에너지가 가장 큰 성분들을 반복적으로 추출해 원 신호와 재생 신호의 차이가 영에 도달될 때까지 계속된다. 본 논문에서는 매칭 퍼슈잇에 심리음향모델을 사용한 인지적인 매칭 퍼슈잇으로 입력 신호로부터 인지적으로 중요한 성분을 차례대로 추출하였다 인지적인 매칭 퍼슈잇의 성능을 평가하기 위해 인지적인 가중치를 주지 않은 정현파 매칭 퍼슈잇과 비교 평가하였다. 여러 가지 입력 신호에 대한 실험 결과 정현파 매칭 퍼슈잇보다 인지적인 매칭 퍼슈잇의 성능이 좋았고, 특히 시간축 변화율이 큰 신호일 경우에 인지적인 매칭 퍼슈잇을 통해 원래 신호의 음질을 더 잘 복원할 수 있었음을 확인하였다.

A Reversible Audio Watermarking Scheme

  • Kim, Hyoung-Joong;Sachnev, Vasiliy;Kim, Ki-Seob
    • 정보통신설비학회논문지
    • /
    • 제5권1호
    • /
    • pp.37-42
    • /
    • 2006
  • A reversible audio watermarking algorithm is presented in this paper. This algorithm transforms the audio signal with the integer wavelet transform first in order to enhance the correlation between neighbor audio samples. Audio signal has low correlation between neighbor samples, which makes it difficult to apply difference expansion scheme. Second, a novel difference expansion scheme is used to embed more data by reducing the size of location map. Therefore, the difference expansion scheme used in this paper theoretically secures high embedding capacity under low perceptual distortion. Experiments show that this scheme can hide large number of information bits and keeps high perceptual quality.

  • PDF

지각 부호화를 이용한 스테레요 오디오 코덱의 구현 및 음질 평가 (Implementation and evaluation of stereo audio codec using perceptual coding)

  • 차경환;장대영;홍진우;김천덕
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.156-163
    • /
    • 1996
  • In this paper, we described the implementation and the sound quality assessment of a real-time stereo audio codec using TMS320C40 DSP (digital signal processing) chip for low bitrte and high quality audio. We implemented hardware and software in order to overcome a real-time processing problem of audio compression algorithm that can be produced by largely recursive computing and complexity of the process. We have studied five types of distortion that can be produced by perceptual coding and the codec was evaluated by eight test musics that are selected in SQAM (sound quality assessment material) 422-2-4-2 produced by EBU (european broadcast union). The subjective listening tests were carried out on the codec quality and preformance by double blind method in a listening room with eleven listeners. As a result, 5 grade-impairment scale was scored under minus one and the codec quality was evaluated to be perceptible, but not annoying.

  • PDF

고음질 오디오를 위한 디지털 오디오 워터마킹에 관한 연구 (A Study on the Audio watermarking for High Quality Digital Audio)

  • 김정태;구대성;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.125-128
    • /
    • 2000
  • In this paper, we proposed the high quality digital audio watermarking algorithm in the frequency domain. The spread spectrum technique is used to encrypted a stream of information by spreading the data as much of the frequency spectrum as possible. It's technique adapt well to data hiding in audio signal. We have used the perceptual model and MDCT/IMDCT for the high qualify digital audio watermarking. The proposed watermark algorithm preserved high quality audio data from watermark signal.

  • PDF

시청각 자극의 시간적 인지 판단 (Temporal-perceptual Judgement of Visuo-Auditory Stimulation)

  • 유미;이상민;박용군;권대규;김남균
    • 한국정밀공학회지
    • /
    • 제24권1호
    • /
    • pp.101-109
    • /
    • 2007
  • In situations of spatio-temporal perception about visuo-auditory stimulus, researches propose optimal integration hypothesis that perceptual process is optimized to the interaction of the senses for the precision of perception. So, when the visual information considered generally dominant over any other sense is ambiguous, the information of the other sense like auditory stimulus influences the perceptual process in interaction with visual information. Thus, we performed two different experiments to certain the conditions of the interacting senses and influence of the condition. We consider the interaction of the visuo-auditory stimulation in the free space, the color of visual stimulus and sex difference of testee with normal people. In first experiment, 12 participants were asked to judge the change in the frequency of audio-visual stimulation using a visual flicker and auditory flutter stimulation in the free space. When auditory temporal cues were presented, the change in the frequency of the visual stimulation was associated with a perceived change in the frequency of the auditory stimulation as the results of the previous studies using headphone. In second experiment, 30 male and 30 female were asked to judge the change in the frequency of audio-visual stimulation using a color of visual flicker and auditory flutter stimulation. In the color condition using red and green. Both male and female testees showed same perceptual tendency. male and female testees showed same perceptual tendency however, in case of female, the standard deviation is larger than that of male. This results implies that audio-visual asymmetry effects are influenced by the cues of visual and auditory information, such as the orientation between auditory and visual stimulus, the color of visual stimulus.

MPEG-II AAC Encoder의 perceptual Model에 관한 연구 (A study on the Perceptual Model for MPEG II AAC Encoder)

  • 구대성;김정태;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.93-96
    • /
    • 2000
  • Currently, the most important technology is the compression methods in the multimedia society. Audio files are rapidly propagated through internet. MP-3 is offered to CD tone quality in 128Kbps, but 64Kbps below tone quality is abruptly down and high bitrate. on the other hand, MPEG-II AAC (Advanced Audio Coding) is not compatible with MPEG-I, but AAC has a high compression ratio 1.4 better than MP-3. Especially, AAC has max. 7.1 channel and 96KHz sampling rate. In this paper, the perceptual model is dealt with 44.1KHz sampling rate for SMR(Signal to Masking Ratio)

  • PDF

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

지각형 컨벌루션 잡음 제어를 통한 음질 개선 방법 (Signal Quality Enhancement using Perceptual Convolutional Noise Suppression)

  • 김헌중;한헌수;홍민철;차형태
    • 방송공학회논문지
    • /
    • 제8권1호
    • /
    • pp.11-18
    • /
    • 2003
  • 본 논문에서는 잡음 에너지에 의한 지각적 간섭현상 해석을 통한 지각적 컨벌루션 잡음 제어에 의한 음질 개선 방법을 연구하였다. 지각적 컨벌루션 잡음은 잡음에 의한 신호의 지각적인 특성 변화 및 잡음 추정오차에 의한 잔여 잡음의 영향을 반영하는 것이다. 실험 결과 임계대역 여기 에너지를 통한 지각적 부가 잡음 제어 필터와 순음도 변화도를 통한 지각적 컨벌루션 잡음 제어 필터가 대등한 음질 개선 성능을 나타내었으며, 다양한 잡음 환경에서도 우수한 음질 개선을 나타냄을 확인 할 수 있었다.

지각 모델링을 이용한 디지털 오디오 워터마킹 방법 (Digital Audio Watermarking Scheme Using Perceptual Modeling)

  • 석종원;홍진우
    • 방송공학회논문지
    • /
    • 제6권2호
    • /
    • pp.195-202
    • /
    • 2001
  • 디지털 워터마킹 기법은 디지털 멀티미디어 컨텐츠의 저작권 보호를 위한 새로운 해결책으로 제시되고 있으며, 국내외에서 이와 관련된 연구가 활발히 진행되고 있다. 본 논문에서는 최근 들어 많은 관심을 끌고있는 디지털 오디오의 저작권 보호를 위한 새로운 워터마킹 방법을 소개한다. 제안된 워터마킹 기법은 MPEG의 심리음향모델을 사용하여 지각적으로 감지되지 않을 뿐 아 니라, 워터마크 검출 시에도 전처리 과정을 거쳐 원본 오디오 신호 없이도 워터마크의 검출이 가능하다. 개발된 오디오 워터마킹기술은 원본 오디오에 비해 오디오의 품질이 떨어지지 않을 뿐 아니라, 워터마크를 제거하고자 가해지는 다양한 공격에도 워터마크가 제거되지 않는 특징을 가지고 있다. 또한, 기존의 확산대역 방식을 이용하는 워터마킹 방법이 시간축 변형 공격에 상당히 취약한 단점을 가지는 것에 비해, 제안된 방법은 변형된 형태의 원본 신호를 워터마크로 사용하여 시간축 공격에도 안정적으로 워터마크를 검출할 수 있었다.

  • PDF