• 제목/요약/키워드: perceptual weighting

검색결과 27건 처리시간 0.023초

Perceptual weighting on English lexical stress by Korean learners of English

  • Goun Lee
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.19-24
    • /
    • 2022
  • This study examined which acoustic cue(s) that Korean learners of English give weight to in perceiving English lexical stress. We manipulated segmental and suprasegmental cues in 5 steps in the first and second syllables of an English stress minimal pair "object". A total of 27 subjects (14 native speakers of English and 13 Korean L2 learners) participated in the English stress judgment task. The results revealed that native Korean listeners used the F0 and intensity cues in identifying English stress and weighted vowel quality most strongly, as native English listeners did. These results indicate that Korean learners' experience with these cues in L1 prosody can help them attend to these cues in their L2 perception. However, L2 learners' perceptual attention is not entirely predicted by their linguistic experience with specific acoustic cues in their native language.

인지 LPC cepstrum의 새로운 구현 및 음성인식에의 적용 (A new Implementation of Perceptual LPC Cepstrum and its Application to Speech Recognition)

  • 김진영;최승호
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.61-64
    • /
    • 1996
  • 본 논문에서는 귀의 주요한 특징인 주파수가중특성과 Bark-scale이라는 비선형주파수특성을 선형주파수축상에서 고려한 거리함수를 정의하고, 이 거리함수로부터 새로운 LPC cepstrum 계수를 제안한다. 귀의 특성은 선형주파수축에서 로그 스펙트럼에 대한 가증함수로서 표현되며, 이 가중함수는 cepstrum 영역에서 콘볼루션으로 표현되어 콘볼루션적으로 가중되는 LPC cepstrum을 정의하게 된다. 제안된 cepstrum 계수에서 정의된 가중함수는 A-weighting의 영향과 비선형주파수축의 영향을 하나의 가중함수로 통합하여 사용된 것이다. 제안된 파라미터의 성능을 음성인식 실험을 통하여 검증하였다.

  • PDF

지각적으로 가중된 매칭 퍼슈잇을 이용한 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Audio Signals Using Perceptually Weighted Matching Pursuit)

  • 김연지;이인성
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.96-103
    • /
    • 2003
  • 본 논문은 매칭 퍼슈잇 (Matching Pursuit)에 인지적인 가중치를 사용하여 오디오 신호를 정현파 모델링하는 것에 대해 기술한다. 매칭 퍼슈잇은 입력 신호에서 에너지가 가장 큰 성분들을 반복적으로 추출해 원 신호와 재생 신호의 차이가 영에 도달될 때까지 계속된다. 본 논문에서는 매칭 퍼슈잇에 심리음향모델을 사용한 인지적인 매칭 퍼슈잇으로 입력 신호로부터 인지적으로 중요한 성분을 차례대로 추출하였다 인지적인 매칭 퍼슈잇의 성능을 평가하기 위해 인지적인 가중치를 주지 않은 정현파 매칭 퍼슈잇과 비교 평가하였다. 여러 가지 입력 신호에 대한 실험 결과 정현파 매칭 퍼슈잇보다 인지적인 매칭 퍼슈잇의 성능이 좋았고, 특히 시간축 변화율이 큰 신호일 경우에 인지적인 매칭 퍼슈잇을 통해 원래 신호의 음질을 더 잘 복원할 수 있었음을 확인하였다.

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

상호부호화기의 후처리 필터와 인지가중 필터를 대신하는 새로운 필터 설계 및 성능 평가 (New filter design to replace the post and perceptual weighting filter of transcoder and performance evaluation)

  • 최진규;윤성완;강홍구;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2232-2235
    • /
    • 2003
  • In speech communication systems where two different speech codecs are interoperated, transcoding algorithm is a good approach because of its low complexity and improved synthesized speech quality. This paper proposes an efficient method to further improve the performance of transcoding algorithms as well as to reduce the complexity. In the conventional transcoding algorithms. a post-filter and a perceptual weighting filter should be operated sequentially because both decoding and encoding processes are needed. This results in the redundancy of the processing in terms of complexity and perceptual quality. Using the fact that their filter structures are similar, we replaced the two filters with one. The proposed algorithm requires 72.8% lower complexity than the conventional transcoding algorithm when we compare only the complexity of the filtering processes. The results of both objective and subjective tests verify that the proposed algorithm has slightly better quality than the conventional one.

  • PDF

Exploring stress encoding cues in English by Korean L2 speakers

  • Goun Lee
    • 말소리와 음성과학
    • /
    • 제16권3호
    • /
    • pp.33-38
    • /
    • 2024
  • The present study investigated the perceptual cues utilized by Korean L2 learners of English in recognizing lexical stress in English nonwords, with a focus on the roles of fundamental frequency (F0) and duration. Twenty-three Korean learners of English participated in a sequence recall task involving nonword stimuli under five different conditions: (1) the naturally-produced stimuli, (2) the duration-only condition, (3) the F0-only condition, (4) the duration-F0 matching condition, and (5) the duration-F0 conflicting condition. The results demonstrate that F0 is the primary cue for stress perception among Korean L2 learners, whereas duration acts as a secondary cue, particularly when F0 is unreliable or absent. These findings highlight the influence of L1 prosodic structures on L2 perception and suggest that Korean L2 learners adapt their perceptual weighting of stress based on cue availability. This study contributes to the understanding of the role of cue weighting in L2 prosodic acquisition.

A Perceptually Motivated Active Noise Control Design and Its Psychoacoustic Analysis

  • Bao, Hua;Panahi, Issa M.S.
    • ETRI Journal
    • /
    • 제35권5호
    • /
    • pp.859-868
    • /
    • 2013
  • The active noise control (ANC) technique attenuates acoustic noise in a flexible and effective way. Traditional ANC design aims to minimize the residual noise energy, which is indiscriminative in the frequency domain. However, human hearing perception exhibits selective sensitivity for different frequency ranges. In this paper, we aim to improve the noise attenuation performance in perceptual perspective by incorporating noise weighting into ANC design. We also introduce psychoacoustic analysis to evaluate the sound quality of the residual noise by using a predictive pleasantness model, which combines four psychoacoustic parameters: loudness, sharpness, roughness, and tonality. Simulations on synthetic random noise and realistic noise show that our method improves the sound quality and that ITU-R 468 noise weighting even performs better than A-weighting.

누설요소와 인간 시각 시스템을 이용한 HDTV 영상 압축 알고리듬 (HDTV Image Compression Algorithm Using Leak Factor and Human Visual System)

  • 김용하;최진수;이광천;하영호
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.822-832
    • /
    • 1994
  • DSC-HDTV 시스템은 영상에 존재하는 공간, 시간, 진폭의 중복성을 제거하기위하여 변환 부호화, 움직임 보상 예측 부호화, 적응 양자화를 이용한다. 본 논문에서는 장면 변화와 전송 잡음으로부터 신속히 화질을 복원하는데 이용하는 누설요소의 적용 방법과 인간 시각 시스템을 이용한 인식하중치를 구하여 적응 양자화하는 방법을 제안한다. 인식하중치는 대비 민감도, 시공간 매스킹과 주파수 민감도에 따라 구한다. 적응 양자화는 인식하중치와 버퍼이력상태로부터 얻은 전체 왜곡 레벨을 이용하고 그에 따른 잉여 비트량은 다음 프레임의 화질 개선에 이용된다. 장면이 변할 경우 복원된 영상은 큰 양자화 오차를 포함하기 때문에 움직 보상 예측 부호화에서 구한 변위프레임 차신호가 큰 값이 되어 비트량이 증가하고 버퍼의 상태가 불안정하게 된다. 그러므로 본 논문에서는 누설요소를 장면이 변할 경우 0으로 하고 그이후의 프레임에서의 15/16으로 고정하여 전체왜곡레벨을 표준편차를 이용하여 조절한다. 실험결과 제안된 방법의 영상의 화질은 수 프레임내에 복원되고 버퍼상태도 신속히 안정화된다.

  • PDF

주파수 특성을 이용한 미세 계위적 동영상 부호화 방법 (A Fine Granular Scalable Video Coding Algorithm using Frequency Weighting)

  • 김승환;호요성
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.124-131
    • /
    • 2003
  • 본 논문에서는 최근 비디오 스트리밍 응용을 위해 만들어진 FGS((me granular scalability) 방식에서 주어진 비트율에서 인간 시각에 좀더 나은 화질을 얻기 위해 주파수 가중 방법을 제안한다. 제안된 방식에서는 각 DCT 계수의 사람 눈에 미치는 중요도를 고려하여 구해진 주파수 가중행렬을 비트평면 부호화를 사용하는 FGS 상향계층 부호화 동작에 적용될 수 있도록 주파수 천이 행렬로 바꾸어서 가중치를 부여한다. 본 논문에서 제안된 주파수 가중 방법을 통해 화질의 향상, 더 미세한 계위 부호화, 시간 영역에서 화질의 균일화를 얻을 수 있었다. 또한, 주파수 가중 방법을 통해 얻은 화질 개선을 설명하기 위해 기존에 사용하던 PSNR(peak signal to noise ratio) 대신에 인간 시각적인 관점에서의 오차만을 고려한 JNDE(just noticeable difference ewer)를 Weber의 법칙을 근거로 하여 새롭게 제안하였다.