• 제목/요약/키워드: 음질 평가지표

검색결과 8건 처리시간 0.025초

쯔비커의 음질 파라메터를 이용한 환상교향곡 표제성의 심리음향학적 분석 (Psycho-acoustical analysis of program feature of Symphonie Fantastique using Zwicker's sound quality parameters)

  • 정혜욱;정수란;정철웅
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.78-87
    • /
    • 2017
  • 본 논문에서는 심리음향학적 연구 방법론을 음악의 작품 분석에 적용하여 음악의 매개체인 소리에 내재된 주관성을 객관화하고자 한다. 먼저, 대표적인 표제음악인 베를리오즈의 '환상교향곡'에서 18개의 샘플음원을 추출한 다음 쯔비커의 음질 파라메터(Loudness, Sharpness, Roughness, Fluctuation Strength)를 이용해서 샘플음원의 객관적 음질을 평가하였다. 주관적 음질 평가를 위하여 환상교향곡의 표제성을 기초로 9개의 대표 음질형용사를 추출한 다음 수치등급평가법과 쌍대비교법을 사용하여 1차 청음평가를 수행하였다. 1차 청음평가결과의 요인분석법을 통하여 "밝은", "시끄러운", "현실적인"의 세 가지 음질을 추출하였다. 세 가지 음질 형용사를 사용하여 2차 청음평가를 수행하고 그 결과를 객관적 음질 파라메터와 상관분석을 수행하여 음질지표를 개발하였다.

MPEG-2 AAC 디코더의 DSP 구현에 관한 연구 (DSP based implementation of MPEG-2 AAC decoder)

  • 정종훈;김정근;이재식;장태규;장흥엽
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.481-484
    • /
    • 2001
  • 본 논문에서는 MPEG-2 AAC 디코더의 DSP구현에 관한 연구결과로서 IS0/1EC 13818-7 표준에 의거 구현된 MPEC-2 AAC 디코더의 각 세부 기능블럭들의 구성 및 동작원리에 대하여 요약 기술하고. DSP연산에 최적화된 연산구조의 연구를 바탕으로 16bit 고정소수점 연산구조를 가지는 DSP상에서 구현된 MPEG-2 AAC 디로더의 시스템의 하드웨어 및 소프트웨어 구성에 관하여 간략한 기술하였다. 구성된 디코더의 성능평가를 통하여 MPEC-2 AAC 비트스트림을 디코딩하기 위하여 필요로 하는 연산량 및 소요 메모리의 양을 측정하고, 디코더 성능의 중요 척도인 음질평가를 수행하였다. 수행방법으로서 conformance test에 의거하여 PSNR을 측정함으로써 객관적인 성능 지표의 제시와 함께, 주관적인 음질 평가도 병행하여 수행하였다.

  • PDF

스피커의 주관적 청음 평가치와 라우드니스 측정치 간의 상관 관계 (On the Correlation between Subjective Test and Loudness Measurement of the Loudspeaker)

  • 신성환;이정권;정혁;유동구
    • 한국음향학회지
    • /
    • 제19권7호
    • /
    • pp.66-76
    • /
    • 2000
  • 스피커의 음질에 대한 재생 성능을 판단하기 위하여 개발 및 최종 평가 단계에서 수행되는 청음실험은 시간과 경제적 문제뿐만 아니라, 평가자의 평가 능력에 따른 재현성 및 신뢰성에 많은 문제를 나타낸다. 이와 같은 이유로 스피커의 성능은 주관적 평가치 뿐만 아니라 객관적인 지표로서도 나타내는 시도가 함께 이루어져야 한다. 이를 위한 시도의 하나로서, 본 연구에서는 청음실험 및 통계 처리를 실행하여 얻은 주관적 평가 결과와 스피커 재생음에 대한 음질인자 해석을 통하여 얻은 객관적 측정 사이의 관계를 밝히고자 한다. 청음실험 결과는 분산분석법 및 Tukey의 방법을 이용한 네 단계의 통계 처리를 통하여 주관적 평가 결과를 얻고, 객관적 평가를 위해서는 라우드니스 측정을 기본으로 한 충실도 평가치 (Fidelity Rating)와 부드러움 평가치 (Softness Rating)를 제안한 후, 두 평가 결과의 상관도를 계산함으로써 타당성을 검증하였다. 본 연구에서의 방법론을 이용하면, 개발품 및 완성품의 스피커 음질 평가에 있어서, 시간이 많이 들고 비싼 주관 평가 작업이 없이도 통계적으로 안정되게 예측 평가할 수 있다고 본다.

  • PDF

이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기 (Multi-channel input-based non-stationary noise cenceller for mobile devices)

  • 정상배;이성독
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.945-951
    • /
    • 2007
  • 잡음의 제거는 음성을 인터페이스로 하는 기기들에 필수적이라고 할 수 있다. 실질적으로 통화 품질이나 음성 인식률은 음성 입력부의 주변에서 들어오는 원치 않는 가산성 잡음에 의해서 크게 열화된다. 본 논문에서는 기본적으로 두 개의 마이크로폰을 이용한 잡음제거 방법을 제안한다. 마이크를 여러 개 사용했을 때의 장점은 방향 정보를 이용할 수 있다는 것인데 이는 사람 목소리, 음악 소리 등의 비정상성 잡음을 제거하는 데에 유용하다. 제안된 잡음제거 알고리즘은 위너필터에 기반 한다고 볼 수 있다. 위너필터에 의한 잡음제거를 위해서는 검출하고자 하는 음성과 제거하고자 하는 잡음의 주파수 응답이 동시에 추정 가능해야 한다. 이를 위해서 주파수 영역에서 스펙트럼 분류를 시행하여 위너필터 기반의 잡음제거에 필요한 정보를 얻는다. 제안된 알고리즘을 이용한 성능은 잘 알려진 프로스트 (Frost) 알고리즘 및 적응 모드 컨트롤러를 갖는 generalized sidelobe canceller (GSC)와 비교하였다. 성능의 지표로는 객관적 음질 평가의 방법 중에서 널리 쓰이고 있는 perceptual evaluation of speech quality (PESQ) 및 음성 인식률이 사용되었다.

IoT 센서를 이용한 국산 RV차량 음향시스템의 음향특성에 관한 분석 (IoT Based Performance Measurement of Car Audio Systems in Korean Recreation Vehicles)

  • 박형우;이상민
    • 인터넷정보학회논문지
    • /
    • 제18권1호
    • /
    • pp.57-64
    • /
    • 2017
  • 오늘날 자동차 제조회사들은 차량의 기능과 성능을 향상시키는 기술에 주안을 두는 것은 기본이고, 시장성의 극대화 및 고객 만족도를 높이기 위해 고품질 오디오 장치 구축에도 투자를 아끼지 않고 있다. 특히 고가의 차량일수록 일반 청음실에서 느낄 수 있는 높은 수준의 음향 시설을 갖추려고 한다. 이러한 현상은 차량의 모델에 국한되지 않는다. 요즘 인기가 많은 RV차량에서도 고객들이 수준 높은 음질을 만끽할 수 있도록 제조사들은 고품질의 음향 시스템을 탑재하는 움직임을 발견할 수 있다. 그러나 고품질 음향시스템은 대부분 고가의 부품을 필요로 하는 관계로, 이는 필연적으로 자동차 판매가의 증대를 야기한다. 따라서 비교적 저가의 음향시스템을 이용하더라도 고객이 만족해 할 수 있는 음질을 구현하는 차량 내 음향 시스템 구축의 필요성이 대두되었다. 즉, 인간의 청각적 특성이 고려된 객관적인 자동차 '오디오 시스템 성능 측정 지표' 및 튜닝 방법에 관한 연구가 필요하다. 본 논문에서는 RV차량의 오디오 시스템의 성능을 평가하고 개선하기 위해 인간의 청각적 특성이 고려된 오디오 신호의 특성을 사물인터넷(IoT) 센서를 이용해 측정하고 분석하였다. 분석 결과 사람에게 민감한 대역의 높은 에너지지가 있는 점은 인지에 대한 비중을 높일 수 있으나, 해당 대역만 강조된 경우에는 성가심을 유발할 수 있는 것으로 나타났다. 그리고 왜곡된 주파수 평탄도는 음질에 나쁜 영향을 줄 수 있어 주파수 응답의 평탄화를 필요로 한다는 점을 발견할 수 있었다.

RawNet3를 통해 추출한 화자 특성 기반 원샷 다화자 음성합성 시스템 (One-shot multi-speaker text-to-speech using RawNet3 speaker representation)

  • 한소희;엄지섭;김회린
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.67-76
    • /
    • 2024
  • 최근 음성합성(text-to-speech, TTS) 기술의 발전은 합성음의 음질을 크게 향상하였으며, 사람의 음성에 가까운 합성음을 생성할 수 있는 수준에 이르렀다. 특히, 다양한 음성 특성과 개인화된 음성을 제공하는 TTS 모델은 AI(artificial intelligence) 튜터, 광고, 비디오 더빙과 같은 분야에서 널리 활용되고 있다. 따라서 본 논문은 훈련 중 보지 않은 화자의 발화를 사용하여 음성을 합성함으로써 음향적 다양성을 보장하고 개인화된 음성을 제공하는 원샷 다화자 음성합성 시스템을 제안했다. 이 제안 모델은 FastSpeech2 음향 모델과 HiFi-GAN 보코더로 구성된 TTS 모델에 RawNet3 기반 화자 인코더를 결합한 구조이다. 화자 인코더는 목표 음성에서 화자의 음색이 담긴 임베딩을 추출하는 역할을 한다. 본 논문에서는 영어 원샷 다화자 음성합성 모델뿐만 아니라 한국어 원샷 다화자 음성합성 모델도 구현하였다. 제안한 모델로 합성한 음성의 자연성과 화자 유사도를 평가하기 위해 객관적인 평가 지표와 주관적인 평가 지표를 사용하였다. 주관적 평가에서, 제안한 한국어 원샷 다화자 음성합성 모델의 NMOS(naturalness mean opinion score)는 3.36점이고 SMOS(similarity MOS)는 3.16점이었다. 객관적 평가에서, 제안한 영어 원샷 다화자 음성합성 모델과 한국어 원샷 다화자 음성합성 모델의 P-MOS(prediction MOS)는 각각 2.54점과 3.74점이었다. 이러한 결과는 제안 모델이 화자 유사도와 자연성 두 측면 모두에서 비교 모델들보다 성능이 향상되었음을 의미한다.

냉장고 동작부품의 소음특성 분석을 통한 감성품질 개선 (Evaluation of Sound Quality for Ergonomic Design of Movable Parts in a Refrigerator)

  • 강성엽;소새롬;김건우;김지훈;박상후
    • 한국기계가공학회지
    • /
    • 제17권6호
    • /
    • pp.7-15
    • /
    • 2018
  • We propose a method for evaluating sound quality quantitatively to develop high-level home appliances (HA). Generally, a refrigerator has diverse movable parts such as slider, drawer, and folding shelf. Therefore, an engineering treatment to control the noise quality is considered as one of key technologies for a higher level refrigerator. Among the movable parts, we have selected a folding shelf as an example, which is commonly setup inside of a home refrigerator for increasing space convenience, to control the noise quality. However, it is known that its noise level is very high comparing to other movable parts when folding or unfolding actions. In order to evaluate and compare the noise quality, we have tested different eighteen models, and have suggested an impact sound quality index (ISQI) based on subjective evaluation data obtained experimentally by thirty two evaluators. The ISQI was formulated using three sound quality elements (noise peak, raising time, impact duration) to determine psycho-acoustic properties. Through this work, we developed an evaluating process and ISQI that was verified the usefulness by comparing the test results of personal perceptions given by evaluators with the prediction value of ISQI. We showed a good relations between them, so we believe that the proposed method and ISQI can be utilized to control of the noise quality of HA effectively.

음성질환자의 음성검사 시 강도 증가에 따른 음향학적 지표의 변화 (Changes in Acoustic Parameters According to Intensity Increase in Voice Assessment)

  • 남도현;임성수;윤보람;조선아;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제22권2호
    • /
    • pp.143-150
    • /
    • 2011
  • Background and Objectives : Clinically, as a tool for voice assessment before and after the operation or the voice treatment, acoustic analysis is widely used. However, in clinical situations, acoustic parameters vary according to how the assessment is made. Thus, with voice disease patients as subjects, we are to investigate what influence intensity increase exerts on acoustic parameters and how to reduce variation according to the way of assessing. Material and Method : At the voice clinic of the department of otorhinolaryngology in Gangnam Severance Hospital, with 30 female voice-disease patients (40.6 years old on the average) and 23 male voice-disease patients (40.1 years old on the average) as subjects, using the Dr Speech vocal-assessment program, we statistically tested the significance of the difference in each of acoustic parameters between when the "Ah" vowel is produced with a normal voice and when the "Ah" vowel is produced with a loud voice. Results : Acoustic parameters that showed a statistically significant difference according to intensity increase were Jitter, SD F0, and NNE for females, and Jitter, SD F0, HNR, SNR, and NNE for males. Voice quality estimates showed a statistically significant difference according to intensity increase in female hoarse voice, female breathy voice, and male breathy voice. Conclusion : In this research, acoustic analysis, which is generally used for voice assessment before and after the operation or the voice treatment, showed a tendency that acoustic parameters became better under the influence of intensity increase except for the cases where a voice disease was severe. Thus, to raise the reliability of voice assessment, the range of intensity needs to be set up. This should be the topic for the future research.

  • PDF