• 제목/요약/키워드: 음질 파라미터

검색결과 70건 처리시간 0.025초

G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법 (Non-Intrusive Speech Quality Estimation of G.729 Codec using a Packet Loss Effect Model)

  • 이민기;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.157-166
    • /
    • 2013
  • 본 논문은 패킷 손실의 영향을 이용한 비 침입적 음질 평가 방법을 제안한다. 패킷 손실은 패킷 기반의 통신 시스템에서 음질을 저하시키는 주된 요소이며 그 영향은 코덱에 내장된 패킷 손실 은닉 알고리듬에 의해 결정된다. 패킷 손실 영향을 반영한 음질평가 시스템을 위해 VoIP 에서 협대역 코덱으로 사용되는 코덱 중 하나인 G.729를 선택하였으며, 음성 특징에 따른 패킷 손실 영향을 구분하기 위해서 G.729 코덱의 음성 파라미터를 이용한 한 음성 특성 분류기를 설계하였다. 이후, 각각의 패킷 특성에 따른 음질 저하의 정도를 수치화하기 위해 원 PESQ-LQ점수와 상관계수를 최대화하는 음질 저하 가중치를 반복적으로 구하였으며, 최종 음질 저하는 가중합으로 구하였다. 그 결과 제안한 모델과 PESQ-LQ의 상관계수는 칩입 모델 에서는 0.8950를, 비 침입 모델 에서는 0.8911의 결과를 나타내었다.

주파수 영역에서 구간조건을 이용한 음향학적 반향 제거 (Frequency Domain Acoustic Echo Suppression Based on Boundary Condition)

  • 이규호;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.162-166
    • /
    • 2009
  • 본 논문은 적응 반향 제거기인 parametric wiener filter (PWF)의 반향신호 제거 파라미터를 구간 조건에 따라 차등적으로 적용시키는 새로운 음향학적 반향제거 (Acoustic Echo Suppression, AES) 알고리즘을 제안한다. PWF는 반향 신호 추정의 부정확성을 보상하고자 반향신호 제거 파라미터를 사용한다. 기존의 방법은 단일통화 구간과 동시통화 구간에 관계없이 동일한 반향신호 제거파라미터 값을 적용하여 동시통화 환경에서 근단 신호의 왜곡을 발생 시킨다. 본 논문에서는 상관계수 (Correlation Coefficient)를 이용한 동시통화(Double-Talk) 검출 알고리즘과 음성구간검출기 (Voice Activity Detector, VAD)의 결과로부터, 원단 화자만 있는 구간과 동시통화 구간을 구분하고 각각의 경우에 반향제거 파라미터를 달리 적용하여 동일한 반향신호 제거 파라미터를 사용함에 따른 동시통화 구간내의 근단 화자신호의 음질 저하 없이 반향신호를 보다 효과적으로 제거하는 방법을 제안한다. 제안된 방법의 결과는 객관적인 실험을 통해 비교 평가한 결과 우수한 성능을 보였다.

음악 및 음성 신호의 융합 압축 기술 (Unified coding scheme of speech and music)

  • 오은미
    • 방송과미디어
    • /
    • 제16권4호
    • /
    • pp.59-71
    • /
    • 2011
  • 오디오와 음성 압축 기술적 근간은 서로 다르지만, 최근의 모바일 멀티미디어 기기 시장의 컨버전스 현상에 따라 압축하고자 하는 신호가 혼용되고 있으며, 비슷한 목표 전송률과 음질로 수렴하고 있다. 현재는 동일 기기에서 서로 다른 압축 기술을 적용하고 있으나, 음성과 음악이 동시에 서비스 되는 멀티미디어 기기에서는 단일 압축 방식으로 처리하고자 하는 이슈가 부각되고 있다. 특히, 스마트 폰 및 음악 콘텐츠 포탈 서비스의 대중화를 고려할 때, 음성 및 음악 신호 모두를 효율적으로 압축하는 음악 및 음성 신호의 융합 압축 기술이 더욱 필요해 보인다. 본 고에서는 MPEG 오디오 그룹에서 가장 최근 진행한 Unified Speech and Audio Coding(USAC)의 탄생 배경 및 표준화 현황을 소개한다. USAC는 64kbps 이하에서 기술적으로 최고 성능을 지닌 AMR-WB+ 및 HE-AAC v2보다도 우월한 음질을 보이며, 높은 비트율에서도 동등한 음질을 보장한다. 이런 우수한 음질에 기여한 USAC의 스위칭 구조와 더불어 기술적으로 향상된 주요 모듈인 파라미터 기반 스테레오 및 고주파 압축, 그리고 엔트로피 코딩 방식에 대해서 살펴 본다. 향후, 다양한 오디오 신호를 효율적으로 압축하는 USAC는 디지털 라디오, 모바일 TV, 그리고 오디오 북과 같은 사용자 시나리오에서 사용될 확률이 높아 보인다. 또한, USAC는 배경 잡음이나 배경 음악이 있는 경우에도 성능이 우수하기 때문에 YouTube 및 podcast 등과 같이 사용자가 콘텐츠를 생성할 때도 유용하게 사용 될 수 있다.

디지틀 이동통신용 RPE-LTP 음성부호화기

  • 김선영;김진업;정종태;김영식
    • 전자통신동향분석
    • /
    • 제5권4호
    • /
    • pp.42-59
    • /
    • 1990
  • 세계적인 추세에 근거하여, 디지틀 이동 통신용 음성 부호화 방식 표준안 선정을 위해 평가 대상 방식으로 DSBC(Dynamic bit allocation SubBand Coding), RPE-LTP(Regular Pulse Excited Long Term Prediction),CELP(Code Excited Linear Prediction) 등을 선정한 바 있다.본 논문에서는 이들 방식중 13 kbps RPE-LTP의 실현 및 성능평가에 관하여 다루었다. 먼저 음질에 중요한 영향을 미치는 분석/합성부호화에 근거한 파라미터 양자화 방법 그리고 채널 코딩과의 연계를 위한 비트 중요도 해석 등을 언급하였다. 끝으로 시뮬레이션 결과를 나타내었다.

음향 파라미터에 의한 정서적 음성의 음질 분석 (Analysis of the Voice Quality in Emotional Speech Using Acoustical Parameters)

  • 조철우;리타오
    • 대한음성학회지:말소리
    • /
    • 제55권
    • /
    • pp.119-130
    • /
    • 2005
  • The aim of this paper is to investigate some acoustical characteristics of the voice quality features from the emotional speech database. Six different parameters are measured and compared for 6 different emotions (normal, happiness, sadness, fear, anger, boredom) and from 6 different speakers. Inter-speaker variability and intra-speaker variability are measured. Some intra-speaker consistency of the parameter change across the emotions are observed, but inter-speaker consistency are not observed.

  • PDF

CELP 보코더 전송률 감소를 위한 발성속도 측정 방법 (On a Study of Measurement Method of Utterance Velocity for the Reduction of Transmission Rate in CELP Vocoder.)

  • 장경아;나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.175-179
    • /
    • 2000
  • 음성의 발성속도가 빠른 경우에는 발성속도가 느린 경우보다 적은 정보만으로도 부호화가 가능하다 음성의 발성속도가 빠른 경우에는 청취시 낮은 주파수 대역의 정보가 높은 주파수대역의 정보보다 중요하게 된다. 음성 부호화 기술은 전송를과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송를에 비해 우수한 음질을 제공하지만, 기존 방식은 음성의 발성속도에 대해서 처리를 달리하지 않고 사용하고 있다. 음성의 발성속도를 측정하여 발성속도가 빠를 경우에, 발성속도가 느린 경우보다 낮은 대역의 정보만 전송한다면 전송율을 감소시킬 수 있다. 본 논문에서는 CELP 부호화기의 전송률 감소를 위해 발성속도를 측정하는 방법을 제안한다. LSP 파라미터가 가지고 있는 정보로 음소의 변화율을 측정하였다. 각각 다른 발성속도를 갖는 음성시료에 대하여 음소 변화율을 구한 결과 발성속도가 다른 경우, 뚜렷하게 다른 음소 변화율을 갖는 것을 알 수 있었고. 빠르게 발성한 경우가 느리게 발성한 경우보다 42.8%가 높게 나왔다.

  • PDF

LSP변화도를 이용한 G-723.1 보코더의 VAD 성능향상에 관한 연구 (Improvement of VAD Performance using the LSP Variation in the G.723.1)

  • 이희원;나덕수;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.19-22
    • /
    • 2000
  • ITU-T 국제 표준화 기구에서 인터넷 폰과 화상회의를 목적으로 개발된 G.723.1 음성 부호화기는 잡음 구간에서의 전송률을 낮추기 위한 방법으로 VAD(Voice Activity Detector)와 CNG(Comfortable Noise Generator)를 사용하고 있다. 이중 VAD는 최종적으로 현재 프레임의 에너지 레벨을 비교하여 음성의 활동 유무를 판정하고 있다. 하지만 G.723.1 VAD에서는 보다 안정적인 판정을 위해 음성 활동 구간 사이에 삽입되어 있는 묵음 구간에 대해서는 거의 대부분 음성이 활동하는 영역으로 판정을 하고 있다. 따라서 본 논문에서는 묵음 구간에 대해 보다 정확한 판정을 통하여 기존의 방법에 비해 전송률을 더욱 감소시킬 수 있는 방법을 제안한다. 제안한 방법은 음성신호와 잡음신호의 LSP 파라미터 간격 정보를 이용하여 음성구간을 검출한다. 묵음구간을 길게 조절한 문장을 사용하여 실험한 결과 VAD=1로 판정한 프레임수가 약 $48.98\%$ 감소하였으며 주관적인 음질평가의 경우 음질의 열하는 거의 발생하지 않았다.

  • PDF

G.723.1 MP-MLQ 부호화기의 성능개선에 관한 연구 (The Research of Improving The Performance of the G.723.1 MP-MLQ Vocoder)

  • 민소연;나덕수;김정진;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.49-52
    • /
    • 1999
  • 4.8kbps 내외의 전송률에서 양호한 음질을 제공하는 CELP 계열 음성 부호화기 중에서 인터넷 폰 및 화상회의를 목적으로 개발된 G.723.1은 5.3kbps ACELP(Algebraic CELP)와 6.3kbps MP-MLQ(Multi-Pulse Maximum Likelihood Quantization) 두 개의 부호화기를 포함하고 있다[1]. 이 중 MP-MLQ는 고정 코드북 검색 시 많은 계산량으로 인해 실시간 구현에 어려움이 따르고 있다. 이러한 문제점을 개선하기 위해 본 논문에서는 유/무성음을 분리한 후 grid bit를 먼저 결정하여 코드북을 검색하는 방법 제안한다. LSP 파라미터의 분포특성을 이용하여 유/무성음을 분리한 후 무성음에 대해서는 스펙트럼 정보만 전송하고 유성음에 대해서만 코드북 검색을 수행한다. 그리고 코드북 검색 시 Grid bit를 먼저 결정하여 수행하였다. Grid bit는 짝/홀수번째 전체 펄스를 이용하여 합성한 합성음과 DC 성분이 제거된 원음과의 비교를 통하여 결정하였다. 실험 결과 전체 처리시간은 평균적으로 약 $20.55\%$ 감소하였으며 주관적 음질평가 결과 음질 열하는 거의 발생하지 않았다.

  • PDF

구개편도와 아데노이드 비대 아동의 음성 특성 (The Voice Characteristics of Children with Palatine Tonsil and Adenoid Hypertrophy)

  • 송윤경
    • 한국음향학회지
    • /
    • 제28권8호
    • /
    • pp.790-795
    • /
    • 2009
  • 본 연구는 구개편도와 아데노이드 비대가 있는 아동이 구호흡을 하게 되면 만성적인 성대 건조를 유발하게 되고, 이러한 조건이 음질을 저하시킬 수 있을 것이라는 가설을 검증하기 위하여, 만 5세-8세의 정상 아동 68명과 구개편도와 아데노이드 비대아동 50명을 대상으로 MDVP 음성분석을 시행하였다. 연구 결과 정상 아동에 비하여 구개편도와 아데노이드 비대 아동은 Jitt, RAP, PPQ, Shim, APQ 파라미터에서 모두 통계적으로 유의미하게 높은 수치를 나타내어 낮은 음질을 보이고 있음을 알 수 있었다. 따라서 언어치료사나 이비인후과 전문의 등은 구개편도와 아데노이드 비대 아동의 음성문제 가능성을 인식하고, 이들의 음성위생법 교육에 관심을 가져야 할 것으로 여겨진다.

연속적인 프레임 손실 상황에서의 G.729 PLC 성능개선 (The Performance Improvement of G.729 PLC in Situation of Consecutive Frame Loss)

  • 홍성훈;김진우;배명진
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.34-40
    • /
    • 2010
  • 인터넷이 널리 보급이 되면서 인터넷을 이용한 다양한 서비스가 제공되고 있다. 이 중 인터넷 망을 이용한 음성통신서비스는 저렴한 가격에 그 사용비율이 점차 증가하고 있다. 그러나 기존 전화기의 회선교환방식과는 달리 패킷교환방식을 사용하기 때문에 패킷의 지연, 손실 및 지터 등으로 인해 음질 저하가 발생한다. 인터넷망에서 사용하는 음성부호화기는 자체적으로 PLC (Packet Loss Concealment) 알고리즘을 사용하고 있지만 연속적인 패킷 손실에 대해서는 취약하다. 본 논문에서는 개선된 G.729 PLC알고리즘과 G.711 Appendix I에서 사용한 PLC 알고리즘을 이용하여 연속적인 패킷 손실 하에서 음질 저하를 개선하기 위해 LP (Linear Prediction) 파라미터 보간, 여기신호 복원, 여기신호이득 복원 방법을 제안한다. 성능 평가 결과 기존 대비 약 11% 정도 성능이 향상 되었다.