• 제목/요약/키워드: speech quality evaluation

검색결과 178건 처리시간 0.026초

한국어판 음성장애지수와 음성관련 삶의 질의 타당도 및 신뢰도 연구 (Validity and Reliability of Korean-Version of Voice Handicap Index and Voice-Related Quality of Life)

  • 김재옥;임성은;박선영;최성희;최재남;최홍식
    • 음성과학
    • /
    • 제14권3호
    • /
    • pp.111-125
    • /
    • 2007
  • It is important to examine patients' subjective evaluation as well as objective measures and clinician's rating to assess voice disorders. This study aimed to evaluate validity and reliability of Korean-version of Voice Handicap Index (KVHI) and Voice-Related Quality of Life (KVQOL) with 113 adults with voice disorders and 111 normal adults. Content validity was verified by three experienced speech-language pathologists. Concurrent validity was revealed by examining the correlation among KVHI, KVQOL, and Voice Rating Scale as well as item discrimination coefficients. Total scores of KVHI and KVQOL of adults with voice disorders were significantly different from those of normal adults. Test-retest reliability and internal consistencies were significantly high in both KVHI and KVQOL. Correlations among scores of each subscale and total score were also significantly high in each tool. The study revealed that KVHI and KVQOL are suitable tools to be used in clinics and research areas in Korea, which can subjectively evaluate the effects of voice disorders on daily life as well as on quality of life.

  • PDF

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

  • 김지민;정재희;여찬은;김우일
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.342-350
    • /
    • 2022
  • 본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.

음절 유형별 규칙합성음 음질평가 (The Evaluation of Speech Quality Synthesized by Rule According to Korean Syllable Types)

  • 강찬희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.93-97
    • /
    • 1993
  • 본 논문은 한국어 문어변환(TTS:Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성음 평가방법으로는 한국어 발음대사전에 수록된 빈도수 순위대로 추출한 음절(V형: 19개, CV형:80개, VC형:30개, CVC형: 100개, 총 229개)을 대상으로 규칙합성시킨 1음절어(합성음절수:229개)중 음절유형별로 15개씩 총 60개 음절을 20초간 3회 반복음의 녹음 테이프를 작성한 합성음에 대하여 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성 등 4 가지 항목에 대하여 오피니온 평가를 수행한 결과를 제시하였다.

  • PDF

SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘 (Transcoding Algorithm for SMV and AMR Speech Coder)

  • 이덕종;정규혁;이인성
    • 한국음향학회지
    • /
    • 제27권8호
    • /
    • pp.427-434
    • /
    • 2008
  • 본 논문에서는 SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘을 제안한다. 각기 다른 통신망에서 음성부호화기간의 효율적인 연동을 위해 가장 간단한 방법인 tandem 방식이 있지만 긴 지연시간과 많은 연산량, 그리고 음질 저하의 문제점들을 해결하기위해 상호부호화 방법을 사용한다. 제안하는 상호부호화 알고리즘은 LSP (Line Spectral Pairs) 변환, 피치 변환, 그리고 고속 고정 코드북 탐색을 수행한다. 실험 결과, $20\sim50%$의 적은 계산량과 $5\sim10$ ms의 지연 시간을 줄이면서도 동등한 음질을 확인할 수 있었다.

적응적 신호 크기 예측을 이용한 G.711 패킷 손실 은닉 알고리즘의 성능향상 (Performance Improvement of Packet Loss Concealment Algorithm in G.711 Using Adaptive Signal Scale Estimation)

  • 김태하;이인성
    • 한국음향학회지
    • /
    • 제34권5호
    • /
    • pp.403-409
    • /
    • 2015
  • 본 논문에서는 G.711 패킷 손실 은닉 알고리즘의 성능향상을 위해 적응적 신호 크기 예측을 사용하는 패킷 손실 알고리즘을 제안한다. 기존의 방법은 연속 손실이 발생하였을 때 20 %의 감쇠인자를 가지고 이득조절을 수행하였다. 그러나 이 방법은 신호의 변화를 고려하지 않기 때문에 신호가 왜곡되는 경우가 발생한다. 따라서 Least Mean Square(LMS) 예측기를 사용하여 이전과 이후 프레임의 정보를 통한 적응적 신호 크기 예측으로 이득을 조절하는 것을 제안한다. 제안된 알고리즘의 성능 평가는 Perceptual Evaluation of Speech Quality(PESQ) 평가를 통하여 나타내었다.

Comfort Noise를 이용한 다중 적응 코드북 기반 패킷 손실 은닉 알고리즘 (A Packet Loss Concealment Algorithm Based on Multiple Adaptive Codebooks Using Comfort Noise)

  • 박남인;김홍국
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.873-874
    • /
    • 2008
  • In this paper, we propose a packet loss concealment (PLC) algorithm for CELP speech coders, which is based on multiple adaptive codebooks by using comfort noise for the lost packet recovery. The multiple adaptive codebooks are composed of a conventional adaptive codebook to model periodic excitation of speech and another adaptive codebook to provide a better estimate of excitation when packets are lost in the speech onset region. The performance of the proposed PLC algorithm is evaluated by implementing it into the G.729 decoder and compared with that of the PLC algorithm employed in the G.729 decoder by means of perceptual evaluation of speech quality (PESQ). It is shown from the experiments under different burstiness of packet loss rates of 3% and 5% that the proposed PLC algorithm provides higher PESQ scores than the G.729 PLC algorithm.

  • PDF

Quality of Life in Older Adults with Cochlear Implantation: Can It Be Equal to That of Healthy Older Adults?

  • Tokat, Taskin;Muderris, Togay;Bozkurt, Ergul Basaran;Ergun, Ugurtan;Aysel, Abdulhalim;Catli, Tolgahan
    • 대한청각학회지
    • /
    • 제25권3호
    • /
    • pp.138-145
    • /
    • 2021
  • Background and Objectives: This study aimed to evaluate the audiologic results after cochlear implantation (CI) in older patients and the degree of improvement in their quality of life (QoL). Subjects and Methods: Patients over 65 years old who underwent CI at implant center in Bozyaka Training and Research Hospital were included in this study (n=54; 34 males and 20 females). The control group was patient over 65 years old with normal hearing (n=54; 34 males and 20 females). We administered three questionnaires [World Health Organization Quality of Life-BREF (WHOQOL-BREF), World Health Organization Quality of Life-OLD (WHOQOL-OLD)], and Geriatric Depression Scale (GDS) to evaluate the QoL, CIrelated effects on activities of daily life, and social activities in all the subjects. Moreover, correlations between speech recognition and the QoL scores were evaluated. The duration of implant use and comorbidities were also examined as potential factors affecting QoL. Results: The patients had remarkable improvements (the mean score of postoperative speech perception 75.7%) in speech perception after CI. The scores for the WHOQOL-OLD and WHOQOL-BREF questionnaire responses were similar in both the study and control groups, except those for a two subdomains (social relations and social participation). The patients with longer-term CI had higher scores than those with short-term CI use. In general, the changes in GDS scores were not significant (p<0.05). Conclusions: The treatment of hearing loss with CI conferred significant improvement in patient's QoL (p<0.01). The evaluation of QoL can provide multidimensional insights into a geriatric patient's progress and, therefore, should be considered by audiologists.

Quality of Life in Older Adults with Cochlear Implantation: Can It Be Equal to That of Healthy Older Adults?

  • Tokat, Taskin;Muderris, Togay;Bozkurt, Ergul Basaran;Ergun, Ugurtan;Aysel, Abdulhalim;Catli, Tolgahan
    • Journal of Audiology & Otology
    • /
    • 제25권3호
    • /
    • pp.138-145
    • /
    • 2021
  • Background and Objectives: This study aimed to evaluate the audiologic results after cochlear implantation (CI) in older patients and the degree of improvement in their quality of life (QoL). Subjects and Methods: Patients over 65 years old who underwent CI at implant center in Bozyaka Training and Research Hospital were included in this study (n=54; 34 males and 20 females). The control group was patient over 65 years old with normal hearing (n=54; 34 males and 20 females). We administered three questionnaires [World Health Organization Quality of Life-BREF (WHOQOL-BREF), World Health Organization Quality of Life-OLD (WHOQOL-OLD)], and Geriatric Depression Scale (GDS) to evaluate the QoL, CIrelated effects on activities of daily life, and social activities in all the subjects. Moreover, correlations between speech recognition and the QoL scores were evaluated. The duration of implant use and comorbidities were also examined as potential factors affecting QoL. Results: The patients had remarkable improvements (the mean score of postoperative speech perception 75.7%) in speech perception after CI. The scores for the WHOQOL-OLD and WHOQOL-BREF questionnaire responses were similar in both the study and control groups, except those for a two subdomains (social relations and social participation). The patients with longer-term CI had higher scores than those with short-term CI use. In general, the changes in GDS scores were not significant (p<0.05). Conclusions: The treatment of hearing loss with CI conferred significant improvement in patient's QoL (p<0.01). The evaluation of QoL can provide multidimensional insights into a geriatric patient's progress and, therefore, should be considered by audiologists.

음성 강화를 위한 a priori SNR 추정기반 적응 바람소리 저감 방법 (An Adaptive Wind Noise Reduction Method Based on a priori SNR Estimation for Speech Eenhancement)

  • 서지훈;이석필
    • 전기학회논문지
    • /
    • 제64권12호
    • /
    • pp.1756-1760
    • /
    • 2015
  • This paper focuses on a priori signal to noise ratio (SNR) estimation method for the speech enhancement. There are many researches for speech enhancement with several ambient noise cancellation methods. The method based on spectral subtraction (SS) which is widely used in noise reduction has a trade-off between the performance and the distortion of the signals. So the need of adaptive method like an estimated a priori SNR being able to making a high performance and low distortion is increasing. The decision directed (DD) approach is used to determine a priori SNR in noisy speech signals. A priori SNR is estimated by using only the magnitude components and consequently follows a posteriori SNR with one frame delay. We propose a modified a priori SNR estimator and the weighted rational transfer function for speech enhancement with wind noises. The experimental result shows the performance of our proposed estimator is better Perceptual Evaluation of Speech Quality scores (PESQ, ITU-T P.862) compare to the conventional DD approach-based systems and different noise reduction methods.

인공와우 사용자의 심리음향적 음질평가 예비연구 (A preliminary study of sound quality evaluation of cochlear implant users)

  • 방정화;오수희
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.45-51
    • /
    • 2022
  • 음질평가는 물리적 음향 자극에 대해 주관적으로 지각되는 음색을 평가한다는 측면에서 심리음향학적 측정과 관련이 있다. 본 논문은 인공와우 사용자의 음질평가를 위한 예비연구로서 바이모달 인공와우 사용자를 대상으로 음질평가를 시행하고 인공와우만 착용했을 때와 바이모달을 착용했을 때의 음질평가 차이를 파악하고자 하였다. 총 13명의 바이모달 인공와우 사용자와 7명의 편측 인공와우 사용자가 연구에 참여하였고 순음 및 어음 청력검사, 보청기 기능이득과 실이삽입이득을 측정하였다. 음질평가에서는 바이올린소리, 남자와 여자 노래소리, 냉장고 소음의 4개 음향자극을 방음실에서 들려주고 6개 음질평가 항목에 대해 0에서 10까지의 척도로 표시하도록 하였다. 검사결과 바이모달 사용자는 편측 인공와우만 착용했을 때보다 바이모달을 착용했을 때 음질평가 5개 항목에서 0.8점 높았고, 바이모달 사용자와 편측 인공와우 사용자 그룹간 비교에서는 두 그룹 사이에 차이를 보이지 않았다. 주관적 측면의 바이모달 혜택 측정을 위해서 좀 더 체계적인 음질평가 도구와 방법에 대한 후속 연구가 필요할 것으로 생각된다.