• 제목/요약/키워드: 음성 평가

검색결과 1,655건 처리시간 0.025초

무선수중전화기의 통화품질 평가

  • 박문갑;김석재;윤종락
    • 한국어업기술학회:학술대회논문집
    • /
    • 한국어업기술학회 2001년도 추계 수산관련학회 공동학술대회발표요지집
    • /
    • pp.69-70
    • /
    • 2001
  • 음성 통신계를 통해서 전달되는 음성신호 품질의 좋고 나쁨을 수화자의 청각을 거친 반응(주관평가)에 의해 객관적으로 표현한 것을 통화품질이라 한다. 잠수기 어업 등과 같은 수중 활동에 사용할 무선수중전화기 시작품 설계와 최적의 통화품질 평가 방법 선점의 기초 자료로써 레저스포츠등에 인부 사용되고 있는 기존의 무전수중전화기로 수중 음성통신에서의 명료도와 단어 요해도를 측정하였다. (중략)

  • PDF

모음 유형과 표준문단의 문장 위치가 음성장애 환자의 청지각적 및 켑스트럼 및 스펙트럼 분석에 미치는 효과 (Effects of vowel types and sentence positions in standard passage on auditory and cepstral and spectral measures in patients with voice disorders)

  • 최미현;최성희
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.81-90
    • /
    • 2023
  • 청지각적 평가 및 음향학적 분석은 음성평가를 위해 임상 현장에서 일반적으로 사용해오고 있다. 본 연구는 음성장애 환자의 청지각적 및 음향학적 측정 시 말 과제 효과를 조사하고자 한다. 음성장애로 진단받은 총 22명의 환자로부터 모음연장발성(/a/, /e/, /i/, /o/, /u/, /ɯ/, /ʌ/)과 연속구어('가을'표준문단의 9개 하위문장)를 녹음하였다. 음성장애 평가 및 치료 경험이 있는 2명의 음성언어치료사가 맹검 및 무작위 음성 샘플을 사용하여 GRBAS('G', 'R', 'B', 'A', 'S')척도 및 CAPE-V('OS', 'R', 'B', 'S', 'P', 'L')를 사용하여 청지각적 평가를 실시하였다. 또한, ADSV(analysis of dysphonia in speech and voice model)를 이용하여 켑스트럼 및 스펙트럼 측정치를 구하였다. 모음 유형에 따라 GRBAS 척도에서 'B'를 제외하고 청지각적 평가에 영향을 미치지 않았으나, CAPE-V에서는 'OS', 'R', 'B'에 영향을 미쳤다(p<.05). CPP 및 L/H ratio 는 모음 유형과 문장 위치의 영향을 받았다. 표준문단의 CPP값은 모든 모음에서 'G', 하위 9문장과 유의미한 부적 상관 관계가 나타났고, 특히, /e/모음(r=-.739)에서 가장 높은 상관관계를 보였다. 두 번째 문장의 CPP는 모든 모음과 높은 상관관계를 보였다. CAPE-V는 말 자극에 따라 GRBAS보다 청지각적 평가에 더 많은 영향을 받을 수 있으며, 'B' 척도, CPP, L/H ratio는 모음 유형과 자음을 포함한 문장 위치에 따라 영향을 받았다. 따라서, 음성 장애 환자의 음성 평가에서 모음을 사용할 때는 /a/뿐만 아니라 ' 기식성'음질과 음향적으로 상관성이 높은 /i/모음을 함께 사용하는 것이 유용할 수 있다. 또한 /e/모음은 한국 표준문단 '가을' 및 하위 문장들과 음향적으로 상관성이 높았으므로 문단 대신 사용할 수 있을 것이다. 또한, 음성장애 신호들이 대부분 비주기적이라는 점을 감안할 때, CPP와 함께 표준문단 중 가장 음향적으로 상관성이 높은 두 번째 문장을 사용할 수 있을 것이다. 이러한 결과는 말과제가 청지각적 평가 및 음향학적 측정에 미치는 영향에 대한 임상적 증거를 제공하며, 이는 음성장애 환자의 음성 평가에 대한 가이드라인을 제공하는 데 도움을 줄 수 있을 것이다.

연구 및 평가용 음성 데이터베이스의 개발동향과 제안

  • 이용주;김경태
    • ETRI Journal
    • /
    • 제8권3호
    • /
    • pp.24-28
    • /
    • 1986
  • 음성인식 기술개발을 위해서는 음성 데이터베이스가 필요하다. 본고에서는 음성 입출력기술 표준화의 일환으로서의 공통음성 데이터 제정에 관한 각국의 현황을 소개하였고, 우리말을 대상으로 한 음운특성 연구용의 데이터베이스를 확보하기 위한 고려사항을 검토하였다.

  • PDF

청지각적 평가 방식에 따른 음성장애 심한 정도 판단과 자가 신뢰도에 대한 차이 (Effects of EAI and VAS on perceptual judgement and confidence rating by listeners for voice disorders)

  • 이옥분;김선희;정한진
    • 한국산학기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.3046-3050
    • /
    • 2014
  • 본 연구는 음성장애 청지각적 평가인 EAI(등간척도)와 VAS(시각적 아날로그 척도)의 차이점, 각 평가방법에 대한 평가자 자가-신뢰도(confidence rating)을 알아보았다. 30명의 언어병리전공 학생들이 음성장애로 진단받은 화자(N=25)의 발성과 읽기 샘플을 듣고 EAI는 7점 척도, VAS는 0-10cm의 직선에 음성장애 정도를 표시했고, 판단에 대한 자가 신뢰도 점수는 7점 척도로 실시했다. 음성장애 정도에 대한 판단의 준거가 제시되는 상황(조건 1)과 그렇지 않은 상황(조건 2)에서 모음 연장발성과 읽기 과제에 대해 각각 실시했다. 연구 결과, 발성이나 읽기과제에서 모두 동일하게 모두 VAS평가 점수가 높게 산출되었고, 통계적으로 유의하였다. 그 외 조건 1의 읽기과제와 조건 2의 발성과제에 대한 EAI와 VAS평가 점수 간에는 차이가 없었다. 이러한 결과는 음성장애 화자들의 발화 과제와 청지각적 평가유형이 청취자들의 지각적인 판단에 영향을 미칠 수 있으며, 이에 대한 보다 집중된 임상 연구가 계속되어야 할 것을 시사한다.

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

  • Sang-Yeob, Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.87-92
    • /
    • 2023
  • 음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.

적응 웨이블릿 패킷 기반 스펙트럼 차감법을 이용한 음성신호 개선에 관한 연구 (A study on Speech Enhancement Using Adaptive Wavelet Packet Based Spectral Subtraction)

  • 김진호;박정재;장성욱;권영헌;양성일
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.43-46
    • /
    • 2004
  • 본 논문에서는 최근에 제안된 음성신호 개선을 위한 적응 웨이블릿 패킷 기반의 스펙트럼 차감법을 이용하여 다양한 측면에서의 성능평가 결과를 제시한다. 사용된 음성신호 개선 방식은 적응 웨이블릿 패킷의 불균등 주파수 해상도와 높은 에너지 집중도로 인해 발생하는 극대, 극소값의 영향을 피하기 위해 기하평균을 이용하는 스펙트럼 추정법을 사용하였다. 다양한 측면의 성능평가를 위해 주관적 평가 척도인 MOS 와 높은 상관도를 갖는 것으로 알려진 log likelihood ratio, log area ratio, segmental SNR, weighted spectral slope 등을 평가 척도로 사용하였다. Fourier 기저를 사용한 방식과의 비교에서 적응 웨이블릿 패킷 방식은 SegSNR 과 음성의 명료도를 비교적 잘 반영하는 weighted spectral slope 측면에서 우수한 성능을 보였다.

  • PDF

음성 기반 상담의 품질 평가를 위한 자동화 기법 (A Method of Automated Quality Evaluation for Voice-Based Consultation)

  • 이건수;김중연
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.69-75
    • /
    • 2021
  • 언택트 시대의 시작으로, 온라인 산업의 성장 속도는 점차 빨라지고 있다. 온라인 산업이 성장할수록, 고객 관리에 대한 중요성은 높아지며, 그 접점에 존재하는 컨택센터 시장 역시 성장하고 있다. 언택트 시대의 주요 서비스 분야인 컨택센터의 업무가 노동 집약적이라는 아이러니를 극복하고 컨택센터 업무 효율을 증가시키기 위한 다양한 업무 자동화 기술 개발 연구들이 활발하게 진행되고 있다. 본 연구는 업무 자체는 정형적이지만, 그 중요성이 높아 업무 자동화의 효율이 높은 대표적인 컨택센터의 업무 중 하나인 품질평가 업무의 자동화 방법을 제안한다. 제안 방법은 채널 분리된 상담 내용 녹취 내용을 토대로, 음성 인식 결과를 획득한 뒤, 문장단위 발화 내용을 분석하여, 정량 평가 항목인 도입부 평가, 응대 중 경청과 침묵 평가, 그리고 마무리 평가를 수행한 후 수행 결과를 평가표에 맞춰 출력하는 단계를 따른다. 제안 방법은 전문가의 평가 결과 대비 92.7% 일치율을 보였다. 불일치 케이스의 경우, 주로 음성 인식의 오류에 기인한 경우였다. 따라서 음성 인식 결과의 신뢰도가 보장된다면, 본 논문에서 제안한 방법을 통해 자동화된 품질평가로 해당 업무 효율을 증대시킬 수 있을 것이다.

디스플레이 탑재형 음성 인터페이스를 통한 음성쇼핑 서비스 휴리스틱 개발 (The Development of Heuristics for Voice Shopping Service through Voice Interface with Display)

  • 권현정;이지연
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.1-33
    • /
    • 2022
  • 음성을 통해 상품을 구매하는 음성쇼핑 서비스는 미래에 본격적으로 상용화될 것으로 예상된다. 본 연구에서는 음성쇼핑이 세계적으로 일상이 될 미래를 대비하여 디스플레이 탑재형 음성 인터페이스를 활용한 음성쇼핑 서비스 휴리스틱을 개발하였다. 첫째, 이론적 접근으로 '시각 인터페이스', '음성 인터페이스', '쇼핑 서비스'의 설계 원칙을 주제로 한 논문 50건을 읽고 문헌조사를 실시하여 총 29개의 설계 원칙 초안을 제작하였다. 둘째, 실증적 접근으로 소비자 의사결정과정에 따른 쇼핑 경험 및 쇼핑 맥락에서의 정보추구행위에 관한 포커스 그룹 인터뷰를 진행하여 문헌 연구에서 미흡했던 분야인 이용자 경험 측면을 보완한 휴리스틱 초안을 작성하였다. 셋째, 델파이 조사를 통해 위의 두 단계를 거쳐 개발된 휴리스틱 초안에 대하여 20명의 UX, 서비스기획, 인공지능 개발, 쇼핑 분야 전문가들에게 전문가 평가를 해줄 것을 요청하였다. 3회에 걸친 델파이 조사를 통해 최종 휴리스틱을 제안하였다.

롬바드 음성을 이용한 음성인식기의 성능 평가 (Performance Assessment of Speech Recogniger using Lombard Speech)

  • 정성윤;정현열;김경태
    • 한국음향학회지
    • /
    • 제13권5호
    • /
    • pp.59-68
    • /
    • 1994
  • 한국어 음성인식기의 성능평가를 위한 기초 연구로서 인식기의 성능에 영향을 끼치는 여러 요인 중 잡음환경 하에서의 롬바드 영향을 입은 음성을 인식하는 경우 인식기의 성능평가와 분석에 관해 논하였다. 성능평가에 있어서는 표준 음성데이타를 잡음환경에서 발성한 것에 가깝게 조작해서 롬바드 영향을 고려한 경우와 그렇지 않은 경우에 대해 평가항목 (잡음의 종류, 신호대 잡음비) 에 따라 인식실험을 행한 결과, 잡음의 종류는 인식성능에 영향을 미치지 않음을 알 수 있었고, 인식률 90%를 한계치로 했을 경우 롬바드 영향을 고려하지 않았을 때는 신호대 잡음비가 10dB 정도에서, 롬바드 영향을 고려한 경우에는 30dB정도에서 동일한 인식률을 나타내어 롬바드 영향을 고려한 경우가 20dB 정도의 인식률 저하를 가져와 실제 평가시 롬바드 영향을 고려해야 함을 알 수 있었다. 분산분석의 결과로부터는 여러 종류의 인식기를 다양한 평가항목에 대해 평가할 때, 각 평가 항목이 인식성능에 미치는 영향을 정량화할 수 있음을 알 수 있었다.

  • PDF

시각장애인 대상 음성태그리더기의 사용성 평가 및 개선 방안 연구 (A Study on the Usability Evaluation and Improvement of Voice Tag Reader for an Visually Impaired Person)

  • 김소라;조용윤;용태희
    • 사물인터넷융복합논문지
    • /
    • 제9권2호
    • /
    • pp.1-9
    • /
    • 2023
  • 이 연구는 시각장애인들의 생활 편의성 증진을 위해 음성태그리더기의 사용성 평가를 통한 제품의 사용성 개선을 위한 목적으로 수행되었다. 사용성의 원칙과 시각장애인의 특수성을 고려한 평가 모형에 근거하여 19개의 평가 항목에 대한 지각된 사용성 평가가 실시되었다. 제안된 시스템의 베타 버전과 정식 버전에 대한 조사에 1번 이상 참여한 총 50명의 시각장애인이 분석 대상에 포함되었다. 비모수 통계방법을 사용하여 분석한 결과, 음성태그리더기의 안전성과 음성 및 음질, 음성정보의 정확성에 대해서는 비교적 만족한 편이었으나. 리더기의 크기 및 무게, 휴대와 보관의 편의성을 포함한 사용상의 효율성 측면에서는 낮은 평가를 받은 것으로 나타났다. 사용성 향상을 위해 제품 사용을 위한 절차가 보다 간소화될 필요가 있으며, 일반적으로 자주 사용하는 사물에 대한 태그는 사전에 입력을 시켜서 보급하는 것이 도움이 될 것으로 판단된다.