• Title/Summary/Keyword: 음성 평가

Search Result 1,655, Processing Time 0.039 seconds

뉴스라인 / 이동통신 3사

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.9 s.124
    • /
    • pp.166-177
    • /
    • 2003
  • 이동통신 3사(SKT, KTF, LGT)의 음성통화 및 무선데이터 서비스에 대한 품질평가 결과 대체적으로 양호한 것으로 나타났다. 정보통신서비스 품질평가협의회는 지난 4월부터 7월까지 측정한 이동통신 3사의 음성통화 및 무선데이터 서비스에 대한 평가결과를 지난달 13일 공개했다. 품질평가협의회에서는 사업자간 품질개선을 유도하고 순위비교를 통한 광고경쟁 등 부작용을 줄이기 위해 과거의 5단계 평가(수, 우, 미, 양, 가)방법을 '양호'와 '미흡'의 2단계로 조정해 평가했다.

  • PDF

Performance of ITU-T 8kbit/s Speech Coding Standard (CS-ACELP) (ITU-T 8kbit/s 음성부호화표준 CS-ACELP의 성능)

  • Kim, J.H
    • Electronics and Telecommunications Trends
    • /
    • v.13 no.2 s.50
    • /
    • pp.53-66
    • /
    • 1998
  • 본 고에서는 ITU가 수행해 온 음성 부호화 표준의 역사 그리고 1996년 ITU-T에서 승인된 8kbit/s 음성 부호화 표준인 CS-ACELP의 구성에 대해서 분석하였다. 또한, 미래 유, 무선 통신 시스템에 있어서 핵심 음성 부호화 기술로 자리잡게 될 CS-ACELP의 품질평가와 주요 애플리케이션을 살펴보았다.

Conformer-based Elderly Speech Recognition using Feature Fusion Module (피쳐 퓨전 모듈을 이용한 콘포머 기반의 노인 음성 인식)

  • Minsik Lee;Jihie Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.39-43
    • /
    • 2023
  • 자동 음성 인식(Automatic Speech Recognition, ASR)은 컴퓨터가 인간의 음성을 텍스트로 변환하는 기술이다. 자동 음성 인식 시스템은 다양한 응용 분야에서 사용되며, 음성 명령 및 제어, 음성 검색, 텍스트 트랜스크립션, 자동 음성 번역 등 다양한 작업을 목적으로 한다. 자동 음성 인식의 노력에도 불구하고 노인 음성 인식(Elderly Speech Recognition, ESR)에 대한 어려움은 줄어들지 않고 있다. 본 연구는 노인 음성 인식에 콘포머(Conformer)와 피쳐 퓨전 모듈(Features Fusion Module, FFM)기반 노인 음성 인식 모델을 제안한다. 학습, 평가는 VOTE400(Voide Of The Elderly 400 Hours) 데이터셋으로 한다. 본 연구는 그동안 잘 이뤄지지 않았던 콘포머와 퓨전피쳐를 사용해 노인 음성 인식을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 콘포머 모델보다 높은 수준의 정확도를 보임으로써 노인 음성 인식을 위한 딥러닝 모델 연구에 기여했다.

  • PDF

Soft Decision Speech Enhancement using Hang-over (행오버를 이용한 SOFT DECISION 음성향상기법)

  • 장준혁;김남수
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.201-206
    • /
    • 1999
  • 본 연구에서는 행오버 (hang-over)를 이용한 새로운 soft decision 음성 향상기 법을 제안한다. 제시된 음성향상기법에서는 global 음성부재확률의 개념을 소개하고 이를 기존의 채널별 음성부재확률과 결합하여 통계적으로 신뢰할 수 있는 음성부재에 대한 확률값을 도출해낸다. 특히 음성의 꼬리 부분에서의 음성부재확률결정의 성능을 향상시키기 위해 행오버의 개념을 도입한다. Hidden Markov model (HMM)에 근거한 행오버를 이용하여 음성부재확률을 수정하는 부분을 소개하고 최종적으로 수정된 음성부재확률을 이용하여 새로운 잡음전력의 갱신 및 이득수정을 통해 향상된 음성을 만들어 낸다. 개발된 음성 향상기법은 주관적인 음질평가에서 기존의 방법보다 뛰어난 성능을 나타내었으며, 특히 행오버를 이용한 음성부재확률의 수정에 관련한 성능을 검증하였다.

  • PDF

A Probabilistic Combination Method of Minimum Statistics and Soft Decision for Robust Noise Power Estimation in Speech Enhancement (강인한 음성향상을 위한 Minimum Statistics와 Soft Decision의 확률적 결합의 새로운 잡음전력 추정기법)

  • Park, Yun-Sik;Chang, Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.26 no.4
    • /
    • pp.153-158
    • /
    • 2007
  • This paper presents a new approach to noise estimation to improve speech enhancement in non-stationary noisy environments. The proposed method combines the two separate noise power estimates provided by the minimum statistics (MS) for speech presence and soft decision (SD) for speech absence in accordance with SAP (Speech Absence Probability) on a separate frequency bin. The performance of the proposed algorithm is evaluated by the subjective test under various noise environments and yields better results compared with the conventional MS or SD-based schemes.

HanSoRi : an Unlimited Synthesis System (한소리 : 무제한 음성합성시스팀)

  • 김응인
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.342-345
    • /
    • 1994
  • 본 논문에서는 무제한단어 음성합성 시스템인 한소리에 대해서 간략히 기술하고 청취실험을 통한 성능평가에 대해 논한다. 음성합성시스템의 음질을 결정하는 주요 요소들은 합성의 기본단위, 합성방법, 음운학적 전처리방법 및 운율조절방법이다. 한소리 합성시스템은 반음소를 음성합성의 기본단위로 하고, 형식형태소를 이용 음성학적 전처리를 실행하며, 개선된 한국어 운율조절방법이 적용되고, 음성단편조합방식을 합성방식을 사용한다. 청취실험결과 매우 한소리 합성시스템의 합성음이 자연스러움을 알 수 있다.

  • PDF

The Continuous Speech Recognition with Limited word (제한된 단어를 갖는 우리말 연속 음성 인식)

  • 김석동
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.87-90
    • /
    • 1998
  • 이 논문에서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 우리말은 영어와 구조적으로 달라서 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. 언어 모델을 우리말 문장에 적용하기 위해 신문의 사설을 3-gram을 이용하여 처리하였다. 우리의 인식 시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 낭독 음성을 대상으로 인식률을 계산하였다. 589개의 문장을 대상으로 총 20명이 발음한 3,156개의 문장에 대하여 남자 92.2%, 여자 87.9%의 인식률을 얻었다. 발음사전은 낭독음성과 신문 사설에서 추출한 10K 크기이며 uniphone의 음성모델을 사용하였다.

  • PDF

Reduction of Background Noise using FFT cepstrum (FFT 켑스트럼을 사용한 배경잡음의 제거)

  • Choi, Jae-Seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.264-267
    • /
    • 2010
  • 본 논문에서는 오차역전파 학습 알고리즘을 사용하여 신경회로망을 학습시켜, 각 프레임에서의 음성 및 잡음 구간의 검출에 의한 음성인식 알고리즘을 제안한다. 그리고 신경회로망에 의하여 음성 및 잡음 구간의 검출에 따라서 각 프레임에서 잡음을 제거하는 스펙트럼 차감법을 제안한다. 본 실험에서는 원음성에 백색잡음 및 자동차잡음을 부가하여 음성인식의 인식율을 평가한다. 또한 인식시스템에 의하여 검출된 음성 및 잡음 구간을 이용하여 각 프레임에서의 스펙트럼 차감법에 의한 잡음제거의 실험결과를 나타낸다.

  • PDF

On the Present Construction Status of Speech Databases at KAIST Communications Research Laboratory (KAIST 통신연구실의 음성 데이터베이스 구축 현황)

  • 최인정
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.272-275
    • /
    • 1995
  • 한국과학기술원 통신연구실에서 진행중인 한국어 음성 데이터베이스의 개발 현황에 관하여 기술한다. 음성데이타베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 damtjddlstlr 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phonembalanced 75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

  • PDF