• 제목/요약/키워드: 화자 특징

검색결과 299건 처리시간 0.03초

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

K-L 전개를 이용한 연속 숫자음 인식에 관한 연구 (A Study on Connected Digits Recognition Using the K-L Expansion)

  • 김주곤;오세진;황철준;김범국;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.24-31
    • /
    • 2001
  • K-L 전개 방법은 특징의 차원을 효과적으로 압축하므로 인식 처리에서 계산량을 줄일 수 있는 방법으로 잘 알려져 있다. 본 논문에서는 한국어 인식 시스템의 인식 정도를 개선하기 위해, 음성의 특징 파라미터에 대하여 효과적으로 K-L전개를 적용하는 방법(K-L 계수)을 제안한다. 그리고 제안한 방법으로 얻어진 새로운 음성 특징 파라미터를 이용하여 화자 독립 연속 숫자음 인식실험을 수행하고, 기존의 Mel-cepstrum과 회귀계수의 인식 결과와 비 교, 분석하였다. 인식 실험 결과, 제안한 K-L 계수를 이용한 방법이 기존의 방법보다 높은 인식률을 얻어 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

음소 인식을 위한 특징 추출의 위치와 지속 시간 길이에 관한 연구 (A Study on Duration Length and Place of Feature Extraction for Phoneme Recognition)

  • 김범국;정현열
    • 한국음향학회지
    • /
    • 제13권4호
    • /
    • pp.32-39
    • /
    • 1994
  • 한국어 음성인식 시스템을 구현하기 위한 기초 연구로서 한국어 전음소를 대상으로 1) 각 음소의 특성을 가장 잘 나타내는 최적의 위치, 2) 최고의 인식률을 얻기 위한 적당한 지속시간길이를 찾기위해서 음소인식을 수행하였다. 인식실험을 위해 특징파라메터로 21차원 켑스트럼계수를 이용하여 베이즈 결정법칙으로서 세화자에 대한 종속인식실험을 행하였다. 인식실험결과 최고의 인식률을 보이는 최적의 특징추출의 위치는 모음에서는 10~50ms, 마찰음및 파찰음은 40~100ms, 비음, 유음은 10~50ms, 그리고 파열음은 10~50ms임을 알 수 있었다. 또, 35 전음소를 대상으로한 인식에 있어서는 최고의 인식률을 얻기위한 지속시간 정 보의 길이는 60~70ms정도가 충분함을 알 수 있었다.

  • PDF

음성인식에서 중복성의 저감에 대한 연구 (A Study on the Redundancy Reduction in Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.475-483
    • /
    • 2012
  • 음성 신호의 특성은 인접한 프레임에서 크게 변화하지 않는다. 따라서 비슷한 특징벡터들에 내재된 중복성을 줄이는 것이 바람직하다. 본 논문의 목적은 음성인식에 있어서 음성 특징벡터가 최소의 중복성과 최대의 유효한 정보를 갖는 조건을 찾는 것이다. 이를 이하여 우리는 하나의 감시 파라미터를 통하여 중복성 저감을 실현하고, 그 결과가 FVQ/HMM을 사용한 화자독립 음성인식에 미치는 영향을 조사하였다. 실험 결과, 인식률을 저하시키지 않고 특징벡터의 수를 30% 줄일 수 있음을 확인하였다.

Gender Classification of Speakers Using SVM

  • Han, Sun-Hee;Cho, Kyu-Cheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.59-66
    • /
    • 2022
  • 본 논문에서는 음성 데이터에서 특징벡터를 추출한 후 이를 분석하여 화자의 성별을 분류하는 연구를 진행하였다. 본 연구는 고객이 전화 등 음성을 통해 서비스를 요청할 시 요청한 고객의 성별을 자동으로 인식함으로써 직접 듣고 분류하지 않아도 되는 편의성을 제공한다. 학습된 모델을 활용하여 성별을 분류한 후 성별마다 요청 빈도가 높은 서비스를 분석하여 고객 맞춤형 추천 서비스를 제공하는 데에 유용하게 활용할 수 있다. 본 연구는 공백을 제거한 남성 및 여성의 음성 데이터를 기반으로 각각의 데이터에서 MFCC를 통해 특징벡터를 추출한 후 SVM 모델을 활용하여 기계학습을 진행하였다. 학습한 모델을 활용하여 음성 데이터의 성별을 분류한 결과 94%의 성별인식률이 도출되었다.

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

기쁨의 의미연구 - 러시아어와 한국어의 비교를 중심으로 - (A Comparative Study on Joy in Russian and Korean)

  • 김정일
    • 비교문화연구
    • /
    • 제41권
    • /
    • pp.113-140
    • /
    • 2015
  • 본 연구를 통해 필자는 러시아어와 한국어에서 인간의 가장 원초적이고 본원적인 감정 중 하나인 "기쁨"이 어떻게 언어적으로 구현되는지를 살펴보고자 하였다. 그 과정에서 특히 "기쁨"이라는 개념이 러시아와 한국어에서 어떻게 기술되는지, 그리고 그러한 기술이 문화적 맥락과 어떤 관련을 맺고 있는지 살펴봄으로써, 러시아어와 한국어에서 "기쁨"이 가지는 의미적, 화용적 특징들을 규명해 보고자 하였다. 기쁨은 러시아어에서 주로 радость [기쁨]과 удовольствие [즐거움(만족)] 으로 기술되며, 전자가 보다 넓은 종교적, 정신적, 지속적, 문화적 맥락과 후자는 보다 구체적, 육체적, 순간적 맥락과 관련된다. 전자가 보다 거시적 맥락에서 의미와 투영대상을 찾는다면 후자는 보다 일상적인 맥락에서 욕망이 구체적으로 투영될 대상을 찾는다는 것이 전통적인 설명방식이었다. 하지만 오늘날 이러한 대립관계는 점차 약화되고, 기쁨의 대상이 되는 존재에 보다 초점을 맞추고, 그 존재의 실존적 관계에 보다 집중하는지 아니면 일상의 디테일에서 즉각적으로 느끼는 기쁨에 보다 초점을 맞추는지의 대립으로 전환되어 감을 알 수 있었다. 반면에 한국어에서 기쁨은 주로 "기쁨"과 "즐거움"이라는 두 개의 어휘로 구현되는데, 전자가 보다 정신적인 작용과 관련을 가지며, 그 유발하는 원인과 그 결과 사이의 논리적 관계에 대한 추론이 기저에 깔려있는 반면, 후자는 화자가 참여자로서 해당 상황에 개입하는 과정에서 즉각적으로 느끼는 감정과 연관된다. "기쁨"이 화자가 사전에 가졌던 기대와 계획, 예상과의 부합 혹은 충족으로 인한 흡족함에서 오는 것이라면 "즐거움"은 상황속에서 적극적으로 참여하고 활동하는 화자에게서 즉각적으로 느껴지는 감정이다. 따라서 러시아어의 기쁨의 부차적인 개념 "즐거움(만족)(удовольствие)"과 한국어의 "즐거움"은 매우 중요한 의미적 자질을 공유하고 있다고 할 수 있다. 결국 두 언어 모두 화자가 대상에 대하여 어떠한 태도와 입장을 취하는지에 따라 기쁨에 대한 2개의 변별적인 선택지를 가지고 있다고 볼 수 있다.

음성인식에서 특이 특징벡터의 제거에 대한 연구 (A Study on the Removal of Unusual Feature Vectors in Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.561-567
    • /
    • 2013
  • 음성 인식을 위해 추출되는 특징벡터 중 일부는 드물게 나타나는 특이 패턴이다. 이들은 음성인식 시스템의 훈련에서 파라미터의 과도맞춤을 일으키며, 그 결과 새로운 입력 패턴의 인식을 저해하는 구조적 위험을 초래한다. 본 논문에서는 이러한 특이 패턴을 제거하는 하나의 방법으로서, 어느 크기 이상의 벡터를 제외시켜 음성인식 시스템의 훈련을 수행하는 방법에 대해 연구한다. 본 연구의 목적은 인식률을 저해시키지 않는 한도에서 가장 많은 특이 특징벡터를 제외시키는 것이다. 이를 위하여 우리는 하나의 절단 파라미터를 도입하고, 그 값의 변화가 FVQ(Fuzzy Vector Quantization)/HMM(Hidden Markov Model)을 사용한 화자독립 음성 인식에 미치는 영향을 조사하였다. 실험 결과, 인식률을 저하시키지 않는 특이 특징벡터의 수가 3%~6% 정도임을 확인하였다.

맹사성 <강호사시가>의 짜임새 (A Study on the )

  • 양희찬
    • 한국시조학회지:시조학논총
    • /
    • 제21집
    • /
    • pp.143-164
    • /
    • 2004
  • 이 논문은 <강호사시가>가 한 주제를 형상화하는 데 네 계절의 특징을 담고 있는 서로 다른 글감들을 사용하였지만, 내용의 일관된 통일성을 유지한 연시조이며, 이 통일성 유지는 하나의 일정한 틀을 사용한 데 근거하였음을 해명하려고 한 것이다. 그 일정한 틀은 겉틀과 속틀로 나누었다. 겉틀은 네 작품에 공통된 표현 부분이다. 그 내용은 '화자의 거처(강호)'-'화자(이 몸)'$\cdot$'화자와 임금의 관계(군은)' 및 '강호의 상태(강호에 (가)이 드니)', '화자의 상태(이 몸이 (라)히옴)'를 제시한 것이다. 그리고 초장의 '강호에 (가)이 드니'를 구문의 생성 조건의 측면에서 분석하여 표현의 압축과 간결함을 지적하고, 종장의 '역군은이샷다'를 구문의 생성 의도의 측면에서 분석하여 화자 개인 차원의 삶에 대한 만족을 표출한 것임을 설명하고, 이 삶의 만족을 사회적 차원의 태평성대로 확장할 수 있는지에 대하여 문제제기를 하였다. 속틀은 작품 내용의 세부 짜임이다. 이에 대해서는 네 작품을 초$\cdot$$\cdot$종장 각각으로 묶어 분석한 다음, 네 작품의 공유된 짜임을 설명하고, 각각의 내용 분석을 통하여 곁틀에서 다룬 <강호사시가>의 내용이 갖는 특성을 해명하였다. 네 작품의 초$\cdot$$\cdot$종장을 각각 하나로 묶어 종합 분석하기 위하여 지표기능과 제시기능을 설정하여 그 내용의 짜임을 설명하였다. 초장은 공통으로 네 계절의 흥취를 표현한 것이며, 중장은 지표기능 어휘인 '화자'가 생략되어 제시기능 구절만으로 이루어졌으며, 초장의 흥취를 행위나 상태로 구체적으로 제시하였다. 종장은 중장과 연결하여 함축적 표현이며,사적인 삶과 공적인 가치관(군신유의)의 관계에서 공적인 가치관으로 사적인 삶을 보장받으려는 의도를 내포한 것이다. 이를 종합하면, <강호사시가>의 속틀의 짜임은 '계절의 제시'$\to$'계절에 대한 발흥'$\to$'계절의 즐김 행위'$\to$'(심적$\cdot$신체적) 평안'으로 전개된다. 문맥의 흐름에서 초장은 중장의 단서가 되며, 중장은 초장에 대한 반응이며, 종장은 중장의 응축으로서 평가라는 성격을 가지고 있다. 그리고 속틀의 짜임에 '감군은'이 포함되면 곁틀의 짜임을 확인할 수 있다. 끝으로, 작자가 작품의 본지를 개인의 평안에 둔 것처럼 꾸몄으나, 본래의 발상은 임금의 치적(태평성대)을 송축하려는 것이라고 결론하였다.

  • PDF