• 제목/요약/키워드: 음성 특징 추출

검색결과 310건 처리시간 0.025초

한국어 숫자음을 이용한 화자식별 (Speaker Identification Using Korean Digits)

  • 정의붕
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권10호
    • /
    • pp.1245-1252
    • /
    • 2001
  • 본 연구에서는 한국어의 숫자음을 대상 어휘로 이용하여 화자 식별을 하였다. 화자 식별을 위해서는 음성파에 포함된 여러 가지 정보로부터 화자 개개인이 갖는 개인적 특정 정보를 추출하여 화자 식별을 위한 특징 파라메타로 이용한다. 실험에서 사용한 특징 파라메타로는 음성파의 피치주기 사이에 존재하는 멀티펄스가 화자에 의존하는 개인의 특정 정보를 포함하고 있음에 착안하여 개개인의 음성파로부터 멀티펄스를 추출하고 추출된 멀티펄스로부터 화자별 특징 파라메타를 탐색하여 화자 식별 실험을 하였다.

  • PDF

펜 입력정보를 기반으로 한 온라인 서명의 생체정보 추출 및 ICA를 이용한 특징 추출 (Bio- Information Extraction of On-line Signature Based on Pen-Input Informations and Feature Extraction with Independent Component Analysis)

  • 성한호;윤성수;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2002
  • 향후 보안시장을 이끌어갈 생체인식 기술은 현재까지 많은 발전을 거듭하고 있다. 이미 알려진 바와 같이 생체인식은 신체의 여러 부분들과 신체적 특징, 개인의 습관들이 이용되는데 전자의 경우 지문, 얼굴, 홍채, 망막, 음성, 필체, 정맥 등의 인식이 있고 후자의 경우 타이핑 습관, 걸음걸이 습관, 필기 습관 등이 해당된다. 본 연구에서는 서명인식을 필체 자체의 특징에 관련된 정보를 추출하여 인식하는 방법과는 달리 개개인의 필기 습관에 주목하여 서명을 할 때 펜을 눌러쓴 정도, 펜을 사용하는 위치 및 펜을 얼마나 뉘어 쓰는지 세워 쓰는지, 왼손잡이인지 오른손잡이인지 등의 동적 정보에 따른 특성을 알 수 있는 펜의 방위각과 기울임 정도에 대한 생체정보를 추출하고 현재 음성인식 등 여러 분야에서 사용되는 ICA를 사용하여 추출한 서명데이터의 생체정보를 분리.추출하여 이를 개개인의 검증데이터로 활용하는 방법을 제안한다.

  • PDF

강인한 음성인식을 위한 MMSE-STSA기반 후처리 가중필터뱅크분석을 통한 특징추출 (Feature Extraction through the post processing of WFBA based on MMSE-STSA for Robust Speech Recognition)

  • 정성윤;배건성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.39-42
    • /
    • 2004
  • 본 논문에서는, 잡음음성에 강인한 음성인식을 위한 특징추출 방법을 제시한다. 제시한 방법은 2 단계 잡음제거 과정으로 구성되어 있다. 첫번째 단계는 MMSE-STSA 음성개선기법을 통해 잡음음성신호를 개선시키는 과정이고, 두 번째 단계는, MMSE-STSA 의 개선된 음성에 후처리 가중필터뱅크분석을 통해 잔여잡음의 영향을 감소시키는 과정이다. 제안한 방법의 성능평가를 위해, AURORA2의 잡음음성 DB 중 테스트 집합 A 에 대해 인식실험을 수행하고, 결과를 기존 방법들과 비교, 검토한다.

  • PDF

음성으로부터의 감정 인식을 위한 퍼지모델 제안 (Fuzzy Model for Speech Emotion Recognition)

  • 문병현;장인훈;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.115-118
    • /
    • 2008
  • 본 논문에서는 음성으로부터 감정을 인식하고 감성적인 운율로 음성 출력을 산출해 내는 시스템을 제안 한다. 음성적인 운율로부터 감정을 인식하기 위해서 퍼지룰(rule)을 이용한다. 본 논문에서 감정 인식 시스템은 음성 샘플들로 학습 데이터를 구축하고 이를 기반으로 하여 추출된 20개의 특징 집합으로부터 가장 중요한 특징들을 자동적으로 선택한다. 화남, 놀람, 행복, 슬픔, 보통의 5가지 감정 상태를 구분하기 위하여 접근법에 기반한 퍼지를 이용하였다.

  • PDF

숨은마코프모형을 이용하는 음성구간 추출을 위한 특징벡터 (A New Feature for Speech Segments Extraction with Hidden Markov Models)

  • 홍정우;오창혁
    • Communications for Statistical Applications and Methods
    • /
    • 제15권2호
    • /
    • pp.293-302
    • /
    • 2008
  • 본 논문에서는 숨은마코프모형을 사용하여 음성구간을 추출하는 경우에 사용되는 새로운 특징벡터인 평균파워를 제안하고, 이를 멜주파수 켑스트럴 계수(met frequency cepstral coefficients, MFCC)와 파워계수와 비교한다. 이들 세 가지 특징벡터의 수행력을 비교하기 위하여 일반적으로 추출이 상대적으로 어렵다고 알려진 파열음을 가진 단어에 대한 음성 데이터를 수집하여 실험한다. 다양한 수준의 잡음이 있는 환경에서 음성구간을 추출하는 경우 MFCC나 파워계수에 비해 평균파워가 더 정확하고 효율적임을 실험을 통해 보인다.

유색 잡음 환경하에서 Cumulant를 이용한 한국어 단모음 인식 (Korean Single-Vowel Recognition Using Cumulants in Color Noisy Environment)

  • 이형근;양원영;조용수
    • 한국음향학회지
    • /
    • 제13권2호
    • /
    • pp.50-59
    • /
    • 1994
  • 본 논문에서는 3차 Cumulant를 이용하여 음성의 특징벡타를 추출하고, 이것을 신경회로망의 입력으로 사용하는 음성 인식 방법을 제시한다. 3차 이상의 고차 cumulant를 이용하면 Gaussian 잡음과 음성 신호의 분리가 가능하며, 충분히 많은 데이타를 사용할 경우 음성 데이타를 AR 모델링한 계수값을 bias 없이 추출할 수 있다. 또한 기존의 2차 statistics를 이용한 특징 벡타 추출 방법과 비교할 때 잡음이 큰 경우에도 분산은 크지만 bias가 작아 보다 잡음에 강한 특징벡타를 추출할 수 있다. 한국어 단모음에 대한 모의실험을 통하여 유색 잡음 환경에서 SNR이 커질수록 3차 cumulant를 이용한 방법이 기존의 2차 statistics를 이용한 방법보다 높은 인식율을 나타냄을 보인다.

  • PDF

시각 음성인식을 위한 영상 기반 접근방법에 기반한 강인한 시각 특징 파라미터의 추출 방법 (Robust Feature Extraction Based on Image-based Approach for Visual Speech Recognition)

  • 송민규;;민소희;김진영;나승유;황성택
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.348-355
    • /
    • 2010
  • 음성 인식 기술의 발전에도 불구하고 잡음 환경하의 음성 인식은 여전히 어려운 분야이다. 이를 해결하기 위한 방안으로 음성 정보 이외에 시각 정보를 이용한 시각 음성인식에 대한 연구가 진행되고 있다. 하지만 시각 정보 또한 음성과 마찬가지로 주위 조명 환경이나 기타, 다른 요인에 따른 영상잡음이 존재하며, 이런 영상잡음은 시각 음성 인식의 성능 저하를 야기한다. 따라서 인식 성능 향상을 위해 시각 특징 파라미터를 어떻게 추출하느냐는 하나의 관심분야이다. 본 논문에서는 HMM기반 시각 음성인식의 인식 성능 향상을 위한 영상 기반 접근방법에 따른 시각 특징 파라미터의 추출 방법에 대하여 논하고 그에 따른 인식성능을 비교하였다. 실험을 위해 105명에 화자에 대한 62단어의 데이터베이스를 구축하고, 이를 이용하여 히스토그램 매칭, 입술 접기, 프레임 간 필터링 기법, 선형마스크, DCT, PCA 등을 적용하여 시각 특징 파라미터를 추출하였다. 실험결과, 제안된 방법에 의해 추출된 특징 파라미터를 인식기에 적용하였을 때의 인식 성능은 기본 파라미터에 비해 약21%의 성능 향상이 됨을 알 수 있다.

감정 인식을 위한 음성신호 비교 분석 (Comparison and Analysis of Speech Signals for Emotion Recognition)

  • 조동욱;김봉현;이세환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.533-536
    • /
    • 2006
  • 본 논문에서는 음성 신호로부터 감정의 특징을 나타내는 요소를 찾아내는 것을 목표로 하고 있다. 일반적으로 감정을 인식할 수 있는 요소는 단어, 톤, 음성신호의 피치, 포만트, 그리고 발음 속도 및 음질 등이 있다. 음성을 기반으로 감정을 익히는 방법 중에서 현재 가장 많이 접근하고 있는 방법은 피치에 의한 방법이 있다. 사람의 경우는 주파수 같은 분석 요소보다는 톤과 단어, 빠르기, 음질로 감정을 받아들이게 되는 것이 자연스러운 방법이므로 이러한 요소들이 감정을 분류하는데 중요한 요소로 쓰일 수 있다. 따라서, 본 논문에서는 감정에 따른 음성의 특징을 추출하기 위해 사람의 감정 중에서 비교적 자주 쓰이는 평상, 기쁨, 화남, 슬픔에 관련된 4가지 감정을 비교 분석하였으며, 인간의 감정에 대한 음성의 특성을 분석한 결과, 강도와 스펙트럼에서 각각의 일관된 결과를 추출할 수 있었고, 이러한 결과에 대한 실험 과정과 최종 결과 및 근거를 제시하였다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

  • PDF

음성 단어를 이용한 구간검출에 의한 패턴인식 (Pattern Recognition by Section Detection Using Speech Word)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

스마트폰환경에서 음성기반 감정인식 프레임워크 (Speech Emotion Recognition Framework on Smartphone Environment)

  • 방재훈;이승룡;정태충
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.254-256
    • /
    • 2013
  • 기존의 음성기반 감정인식 기술은 충분한 컴퓨팅 파워를 가진 PC에서 수백개의 특징을 사용하여 감정을 인식하고 있다. 이러한 음성기반 감정인식 기술은 컴퓨팅 파워에 제약이 많은 스마트폰 환경을 고려하지 않은 방법이다. 본 논문에서는 제한된 스마트폰 컴퓨팅 파워를 고려한 음성의 특징 추출 기법과 서버 클라이언트 개념을 도입한 효율적인 음성기반 감정인식 프레임워크를 제안한다.