• 제목/요약/키워드: LPC 계수

검색결과 90건 처리시간 0.025초

남녀성별 분류를 위한 화자종속 음성인식 알고리즘 (Speaker-dependent Speech Recognition Algorithm for Male and Female Classification)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.775-780
    • /
    • 2013
  • 본 논문에서는 백색잡음 및 자동차잡음 환경 하에서 남녀 성별인식이 가능한 신경회로망에 의한 화자종속 음성인식 알고리즘을 제안한다. 본 논문에서 제안한 음성인식 알고리즘은 남성화자 및 여성화자를 인식하기 위하여 LPC 켑스트럼 계수를 사용하여 신경회로망에 의하여 학습된다. 본 실험에서는 백색잡음 및 자동차잡음에 대하여 총 6개의 신경회로망의 네크워크에 대한 인식결과를 나타낸다. 인식실험의 결과로부터 백색잡음에 대해서는 최대 96% 이상의 인식률, 자동차잡음에 대해서는 최대 88% 이상의 인식률을 구하였다. 마지막으로 본 실험에서는 제안하는 음성인식 알고리즘이 배경잡음 환경 하에서의 기존의 음성인식 알고리즘과 비교하여 본 방식의 알고리즘이 유효하다는 것을 실험으로 확인한다.

직교 벡터 공간 변환을 이용한 음성 개성 변환 (Voice personality transformation using an orthogonal vector space conversion)

  • 이기승;박군종;윤대희
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.96-107
    • /
    • 1996
  • 본 논문에서는 직교 벡터 공간 변환을 이용한 새로운 음성 개성 변환 알고리즘을 제안하였다. 음성 개성 변환이란 임의 환자(source)가 가지고 있는 몇 개의 특징 변수를 다른 화자(target)의 특징 변수로 변환하는 기법이다. 본 논문에서는 LPC 켑스트럼 계수와 여기 신호의 스펙트럼, 그리고 피치 궤적을 변환하여 음성 개성변환을 구현하였다. LPC 켑스트럼 계수의 변환을 위해 직교 벡터 공간 변환 기법이 제안되었다. 이 기법은 KL(Karhunen-Loeve)변환을 이용한 principle component의 분리와 최소 자승 오차를 갖는 선형 좌표 변환을 통해 LPC 켑스트럼의 변환을 수행한다. 또한, 화자간의 운율적인 특징을 변환하기 위해 피치 궤적 변환 기법이 제안되었다. 피치 궤적 변환을 위하여 먼저 두 화자간의 기준 피치 패턴의 작성하고 기준 패턴간의 대응 관계를 추정한 후 이를 이용하여 source 화자의 피치 패턴이 target 피치 패턴으로 변환되도록 하였다. 컴퓨터를 이용한 모의 실험 결과 제안된 알고리즘은 객관적인 평가와 주관적인 평가에 있어서 우수한 성능을 나타내었다.

  • PDF

LSF에서 LPC 계수를 구하는 개선된 알고리즘 (The Revised Transform Algorithm from LSF to LPC)

  • 김향진;이기태;함영희;김형준;임재윤
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.679-682
    • /
    • 1999
  • This paper proposes the LSF or LSP that is the method of using to transfer the speech parameters after processed the speech to LPC, which is digital coding transferring efficiently, for the best quality and the lowest bit rate of parameters. The new revised transform algorithm between LSF and LPC coefficients is proposed. The proposed algorithm eliminates all multiplications, computes fewer operations, and reduces memory buffer sizes.

  • PDF

음소단위를 이용한 소규모 문자-음성 변환 시스템의 설계 및 구현 (Design and Implementation of Simple Text-to-Speech System using Phoneme Units)

  • 박애희;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.49-60
    • /
    • 1995
  • 본 논문은 소규모 시스템에 적용 가능한 한국어 문자-음성 변환 시스템의 설계 및 구현에 대한 연구를 목적으로 한다. 본 논문에서 채택한 음성합성 방법은 파라메터 합성법으로서 LPC(linear Predictive Coding)계열의 PARCOR(PARtial autoCORrelation) 계수를 음향 파라메터로 사용하였으며, 음성합성 단위로는 가장 기본적인 단위인 음소를 채택하였다. 합성 파라메터로는 유성음의 경우 PARCOR계수, 피치, 진폭을 무성음의 경우 잔차신호와 PARCOR계수를 사용하였다. 특히 무성음의 경우 LPC합성시 음질이 떨어진다는 단점이 있었으나, 본 논문에서는 LPC분석시 얻어지는 잔차신호를 무성음의 여기신호로 사용하여 단어 단위의 합성에서 60%의 이해도를 얻을 수 있었다. 합성결과 단어 단위의 합성에 적용 가능하였고, 문장단위의 합성을 위해서는 음소 지속시간 조절에 대한 연구가 진행되어야 할것이다. 본 논문의 구현환경으로는 486 PC상에서 음성의 입,출력을 위해 70[Hz]-4.5[KHz] 대역통과 필터와 증폭기, 그리고 TMS320C30 디지털 신호처리 프로세서를 장착한 DSP 보드를 사용하였다.

  • PDF

소어휘 단어단위의 음성인식 칩 설계 (The Design of Speech Recognition Chip for a Small Vocabulary as a Word-level)

  • 안점영;최영식
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.330-338
    • /
    • 2002
  • 소어휘 단어단위의 음성을 인식할 수 있는 음성인식 칩을 설계하였다. 설계된 칩은 음성 신호의 시작과 끝점 검출 부분, LPC 켑스트럼 계수 추출 부분, DTW 실행 부분과 외부 메모리 인터페이스 부분으로 구성되어있다. CMOS 0.35um TLM 공정으로 설계된 이 칩은 4x4mm2의 면적에 126,938개의 게이트로 만들어져 있다. 그리고 전용 H/W의 동작 속도는 5MHz에서 60MHz까지 조정 가능하다. 5MHz 클록을 사용하는 경우, 50∼60 프레임 정도의 소어휘 단어 단위의 음성을 초당 100,000개까지 비교할 수 있는 능력이 있고, 60MHz의 클록을 사용하는 경우는 초당 1,200,000개의 단어를 비교할 수 있다.

선형예측계수에 기초한 퍼지추론 단어 인식 (Word Recognition using Fuzzy Inference based on LPC)

  • 최승호;김형근
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.32-41
    • /
    • 1994
  • LPC열로 구성된 음성패턴의 주파수변동을 해결하기위해 LPC와 스펙트럼, LPC차수와 스펙트럼의 관계를 고찰하여 새로운 형태의 멤버쉽함수를 제안하였다. 또한, 시간변동을 해결하기위해서는 음성구간을 여러구간으로 등간격분할하는 다구간 등분할법을 사용하였으며, 이때 오인식은 주로 동일음절이 같은 발성위치에 있을때 발생되었다. 이러한 오인식을 줄이기위해 제안된 멤버쉽함수로 퍼지추론한뒤 구간별 확신도에 가중치를 부여하고, 세번째후보까지를 인식대상으로 하는 판정알고리즘을 제안하였다. 본 방법의 타당성을 검증하기위해, DDD지역명 28개를 대상으로 인식실험한결과, 삼각형멤버쉽함수에 의한 퍼지추론은 $92.0\%$, 삼각형멤버쉽함수에의한 퍼지추론과 판정알고리즘은 $92.9\%$, 제안된 멤버쉽함수에의한 퍼지추론과 판정알고리즘은 $93.8\%$의 인식률을 보였다.

  • PDF

주입력신호의 LPC 필터 이득을 이용한 반향제거기의 수렴전 동시통화검출 성능 개선 (Performance Improvement of Double Talk Detection before Convergence of the Echo Canceller by Using Linear Predictive Coding Filter Gain of the Primary Input Signal)

  • 유재하
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.628-633
    • /
    • 2014
  • 본 논문에서는 반향제거기가 수렴하기 전에 동작할 수 있는 기존 동시통화검출법의 성능을 개선하기 위한 방법을 제안하였다. 제안된 방법은 LPC 필터 계수를 주입력신호로부터 추정하게 된다. 동시통화검출을 위한 문턱치는 주입력신호의 크기별로 기대되는 LPC 필터 이득치를 사용하여 가변적으로 설정하게 된다. 제안한 방법은 기존의 방법이 갖고 있는 단일통화를 동시통화로 잘못 판단하는 오검출률을 개선할 수 있을 뿐만 아니라 동시통화 검출 지연 시간도 단축시킬 수 있다. 장시간의 음성신호를 사용한 모의실험을 수행하였다. 제안한 방법이 기존 방법의 오검출률을 감소시키고 동시통화 검출 지연시간을 단축시킴을 확인할 수 있었다.

전송에러가 있는 채널에서 LSP 순서화특성을 이용한 선형예측계수(LPC)의 양자화 방법 (Coding of LPC Parameters Using the Ordering Property of LSP in the Presence of Channel Errors)

  • 이인성
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.76-80
    • /
    • 1995
  • Differential pulse code modulation 구조의 Line spectrum pairs 양자화기에 높은 차수 LSP 파라미터 값은 낮은 차수 LSP 파라미터 값보다 커야한다는 LSP 파라미터의 순서화 특징을 이용하여 양자화하는 방법을 제시한다. 31 비트/프레임에서 1 dB 이하의 스펙트럴 왜곡을 갖는 명료한 음질을 보였다. 또한 LSP 주파수의 순서화 특성은 벡터-스칼라 결합 양자화기에 적용하였다. 벡터-스칼라 결합 양자화기에서는 26비트/프레임에서 명료한 음질을 보였다. 새로운 LSP 양자화 방법들은 전송에러 발생시 성능을 시험하고, 전송 에러에 강인하도록 프레임간 예측을 위해 Moving Average 예측기를 사용한다.

  • PDF

AR계수와 SVM을 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-based Driver Drowsiness Detection System Using AR Coefficients and SVM)

  • 한형섭;정의필
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.768-773
    • /
    • 2012
  • 운전 중 운전자의 졸음은 교통 사망사고를 일으키는 중요한 요인이며 음주운전보다도 더 위험할 수 도 있다. 이러한 이유로 운전자의 졸음을 판별하고 경고하는 시스템 개발이 최근에 매우 중요한 이슈로 떠올랐다. 그중에서도 졸음과 가장 밀접한 관련이 있는 생체 신호 분석이 많이 적용되는데 그중에서도 뇌파(Electroencephalogram, EEG)와 안구전도(Electrooculogram, EOG)를 분석하는 연구가 주류를 이루고 있다. 본 논문에서는 실험 프로토콜를 바탕으로 측정된 뇌파를 주파수별로 분석하여 운전자의 상태별 뇌파 데이터베이스를 구축하였고 선형예측(Linear Predictive Coding, LPC) 계수와 Support Vector Machine(SVM)을 이용한 운전자 졸음 감지 시스템을 제안한다. 실험결과로 졸음의 뇌파분석에서 알파파가 감소하며 세타파가 증가하는 추세를 보였으며, LPC 계수가 각성, 졸음 및 수면상태의 특징을 잘 반영하였다. 특히 제안한 시스템은 적은 샘플(250ms)에서도 96.5%의 높은 분류 결과를 얻어 짧은 순간에 일어날 운전시 돌발 상황을 실시간으로 예측할 수 있는 가능성을 보였다.

LPC cepstrum 계수를 이용한 근전도 신호의 동작판별 (EMG signal identification using LPC cepstrum coefficients)

  • 정태윤;박상희;김홍래;왕문성;최윤호;변윤식
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.738-741
    • /
    • 1988
  • In this paper, we deal with the movements identification of EMG signals by LPC cepstrum coefficients. Movements were identified by extration of characteristics of similar patterns in Euclid distance measurement method for EMG signals generated by voluntary contractions of subject's musculature. As number of coefficients is larger, we obtain the better rate of movements identification. By exact extraction of signals and decision of optimal coefficient, it is expected that these results will apply to prosthesis control in real-time.

  • PDF