• 제목/요약/키워드: 코드북 모델

검색결과 33건 처리시간 0.028초

PDA를 위한 내장형 화자인증기의 구현 (An Implementation of Embedded Speaker Identifier for PDA)

  • 김동주;노용완;김동규;정광우;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.286-289
    • /
    • 2005
  • 기존의 물리적 인증도구를 이용한 방식이나 패스워드 인증 방식은 분실, 도난, 해킹 등에 취약점을 가지고 있다. 따라서 지문, 서명, 홍채, 음성, 얼굴 등을 이용한 생체 인식기술을 보안 기술로 적용하려는 연구가 진행중이며 일부는 실용화도 되고 있다. 본 논문에서는 최근 널리 보급되어 있는 임베디드 시스템중의 하나인 PDA에 음성 기술을 이용한 내장형 화자 인증기를 구현하였다. 화자 인증기는 음성기술에서 널리 사용되고 있는 벡터 양자화 기술과 은닉 마코프 모델 기술을 사용하였으며, PDA의 하드웨어적인 제약 사항을 고려하여 사용되는 벡터 코드북을 두 가지로 다르게 하여 각각 구현하였다. 처음은 코드북을 화자 등록시에 발성음만을 이용하여 생성하고 화자인증 시에 이용하는 방법이며, 다른 하나는 대용량의 음성 데이터베이스를 이용하여 코드북을 사전에 생성하여 이를 화자 인증시에 이용하는 방법이다. 화자인증기의 성능평가는 5명의 화자가 10번씩 5개의 단어에 대하여 실험하여, 각각 화자종속 코득북을 이용한 인증기는 88.8%, 99.5%, 화자독립 코드북을 이용한 인증기는 85.6%, 95.5%의 인증율과 거절율을 보였으며, 93.5%와 90.0%의 평균 확률을 보였다.. 실험을 통하여 화자독립 인증기의 경우가 화자종속 인증기의 경우보다 낮은 인식율을 보였지만, 화자종속 인증기에서 나타나는 코드북 훈련시에 발생하는 메모리 문제를 해결 할 수 있었다.

  • PDF

Kappa-factor 채널모델에 기반을 둔 최적의 코드북 기반 Opportunistic Beamformer 파라미터 디자인 (Parameter Design for COBF Based on Kappa-factor Channel Model)

  • 강지원;권동승;이충용;황영수
    • 대한전자공학회논문지TC
    • /
    • 제45권12호
    • /
    • pp.20-25
    • /
    • 2008
  • Codebook-based opportunistic beamforming (COBF) 기법은 파일럿을 적게 사용하면서 기존의 opportunistic beamforming 기법에 빔 선택 다이버시티를 추가한다. 본 논문에서는 채널의 상관도를 고려한 kappa-factor 채널 모델에 기반을 두어 COBF 기법에서 사용되는 랜덤 행렬과 코드북을 디자인한다. 디자인한 COBF를 적용하면 최적의 빔과 유사한 빔을 생성할 수 있고, 이에 따라 채널의 상관도가 높거나 낮음에 상관없이 항상 최적의 시스템 용량을 보인다.

이동 로봇 추적을 위한 스테레오 영상기반 퍼지 추적제어 (Fuzzy Tracking Control Based on Stereo Images for Tracking of Moving Robot)

  • 민현홍;유동상;김용태
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.198-204
    • /
    • 2012
  • 로봇들의 협동 작업을 위해서는 다양한 환경에서 다른 로봇들을 인식하고 추적하는 기술이 요구된다. 본 논문에서는 코드북 모델과 스테레오 영상 처리를 이용하여 이동 로봇을 인식하고, 퍼지 제어기를 사용해 추적하는 이동 로봇 추적 제어 시스템을 제안한다. 먼저 코드북 모델을 사용하여 영상의 전경과 배경을 분리하였다. 분리된 전경에서 색상정보를 기반으로 관심영역을 구해내고, 스테레오 영상처리를 통해 얻은 깊이 영상을 기반으로 이동 로봇까지의 실제 거리를 추정한다. 각 거리에 따라 열림 및 닫힘 연산을 적용하고, 모듈형 로봇의 크기에 맞춰 라벨링을 통해 효과적으로 이동 로봇을 인식한다. 추출된 이동 로봇의 움직임에 따른 효과적인 추적을 위하여 스테레오 영상 처리를 통해 얻은 거리 정보와 로봇의 이동 정보를 이용해 퍼지 제어기를 설계하여 이동 로봇 추적 시스템을 제안하였다. 제안한 퍼지 추적 제어 시스템의 성능은 실제 이동 로봇의 추적 실험을 통하여 검증하였다.

DMS 모델과 이중 스펙트럼 특징을 이용한 HMM에 의한 음성 인식 (HMM-based Speech Recognition using DMS Model and Double Spectral Feature)

  • 안태옥
    • 한국산학기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.649-655
    • /
    • 2006
  • 본 논문은 화자 독립의 음성인식을 위한 연구로써, DMS 모델에 의한 DMSVQ(Dynamic Multi-Section Vector Quantization) 코드북과 이중 스펙트럼 특징을 이용한 HMM(Hidden Markov Model) 음성인식 방법을 제안한다. 정적 스펙트럼 특징으로서는 LPC ?S스트럼 계수를 이용하였고, 동적 스펙트럼 특징으로는 LPC ?S스트럼의 회귀계수를 사용하였다. 이들 두개의 스펙트럼 특징들을 각각 VQ 코드북으로 양자화되고, DMS 모델을 이용한 HMM은 입력으로써 정적 스펙트럼 특징과 동적 스펙트럼 특징을 받아드림으로써 모델링된다. 제안된 방법에 의한 인식 실험은 기존의 다양한 인식 방법에 의한 인식 실험들과 비교를 위해 동일한 데이터와 조건 하에서 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 기존의 방법들보다 우수한 방법임을 입증하였다.

  • PDF

원형 안테나 배열의 위상 차이 분포 특성을 활용한 코드벡터 결정 방식 및 성능 평가 (Determination and Performance Evaluation of Codevectors Utilizing Phase Difference Distribution Characteristics of Circular Antenna Arrays)

  • 김희원;서준엽;성원진
    • 전자공학회논문지
    • /
    • 제53권10호
    • /
    • pp.3-9
    • /
    • 2016
  • 현재 사용 중인 이동 통신 시스템에서는 주파수 효율을 높이기 위한 주요한 방법으로 다중 입출력 송수신 (multiple-input multiple-output; MIMO) 전송 기술을 사용하고 있다. MIMO 전송 시 채널의 추정을 통한 정확한 빔포밍의 수행은 수신 신호의 신호 대 간섭 및 잡음 비 (signal-to-interference-plus-noise ratio; SINR) 증가와 시스템의 성능 향상에 기여하며, 따라서 빔포밍 벡터와 이를 정의하는 코드북 설계에 관한 논의는 매우 중요하다. 본 논문에서는 균일 원형 배열 (uniform circular array; UCA) 구조 환경에 적합한 코드북을 제안하기 위해 인접 안테나 간 채널의 위상 차이를 통계적으로 분석한 후, 확률 밀도 함수의 분포에서 나타난 위상의 이동 정도를 보상하기 위해 새로운 매개 변수를 추가하는 방법을 사용한다. 제안 코드북은 공간채널모델 환경에서 성능 평가를 진행하여 기존의 LTE (long term evolution) Release 8과 Release 10에서 제시한 표준 코드북 대비 큰 폭의 성능 이득을 보임을 확인한다.

가중 투영 우도 측정 및 병렬 모델 결합을 이용한 잡음 환경에서의 음성 인식 (Speech Recognition in the Noisy Environment using Weighted Projection-Based Likelihood Measure and Parallel Model Combination)

  • 신원호;양태영;김원구;윤대희;차일환
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.49-54
    • /
    • 1998
  • 본 논문에서는 잡음이 존재하는 환경에 강인한 것으로 알려져 있는 투영 방법을 우 도 측정에 가중 함수와 결합하여 사용하는 방법을 제안하였다. 반연속 HMM을 이용한 고립 단어의 인식 실험 결과, 제안한 방법이 실험에 사용된 잡음의 환경들에서 모두 좋은 성능을 나타내었다. 아울러 병렬 모델 결합 방법을 반연속 HMM에 적용하였는데 이는 코드북의 변 환반으로 쉽게 잡음의 특성을 반영할 수 있다. 가중 투영 우도 측정 방법을 병렬 모델 결합 방법에 적용한 경우에도 우수한 성능을 거둘 수 있었다.

  • PDF

저전송율 보코더의 성능개선에 관한 연구 (On an Improving Performance of Low Bit-Rate Speech Coder)

  • 박영호;홍성훈;배명진
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.101-107
    • /
    • 1998
  • 본 논문에서는 잔차신호를 모델링하기 위해 사용되는 동적희박대수코드북에 대해 분석하고 성능이 향상된 새로운 대수코드북 구조 및 검색과정을 제안하였다. 제안된 알고리 즘은 대수 코드북의 단점을 계산량의 증가 없이 개선시켰다. 먼저 기존에 단순히 부호비트 만을 검색하는 것에 대해 다양한 펄스 진폭의 선택을 가능하게 하였다. 그리고 동일 트랙상 에서 두 펄스를 선택하게 하였으며 추가 계산량이 필요없는 무성음에서 유성음으로의 천이 구간 검출기를 이용하여 LSF 보간 시 발생하는 천이구간에서의 LP지연을 최소화하였다. 제 안된 알고리즘을 이용한 5.6kbps음성부호화기는 전화선상의 음질을 시료로 하여 주관적 음 질면에서 6.3kbps MP-MLQ와 동등하였으며 MNRU Q=15dB에서는 MP-MLQ에 비해 약간 의 음질열하가 발생하였다.

  • PDF

주변 잡음 환경에 강한 화자인식 알고리즘 연구 (A study on the robust speaker recognition algorithm in noise surroundings)

  • 정종순
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.47-54
    • /
    • 2005
  • 대부분의 화자인식 시스템은 음성 분석을 통해 화자의 특징을 음향 파라미터 형태로 추출하여 화자의 표준패턴을 만든 후, 입력된 미지의 음성패턴과의 차이를 계산하여 허용 여부를 최종적으로 판단한다. 화자인식에 사용하는 파라미터는 화자의 특징을 충분히 표현함과 더불어 발성 시마다 변동이 작은 것이 바람직하다. 따라서 본 논문에서도 이를 위해서 다음과 같이 제안하였다. 벡터 양자화모델에 비잡음 환경에 강한 스펙트럼 특징과 잡음 환경에 강한 운율정보를 화자인식 시스템에 이용할 것을 제안하였다. 훈련과정에서 코드북 형성시 실제 데이터를 스펙트럼 특징과 운을 특징을 조합하여 원하는 모델 수만큼 만들었다. 인식과정에서는 입력된 테스트패턴을 각 모델간에 거리 측도로 비교하여 가부를 결정하였다. 실험결과 스펙트럼 특징과 운을 특징을 각각 이용할 경우 보다 좋은 인식율을 얻었으며, 특히 잡음 환경에서 안정된 인식율을 확보하므로 상용화의 가능성을 한층 높였다.

  • PDF

운율 정보를 이용한 문장 독립형 화자인식 (Text Independent Speaker Recognition System Using Prosody)

  • 경연정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.396-400
    • /
    • 1998
  • 문장 독립형 화자인식 시스템에 운율정보 사용을 제안한다. 스펙트럴 특징패턴만을 주로 사용하고 있는 기존의 화자인식 시스템은 채널왜곡이나 기타 잡음환경에서 성능이 크게 저하된다. 그러나 화자의 speaking style을 반영하는 운율정보는 주위환경에 강인한 특성을 갖는다. 적합한 코드북 크기와 피치 컨투어 특징 벡터의 길이를 실험 치로 구하여 자동차 소음과 백색 가우시안 소음이 섞인 음성에 대하여 화자인식 실험을 하였다. 실험 결과 소음 환경에서 운율 정보를 이용한 화자 dsltlr 시스템이 스펙트럴 모델보다 인식율이 높음을 보였다.

  • PDF

다중 펄스와 다중 대역 이차 장구간 예측을 이용한 CELP 음성 부호화기 (A CELP Speech Coder Using Secondary Long Term Prediction with Multi-Band Pass Filtered Multi-Pulses)

  • 서정태;최용수;강홍구;윤대희
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.9-16
    • /
    • 1998
  • 본 논문에서는 낮은 비트율 CELP 음성 부호화기의 장구간 예측기의 성능 향상 방 법을 제안한다. 비트율을 낮추기 위해서는 분석 구간의 길이가 길어져야하며 이에 따라 장 구간 예측기의 성능이 저하되어 장구간 예측 후에도 준 주기성 성분이 상당량 존재하므로 백색 잡음으로 구성된 통계 코드북만으로는 이를 모델링하기 어려워진다. 제안 방법에서는 다중 대역 필터와 다중 펄스열을 이용하여 한 번 더 필터링(이차 장구간 예측)함으로써 장 구간 예측 후의 신호가 통계 코드북에 적합한 백색 잡음 형태로 되도록 모델링한다. 제안된 방법의 성능을 평가하기 위해 4.8kbps 비트율로 양자화한 후, 기존에 제안된 같은 전송률의 MBCELP와 DoD-CELP와 비교하였다. 실험 결과 제안된 방법이 기존 부호화기들에 비해 주/객관적인 음질에서 우수한 성능을 보여준다.

  • PDF