• 제목/요약/키워드: Gaussian Mixture Component

검색결과 48건 처리시간 0.024초

Active Shape 모델과 Gaussian Mixture 모델을 이용한 입술 인식 ((Lip Recognition Using Active Shape Model and Gaussian Mixture Model))

  • 장경식;이임건
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.454-460
    • /
    • 2003
  • 이 논문은 입술의 형태를 효과적으로 인식하는 방법을 제안하였다. 입술은 PDM(Point Distribution Model)을 기반으로 점들의 집합으로 표현하였다. 주성분 분석법을 적용하여 입술 모델을 구하고 모델에서 사용하는 형태계수의 분포를 GMM(Gaussian Mixture Model)을 이용하여 구하였다. 이 과정에서 계수를 정하기 위하여 EM(Expectation Maximization) 알고리듬을 사용하였다. 입술 경계선 모델은 입술을 구성하는 각 점과 주변 영역에서의 화소간 변화를 이용하여 구성하였으며 입술 탐색시 사용되었다. 여러 영상을 대상으로 실험한 결과 좋은 결과를 얻었다.

헬스케어 로봇으로의 응용을 위한 음색기반의 감정인식 알고리즘 구현 (Implementation of the Timbre-based Emotion Recognition Algorithm for a Healthcare Robot Application)

  • 공정식;권오상;이응혁
    • 전기전자학회논문지
    • /
    • 제13권4호
    • /
    • pp.43-46
    • /
    • 2009
  • 음성신호는 화자에 대한 고유한 정보와 주변의 음향환경에 대한 정보는 물론 감정과 피로도 등 다양한 정보가 포함되어 있다. 이에 음성신호를 이용한 연구분야에서 감정 상태를 파악하기 위한 연구가 지속되어 왔다. 이에 본 논문에서는 화자의 감정을 인식하기 위해 ETSI의 3GPP2 표준코덱인 Selectable Mode Vocoder(SMV)를 분석한다. 이를 기반으로 감정 인식에 효과적인 특징들을 제안한다. 이후 선정된 특징 벡터를 이용하여 Gaussian Mixture Model(GMM) 기반의 감정 인식 알고리즘을 개발하고 Mixture component 개수를 변화시키면서 성능을 검증한다.

  • PDF

독립성분 행렬도 (Independent Component Biplot)

  • 이수진;최용석
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.31-41
    • /
    • 2014
  • 행렬도(biplot)는 이원표 자료행렬(two-way data matrix)의 행과 열을 한 그림에 동시에 나타내는 탐색적 방법으로, 복잡한 다변량 분석 결과를 보다 쉽게 파악할 수 있는 장점이 있다. 특히 주성분인자 행렬도(principal component factor biplot; PCFB)는 인자분석을 통해서 변수들 간의 상호의존 구조를 탐색하기 위한 시각적 도구이다. 자료에 따라 잠재된 변수들이 독립(independent)이고 비가우시안(non-Gaussian) 분포를 가진다는 사전 정보가 있을 때, Jutten과 Herault (1991)가 제안한 독립성분분석(independent component analysis)을 이용한다. 이 경우 주성분법을 이용한 인자분석을 적용하면 원래 변수들의 상호 관계를 잘못 해석할 수도 있다. 따라서 본 논문에서는 자료에 따라 잠재된 변수들이 독립이고 비가우시안 분포를 가진다는 사전 정보가 있을 때, 독립성분분석을 응용하여 원래 변수들 간의 상호 관계를 기하학적으로 살펴볼 수 있는 시각적 도구인 독립성분 행렬도(independent component biplot; ICB)를 제안하려 한다.

형태계수의 Mixture Model을 이용한 입술 형태 표현과 입술 경계선 추출 (Lip Shape Representation and Lip Boundary Detection Using Mixture Model of Shape)

  • 장경식;이임건
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1531-1539
    • /
    • 2004
  • 본 논문은 입술의 경계선을 효과적으로 추출하는 방법을 제안하였다. 입술 형태는 PDM(Point Distribution Model)과 주성분 분석법을 이용하여 표현하고 입술 경계선은 GLDM(Gray Level Distribution Model)을 기반으로 표현하였다 입술 경계선 추출은 모델에 대한 입력영상의 정확도에 대한 목적함수를 최적화하는 문제로 단순화하였으며, 최적화를 위해 다운힐 심플렉스(Down Hill Simplex) 알고리즘을 이용하였다. 탐색과정에서 지역 최소점으로 수렴하는 문제를 해결하기 위하여 입술 형태 모델의 형태계수를 GMM(Gaussian Mixture Model)을 이용하여 표현하였다. 형태계수에 대한 GMM을 이용하여 입술의 대략적인 형태를 찾고, 이때 사용된 mixture 성분을 이용하여 탐색과정에서 입술의 형태를 조정함으로써 지역 최소점에 수렴하여 입술의 정확한 위치를 찾지 못하는 문제점을 해결하였다. 여러 영상을 대상으로 실험하여 좋은 결과를 얻었다.

  • PDF

화자식별을 위한 전역 공분산에 기반한 주성분분석 (Global Covariance based Principal Component Analysis for Speaker Identification)

  • 서창우;임영환
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.69-73
    • /
    • 2009
  • This paper proposes an efficient global covariance-based principal component analysis (GCPCA) for speaker identification. Principal component analysis (PCA) is a feature extraction method which reduces the dimension of the feature vectors and the correlation among the feature vectors by projecting the original feature space into a small subspace through a transformation. However, it requires a larger amount of training data when performing PCA to find the eigenvalue and eigenvector matrix using the full covariance matrix by each speaker. The proposed method first calculates the global covariance matrix using training data of all speakers. It then finds the eigenvalue matrix and the corresponding eigenvector matrix from the global covariance matrix. Compared to conventional PCA and Gaussian mixture model (GMM) methods, the proposed method shows better performance while requiring less storage space and complexity in speaker identification.

  • PDF

모폴로지 연산과 가우시안 혼합 모형에 기반한 컬러 영상 분할 (Color Image Segmentation Based on Morphological Operation and a Gaussian Mixture Model)

  • 이명은;박순영;조완현
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.84-91
    • /
    • 2006
  • 본 논문에서는 수학적 모폴로지 연산과 가우시안 혼합 모형에 기초한 새로운 칼라 영상 분할 알고리즘을 제안한다. 우리는 혼합 모형에서 구성 성분의 수를 결정하고, 각 구성 성분의 중심값을 계산하는데 모폴로지의 연산과 라벨링 연산을 이용한다. 그리고 칼라 특징 벡터의 확률 모형으로 가우시안 혼합 모형을 사용하고, 이들의 모수 값들을 추정하는데 결정적 어닐링 EM알고리즘을 사용한다. 최종적으로 혼합 모형으로부터 계산된 사후 확률을 이용하여 칼라 영상을 분할한다. 실험 결과를 통하여 모폴로지 연산이 혼합모형의 수를 자동으로 결정하고 각 성분의 모드를 계산하는데 아주 효율적인 방법임을 보였고, 또한 결정적 어닐링 EM 알고리즘에 의하여 추정된 가우시안 혼합 모형을 사용하여 계산된 사후 확률에 의한 영상 분할 방법이 기존의 분할 알고리즘보다 정확한 분할 방법임을 보였다.

Improved Algorithm for Fully-automated Neural Spike Sorting based on Projection Pursuit and Gaussian Mixture Model

  • Kim, Kyung-Hwan
    • International Journal of Control, Automation, and Systems
    • /
    • 제4권6호
    • /
    • pp.705-713
    • /
    • 2006
  • For the analysis of multiunit extracellular neural signals as multiple spike trains, neural spike sorting is essential. Existing algorithms for the spike sorting have been unsatisfactory when the signal-to-noise ratio(SNR) is low, especially for implementation of fully-automated systems. We present a novel method that shows satisfactory performance even under low SNR, and compare its performance with a recent method based on principal component analysis(PCA) and fuzzy c-means(FCM) clustering algorithm. Our system consists of a spike detector that shows high performance under low SNR, a feature extractor that utilizes projection pursuit based on negentropy maximization, and an unsupervised classifier based on Gaussian mixture model. It is shown that the proposed feature extractor gives better performance compared to the PCA, and the proposed combination of spike detector, feature extraction, and unsupervised classification yields much better performance than the PCA-FCM, in that the realization of fully-automated unsupervised spike sorting becomes more feasible.

A Sequential LiDAR Waveform Decomposition Algorithm

  • Jung, Jin-Ha;Crawford, Melba M.;Lee, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제26권6호
    • /
    • pp.681-691
    • /
    • 2010
  • LiDAR waveform decomposition plays an important role in LiDAR data processing since the resulting decomposed components are assumed to represent reflection surfaces within waveform footprints and the decomposition results ultimately affect the interpretation of LiDAR waveform data. Decomposing the waveform into a mixture of Gaussians involves two related problems; 1) determining the number of Gaussian components in the waveform, and 2) estimating the parameters of each Gaussian component of the mixture. Previous studies estimated the number of components in the mixture before the parameter optimization step, and it tended to suggest a larger number of components than is required due to the inherent noise embedded in the waveform data. In order to tackle these issues, a new LiDAR waveform decomposition algorithm based on the sequential approach has been proposed in this study and applied to the ICESat waveform data. Experimental results indicated that the proposed algorithm utilized a smaller number of components to decompose waveforms, while resulting IMP value is higher than the GLA14 products.

A New Distance Measure for a Variable-Sized Acoustic Model Based on MDL Technique

  • Cho, Hoon-Young;Kim, Sang-Hun
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.795-800
    • /
    • 2010
  • Embedding a large vocabulary speech recognition system in mobile devices requires a reduced acoustic model obtained by eliminating redundant model parameters. In conventional optimization methods based on the minimum description length (MDL) criterion, a binary Gaussian tree is built at each state of a hidden Markov model by iteratively finding and merging similar mixture components. An optimal subset of the tree nodes is then selected to generate a downsized acoustic model. To obtain a better binary Gaussian tree by improving the process of finding the most similar Gaussian components, this paper proposes a new distance measure that exploits the difference in likelihood values for cases before and after two components are combined. The mixture weight of Gaussian components is also introduced in the component merging step. Experimental results show that the proposed method outperforms MDL-based optimization using either a Kullback-Leibler (KL) divergence or weighted KL divergence measure. The proposed method could also reduce the acoustic model size by 50% with less than a 1.5% increase in error rate compared to a baseline system.

화자인식에서 연속밀도 은닉마코프모델의 혼합밀도 결정방법 (Gaussian Density Selection Method of CDHMM in Speaker Recognition)

  • 서창우;이주헌;임재열;이기용
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.711-716
    • /
    • 2003
  • 본 논문은 연속밀도 은닉마코프모델에서 각 상태별 혼합성분 개수를 결정하는 방법을 제안한다. 지금까지의 대부분의 연구가 연속밀도 은닉마코프모델에서 화자의 스펙트럼 특성에 상관없이 각 상태별 동일한 혼합성분 개수를 적용하였다. 이런 접근방법은 많은 계산량을 요구할 뿐만 아니라, 각 상태의 특성을 무시하고 있기 때문에 각 상태별 음성신호의 정확한 모델링을 할 수 없다. 따라서 본 논문에서 제안한 연속밀도 은닉마코프모델의 파라미터 추정은 각 상태별 혼합성분에 대한 발생 확률값에 따라서 결정하였다. 또한 혼합성분의 개수를 줄이는 과정에서 신호의 상관성을 줄이고 시스템의 전체적인 안정성을 얻기 위해서 주성분 분석을 이용하였다. 제안한 방법은 기존의 은닉마코프모델에 비해서 평균 10% 작은 혼합성분 개수를 이용했을 때를 기준으로 실험하였다. 실험결과에서 혼합성분 결정만을 적용했을 때 거의 비슷한 성능을 얻을 수 있었다. 그리고 주성분 분석을 이용했을 때, 특정벡터가 16 차일 때 평균 0.35%의 성능감소가 일어났지만, 25 차에서는 평균 0.65%의 성능개선을 얻을 수 있었다.