• 제목/요약/키워드: Gaussian mixture model-based

검색결과 271건 처리시간 0.033초

Extraction of Infrared Target based on Gaussian Mixture Model

  • Shin, Do Kyung;Moon, Young Shik
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권6호
    • /
    • pp.332-338
    • /
    • 2013
  • We propose a method for target detection in Infrared images. In order to effectively detect a target region from an image with noises and clutters, spatial information of the target is first considered by analyzing pixel distributions of projections in horizontal and vertical directions. These distributions are represented as Gaussian distributions, and Gaussian Mixture Model is created from these distributions in order to find thresholding points of the target region. Through analyzing the calculated Gaussian Mixture Model, the target region is detected by eliminating various backgrounds such as noises and clutters. This is performed by using a novel thresholding method which can effectively detect the target region. As experimental results, the proposed method has achieved better performance than existing methods.

  • PDF

Gaussian 혼합모델 기반 조명 변화에 강건한 연기검출 알고리즘 (Gaussian Mixture Model Based Smoke Detection Algorithm Robust to Lights Variations)

  • 박장식;송종관;윤병우
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.733-739
    • /
    • 2012
  • 본 논문에서는 시간과 기후에 따라 변화하는 영상의 밝기와 색상 변화에도 강건한 연기검출 알고리즘을 제안한다. 제안하는 연기검출 알고리즘은 입력영상과 배경영상의 차영상을 이용하여 후보영역을 설정하고, 후보영역 차영상의 Gaussian 혼합모델 특징 계수를 비교하여 연기를 판별한다. 시간과 기후에 대응하기 위하여 입력영상의 평균 밝기와 색상을 기준으로 후보영역 설정을 위한 임계값을 4 단계로 구분한다. 후보영역에 대한 차영상의 Gaussian 혼합모델의 밝기 평균값을 기준으로 클러스터를 정렬하고, 클러스터 간의 Gaussian 혼합모델 특징 계수를 비교하여 연기를 판별한다. 제안하는 알고리즘을 미디어전용 DSP로 구현하고 야외에 설치된 카메라의 영상에 대하여 연기검출 실험을 통하여 효율적으로 연기를 검출할 수 있음 보인다.

Online nonparametric Bayesian analysis of parsimonious Gaussian mixture models and scenes clustering

  • Zhou, Ri-Gui;Wang, Wei
    • ETRI Journal
    • /
    • 제43권1호
    • /
    • pp.74-81
    • /
    • 2021
  • The mixture model is a very powerful and flexible tool in clustering analysis. Based on the Dirichlet process and parsimonious Gaussian distribution, we propose a new nonparametric mixture framework for solving challenging clustering problems. Meanwhile, the inference of the model depends on the efficient online variational Bayesian approach, which enhances the information exchange between the whole and the part to a certain extent and applies to scalable datasets. The experiments on the scene database indicate that the novel clustering framework, when combined with a convolutional neural network for feature extraction, has meaningful advantages over other models.

향상된 MDL 기법에 의한 음향모델의 최적화 연구 (A Study on Improved MDL Technique for Optimization of Acoustic Model)

  • 조훈영;김상훈
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.56-61
    • /
    • 2010
  • 본 논문에서는 HMM 기반의 연속음성인식에서 음향모델의 최적화 기법을 논한다. 대부분의 음성인식 시스템에서 HMM 상태별로 동일한 개수의 가우시안 성분 (mixture component)을 사용해 왔다. 그러나, 음향 모델링에 사용되는 데이터 샘플의 개수는 HMM상태별로 다르므로 이에 따른 최적화를 수행할 경우 모델 파라미터의 개수를 효과적으로 줄일 수 있을 뿐 아니라, 디코딩 단계에서 음성인식기의 속도 및 인식 성능 개선이 기대된다. 본 연구에서 제안한 방법은 기존에 알려진 MDL (minimum description length) 기반의 음향모델 최적화 방법에서 가우시안 성분들의 통합과정에 가우시안 성분의 가중치 정보 (mixture weight)를 반영하도록 개선하였다. 인식 실험 결과, 제안한 방법은 가우시안 성분의 가중치를 반영하지 않는 기존 방법에 비해 향상된 최적화 성능을 보임을 확인할 수 있었다.

Active Shape 모델과 Gaussian Mixture 모델을 이용한 입술 인식 ((Lip Recognition Using Active Shape Model and Gaussian Mixture Model))

  • 장경식;이임건
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.454-460
    • /
    • 2003
  • 이 논문은 입술의 형태를 효과적으로 인식하는 방법을 제안하였다. 입술은 PDM(Point Distribution Model)을 기반으로 점들의 집합으로 표현하였다. 주성분 분석법을 적용하여 입술 모델을 구하고 모델에서 사용하는 형태계수의 분포를 GMM(Gaussian Mixture Model)을 이용하여 구하였다. 이 과정에서 계수를 정하기 위하여 EM(Expectation Maximization) 알고리듬을 사용하였다. 입술 경계선 모델은 입술을 구성하는 각 점과 주변 영역에서의 화소간 변화를 이용하여 구성하였으며 입술 탐색시 사용되었다. 여러 영상을 대상으로 실험한 결과 좋은 결과를 얻었다.

형태계수의 Mixture Model을 이용한 입술 형태 표현과 입술 경계선 추출 (Lip Shape Representation and Lip Boundary Detection Using Mixture Model of Shape)

  • 장경식;이임건
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1531-1539
    • /
    • 2004
  • 본 논문은 입술의 경계선을 효과적으로 추출하는 방법을 제안하였다. 입술 형태는 PDM(Point Distribution Model)과 주성분 분석법을 이용하여 표현하고 입술 경계선은 GLDM(Gray Level Distribution Model)을 기반으로 표현하였다 입술 경계선 추출은 모델에 대한 입력영상의 정확도에 대한 목적함수를 최적화하는 문제로 단순화하였으며, 최적화를 위해 다운힐 심플렉스(Down Hill Simplex) 알고리즘을 이용하였다. 탐색과정에서 지역 최소점으로 수렴하는 문제를 해결하기 위하여 입술 형태 모델의 형태계수를 GMM(Gaussian Mixture Model)을 이용하여 표현하였다. 형태계수에 대한 GMM을 이용하여 입술의 대략적인 형태를 찾고, 이때 사용된 mixture 성분을 이용하여 탐색과정에서 입술의 형태를 조정함으로써 지역 최소점에 수렴하여 입술의 정확한 위치를 찾지 못하는 문제점을 해결하였다. 여러 영상을 대상으로 실험하여 좋은 결과를 얻었다.

  • PDF

Model-based Clustering of DOA Data Using von Mises Mixture Model for Sound Source Localization

  • Dinh, Quang Nguyen;Lee, Chang-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.59-66
    • /
    • 2013
  • In this paper, we propose a probabilistic framework for model-based clustering of direction of arrival (DOA) data to obtain stable sound source localization (SSL) estimates. Model-based clustering has been shown capable of handling highly overlapped and noisy datasets, such as those involved in DOA detection. Although the Gaussian mixture model is commonly used for model-based clustering, we propose use of the von Mises mixture model as more befitting circular DOA data than a Gaussian distribution. The EM framework for the von Mises mixture model in a unit hyper sphere is degenerated for the 2D case and used as such in the proposed method. We also use a histogram of the dataset to initialize the number of clusters and the initial values of parameters, thereby saving calculation time and improving the efficiency. Experiments using simulated and real-world datasets demonstrate the performance of the proposed method.

A Gaussian Mixture Model for Binarization of Natural Scene Text

  • Tran, Anh Khoa;Lee, Gueesang
    • 스마트미디어저널
    • /
    • 제2권2호
    • /
    • pp.14-19
    • /
    • 2013
  • Recently, due to the increase of the use of scanned images, the text segmentation techniques, which play critical role to optimize the quality of the scanned images, are required to be updated and advanced. In this study, an algorithm has been developed based on the modification of Gaussian mixture model (GMM) by integrating the calculation of Gaussian detection gradient and the estimation of the number clusters. The experimental results show an efficient method for text segmentation in natural scenes such as storefronts, street signs, scanned journals and newspapers at different size, shape or color of texts in condition of lighting changes and complex background. These indicate that our model algorithm and research approach can address various issues, which are still limitations of other senior algorithms and methods.

  • PDF

잡음 환경에 효과적인 음성 인식을 위한 Gaussian mixture model deep neural network 하이브리드 기반의 특징 보상 (A study on Gaussian mixture model deep neural network hybrid-based feature compensation for robust speech recognition in noisy environments)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.506-511
    • /
    • 2018
  • 본 논문에서는 잡음 환경에서 효과적인 음성인식을 위하여 GMM(Gaussian Mixture Model)-DNN(Deep Neural Network) 하이브리드 기반의 특징 보상 기법을 제안한다. 기존의 GMM 기반의 특징 보상에서 필요로 하는 사후 확률을 DNN을 통해 계산한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 GMM-DNN 하이브리드 기법이 기존의 GMM 기반 기법에 비해 Known, Unknown 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 Unknown 잡음 환경에서 평균 오류율이 9.13 %의 상대 향상률을 나타내고, 낮은 SNR(Signal to Noise Ratio) 잡음 환경에서 상당히 우수한 성능을 보인다.

A New Distance Measure for a Variable-Sized Acoustic Model Based on MDL Technique

  • Cho, Hoon-Young;Kim, Sang-Hun
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.795-800
    • /
    • 2010
  • Embedding a large vocabulary speech recognition system in mobile devices requires a reduced acoustic model obtained by eliminating redundant model parameters. In conventional optimization methods based on the minimum description length (MDL) criterion, a binary Gaussian tree is built at each state of a hidden Markov model by iteratively finding and merging similar mixture components. An optimal subset of the tree nodes is then selected to generate a downsized acoustic model. To obtain a better binary Gaussian tree by improving the process of finding the most similar Gaussian components, this paper proposes a new distance measure that exploits the difference in likelihood values for cases before and after two components are combined. The mixture weight of Gaussian components is also introduced in the component merging step. Experimental results show that the proposed method outperforms MDL-based optimization using either a Kullback-Leibler (KL) divergence or weighted KL divergence measure. The proposed method could also reduce the acoustic model size by 50% with less than a 1.5% increase in error rate compared to a baseline system.