• 제목/요약/키워드: Gaussian Mixture Component

검색결과 48건 처리시간 0.029초

화자확인에서 특징벡터의 순시 정보와 선형 변환의 효과적인 적용 (Effective Combination of Temporal Information and Linear Transformation of Feature Vector in Speaker Verification)

  • 서창우;조미화;임영환;전성채
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.127-132
    • /
    • 2009
  • The feature vectors which are used in conventional speaker recognition (SR) systems may have many correlations between their neighbors. To improve the performance of the SR, many researchers adopted linear transformation method like principal component analysis (PCA). In general, the linear transformation of the feature vectors is based on concatenated form of the static features and their dynamic features. However, the linear transformation which based on both the static features and their dynamic features is more complex than that based on the static features alone due to the high order of the features. To overcome these problems, we propose an efficient method that applies linear transformation and temporal information of the features to reduce complexity and improve the performance in speaker verification (SV). The proposed method first performs a linear transformation by PCA coefficients. The delta parameters for temporal information are then obtained from the transformed features. The proposed method only requires 1/4 in the size of the covariance matrix compared with adding the static and their dynamic features for PCA coefficients. Also, the delta parameters are extracted from the linearly transformed features after the reduction of dimension in the static features. Compared with the PCA and conventional methods in terms of equal error rate (EER) in SV, the proposed method shows better performance while requiring less storage space and complexity.

  • PDF

얼굴인증 방법들의 조명변화에 대한 견인성 비교 연구 (Study On The Robustness Of Face Authentication Methods Under illumination Changes)

  • 고대영;김진영;나승유
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.9-16
    • /
    • 2005
  • 본 논문은 얼굴인증 시스템 구현과 조명변화에 견인한 얼굴인증 방법들에 관한 연구에 초점을 둔다. 얼굴인증 시스템 구현을 위한 방법으로 PCA(Principal Component Analysis), GMM(Gaussian Mixture Models), 1차원 HMM(1 Dimensional Hidden Markov Models), 준 2차원 HMM(Pseudo 2 Dimensional Hidden Markov Models) 방법을 이용한다. 네 가지 다른 얼굴인증 방법들의 조명변화에 대한 성능비교 실험을 수행한다. 조명변화실험을 위해 얼굴이미지의 왼쪽에서 오른쪽으로 인공적인 조명효과(${\delta}=0,40,60,80$)를 준다. 얼굴특징벡터는 얼굴이미지에서 분할한 각 블록에 대한 2D DCT(2 Dimensional Discrete Cosine Transform) 계수를 이용하고 실험은 ORL(Olivetti Research Laboratory) 얼굴데이터베이스를 사용한다. 실험결과 모든 경우 조명변화 값이 커질수록 성능저하가 발생한다. 또한 조명변화가 없는 경우(${\delta}=0$) 준 2차원 HMM이 $2.54{\%}$, 1차원 HMM이 $3.18{\%}$, PCA가 $11.7{\%}$, GMM이 $13.38{\%}$의 EER(Equal Error Rate) 성능을 나타낸다. 조명변화가 없는 경우(${\delta}=0$) 1차원 HMM 방법이 PCA 방법보다 좋은 성능을 나타내지만 조명변화 ${\delta}{\geq}40$인 때에는 반대로 PCA 방법이 더 좋은 성능을 나타낸다. 마지막으로 준 2차원 HMM의 경우 조명변화에 관계없이 가장 좋은 EER성능을 나타낸다.

화자 검증 시스템을 위한 PCA 기반 MFDWC 특징 파라미터 (A PCA-based MFDWC Feature Parameter for Speaker Verification System)

  • 함성준;정호열;정현열
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.36-42
    • /
    • 2006
  • 본 논문에서는 화자검증 시스템의 성능향상을 위해서 주성분 분석 (PCA) 기반 Mel-Frequency Discrete Wavelet Coefficients (MFDWC) 추출방법을 제안한다. 제안된 방법에서는 멜척도 (Mel-scale)를 근사화한 각 레벨 (level)의 각 노드 (node) 에너지를 계산하기 위해 기존의 평균치 대신 주성분 분석을 이용한 첫 번째 eigenvector를 이용한다. 이 eigenvecto.의 제곱의 합은 1로서 일반적인 가중 함수 (weighting function)의 조건을 만족하고, 또한 각 화자마다 서로 다른 값을 갖게 되므로, 화자의 특징을 더 잘 나타내는 MFDWC를 추출할 수 있다. 화자검증은 Gaussian Mixture Model (GMM) 기반의 백그라운드 모델과 화자 모델과의 점수를 비교하는 이진 결정 (binary decision) 방법을 이용하여 Universal 백그라운드 모델 (UBM)과 각 화자 모델의 값을 프레임단위로 비교하여 대상 화자의 수락/거부 여부를 결정하는 방법을 채택하였다. 특징 파라미터에 따른 화자 검증 성능변화를 확인하기 위하여 제안된 화자종속 가중함수를 이용한 MFDWC를 특징 파라미터로 이용한 경우와 Mel-Frequency Cepstral Coefficients (MFCC), Linear Predictive Cepstral Coefficients (LPCC), 기존의 MFDWC를 특징 파라미터로 이용한 경우에 대하여 성능비교실험을 수행한 결과 각각 $0.80\%,\;5.14\%,\; 6.69\%$의 향상된 성능을 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

오디오 신호를 이용한 음란 동영상 판별 (Classification of Phornographic Videos Using Audio Information)

  • 김봉완;최대림;방만원;이용주
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.207-210
    • /
    • 2007
  • As the Internet is prevalent in our life, harmful contents have been increasing on the Internet, which has become a very serious problem. Among them, pornographic video is harmful as poison to our children. To prevent such an event, there are many filtering systems which are based on the keyword based methods or image based methods. The main purpose of this paper is to devise a system that classifies the pornographic videos based on the audio information. We use Mel-Cepstrum Modulation Energy (MCME) which is modulation energy calculated on the time trajectory of the Mel-Frequency cepstral coefficients (MFCC) and MFCC as the feature vector and Gaussian Mixture Model (GMM) as the classifier. With the experiments, the proposed system classified the 97.5% of pornographic data and 99.5% of non-pornographic data. We expect the proposed method can be used as a component of the more accurate classification system which uses video information and audio information simultaneously.

  • PDF

화자식별을 위한 강인한 주성분 분석 가우시안 혼합 모델 (RPCA-GMM for Speaker Identification)

  • 이윤정;서창우;강상기;이기용
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.519-527
    • /
    • 2003
  • 음성신호는 주변 잡음과 화자의 발성 패턴 변화, 음성 검출 오류에서 생기는 이상치(outlier)에 많은 영향을 받고 있다. 이러한 음성 신호를 이용하여 화자인식에 이용할 경우 인식률이 저하된다. 본 논문에서는 화자식별 (speaker identification)에서 학습 특징 벡터의 이상치와 고차원 문제를 해결하기 위하여 M-추정을 이용한 강인한 주성분 분석 가우시안 혼합모델 (Robust Principal Component Analysis-Gaussian Mixture Model)방법을 제안하였다. 제안된 방법은 먼저, 특징 벡터에 이상치가 존재할 경우 M-추정에 의하여 강인한 공분산 행렬을 재추정하여 얻어진 고유벡터로부터 변환 행렬을 구하여 감소된 차원을 갖는 새로운 특징벡터를 구한다. 여기에서 얻은 선형변환된 특징벡터로부터 화자의 가우시안 혼합 모델을 구한다. 제안된 방법의 성능을 검증하기 위하여 화자식별 실험을 하였다. 실험은 전형적인 가우시안 혼합 모델 방법과 주성분 분석법, 제안된 방법을 비교 분석하였다. 이상치가 2%씩 증가할 때마다 가우시안 혼합모델 방법과 주성분 분석법은 각각 0.65%, 0.55%씩 화자식별 성능이 저하되었지만, 제안된 방법은 0.03%정도 감소하였으므로 이상치에 더욱 강인함을 알 수 있다.

알츠하이머 병의 검출을 위한 ML-SVM, PCA, VBM, GMM을 결합한 융합적 성능 비교 (Convergence performance comparison using combination of ML-SVM, PCA, VBM and GMM for detection of AD)

  • 사우라르 알람;권구락
    • 한국융합학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-7
    • /
    • 2016
  • 구조적 MRI 영상은 여러 단 변량과 다변량 방법을 위해 그레이 메터 (GM), 화이트 메터 (WM), 뇌척수액 (CSF) 세션화 과정을 하고 난후 형태계측학적 특징을 추출하기 위해 사용한다. 새로운 접근 방법은 매우 가벼운 알츠하이머 병에서 가벼운 알츠하이머병의 진단을 위해 적용된다. 간이정신상태검사에 따른 형태계측학적 특징과 가우시안 복합 모델 파라미터를 결합하여 정상인으로부터 알츠하이머 병 환자로 분류하는 방법을 제안한다. 결합한 특징은 주성분 분석 기법을 이용한 고차원의 저주를 제거한 후 다중 커널 SVM 분류기에 공급한다. 제안한 진단 방법의 실험적 결과는 90%이상의 특성도와 고민감도에 따라 다중 커널 SVM을 가진 층화 정확도가 96%까지 최대 산출한다.

스마트폰 가속도 센서를 이용한 사용자 인증 방법 연구 (A Study on User Authentication with Smartphone Accelerometer Sensor)

  • 서준석;문종섭
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1477-1484
    • /
    • 2015
  • 스마트폰 기반 금융 산업의 발달로 스마트폰을 이용한 인증 기법에 관심이 높아지고 있다. 다양한 생체 기반 사용자 인증 방식이 존재하지만 아직까지 스마트폰 기반 사용자의 걸음 패턴(gait) 인증 방식은 뚜렷한 발전을 보이고 있지 않다. 본 논문에서는 스마트폰에 기본적으로 탑재된 가속도 센서를 이용해 사용자를 인증하는 방법을 제안한다. 구체적으로, 스마트폰에서 수집한 데이터를 3D 변환하여 자세를 교정하고, 변환된 데이터에서 특징을 추출한 뒤 주성분 분석, 가우시안 혼합 모델링 과정을 거쳐 데이터를 학습 시킨다. 다음으로, 신뢰구간 검증 방식을 사용해 사용자 데이터를 검증했다. 그 결과, 통제 요인과 한계점이 많았던 선행 가속도 연구들과 달리 최소한의 통제 요인과 높은 정확도(약 96%)로 사용자 인증이 가능함을 입증했다.

지역의 사회·경제적 인자와 용수공급체계를 고려한 가뭄 위험도 평가 (Drought risk assessment considering regional socio-economic factors and water supply system)

  • 김지은;김민지;최시중;이주헌;김태웅
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.589-601
    • /
    • 2022
  • 가뭄은 자연적 현상이지만, 지역의 물리적 및 사회적 요소와 결합되어 피해가 발생한다. 특히, 각종 용수 공급 및 수요과 연관되어 사회 경제적으로 큰 피해를 야기시킨다. 비슷한 심도의 기상학적 가뭄에도 지역의 특성과 용수공급체계에 따라 실제로 발생하는 가뭄 피해는 다르다. 본 연구에서는 지역의 사회·경제적 인자와 용수공급체계를 고려하여 가뭄 위험도를 평가하였다. 노출성은 용수공급 과부족량을 나타내는 결합가뭄관리지수(JDMI)를 등급화하여 평가하였다. 취약성은 가뭄에 영향을 받는 10개의 사회·경제적 인자에 엔트로피, PCA 및 GMM를 적용하여 가중평균하여 평가하였다. 대응능력은 지역의 용수능력을 나타내는 인자들을 베이지안 네트워크에 적용하여 평가하였다. 위험도는 노출성, 취약성 및 대응능력을 통합하여 결정하였다. 용수공급 실패 사상의 발생 가능성을 의미하는 가뭄 노출성을 평가한 결과, 괴산군이 0.81로 가장 높게 나타났다. 가뭄 취약성의 경우, 대전광역시가 0.61로 매우 취약한 것으로 나타났다. 지역의 용수공급체계가 고려된 가뭄 대응능력을 평가한 결과, 세종시가 가뭄 대응능력이 가장 낮은 것으로 나타났다. 마지막으로 위험도를 평가한 결과, 청주시가 가장 높게 나타났다. 이러한 결과를 통해 가뭄에 대한 위험 및 취약 원인을 파악하였으며, 향후 지역의 특성을 고려한 가뭄 피해 저감 정책 마련이 가능하다.