• 제목/요약/키워드: 스코어 정규화

검색결과 8건 처리시간 0.021초

강인한 화자 확인 시스템을 위한 World 모델을 이용한 켑스트럼 정규화 연구 (A Study of Cepstrum Normalization Using World Model for Robust Speaker Verification)

  • 김유진;정재호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.55-58
    • /
    • 2000
  • 본 논문에서는 화자 확인 시스템의 등록과 확인 과정의 채널 환경 불일치로 성능이 저하되는 문제를 해결하기 위한 새로운 정규화 방법에 대해 설명한다. 제안된 방법은 첫째, 입력 음성으로부터 효과적으로 채널을 추정$\cdot$보상하고 둘째, 스코어 정규화 과정에서 사칭자 모델로서 사용되는 world모델과의 차이를 채널 추정 및 화자 모델 생성에 효과적으로 사용하는 것을 목표로 한다. 이를 위해 입력 음성의 켑스트럼과 HMM world 모델의 파라메터인 평균 켑스트럼과의 차이를 통해 음소열에 종속적인 채널 켑스트럼인 Phone-Dependent Difference Cepstrum을 추정한다. 한편 입력 음성의 음소열은 world모델의 스코어를 얻는 과정에서 함께 얻어질 수 있다. 채널 추정 실험 결과를 통해서 가장 일반적인 채널 정규화방법인 CMS에 의해 추정된 채널에 비해 실제 채널과 유사하며 화자 고유의 특성을 왜곡시키지 않는 채널 추정이 가능함을 확인할 수 있었다.

  • PDF

텍스처 기술자들을 이용한 이질적 얼굴 인식 시스템 (Heterogeneous Face Recognition Using Texture feature descriptors)

  • 배한별;이상윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.208-214
    • /
    • 2021
  • 최근 많은 지능형 보안 시나리오 및 범죄수사에서는 사진이 아닌 얼굴 영상과 다수의 정면 사진과의 매칭을 요구한다. 기존의 얼굴 인식 시스템은 이러한 요구를 충분히 충족시킬 수 없다. 본 논문에서는 동일 인물의 스케치와 사진 간의 양식 차이를 줄임으로써, 이질적 얼굴 인식 시스템의 성능을 향상시키는 알고리즘을 제안한다. 제안하는 알고리즘은 텍스처 기술자들(그레이 레벨 동시 발생 행렬, 멀티스케일 지역 이진 패턴)을 통하여 영상의 텍스처 특징들을 각각 추출하고, 이를 바탕으로 고유특징 정규화 및 추출기법을 통해 변환 행렬을 생성하게 된다. 이렇게 생성된 벡터들 간 계산된 스코어 값은 스코어 정규화 방식들을 통하여 최종적으로 스케치 영상의 신원을 인식하게 된다.

프레임단위유사도정규화를 이용한 문맥독립화자식별시스템의 성능 향상 (Improving A Text Independent Speaker Identification System By Frame Level Likelihood Normalization)

  • 김민정;석수영;정현열;정호열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.487-490
    • /
    • 2001
  • 본 논문에서는 기존의 Caussian Mixture Model을 이용한 실시간문맥독립화자인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 나타내는 유사도정규화 ( Likelihood Normalization )방법을 화자식별시스템에 적용하여 시스템을 구현하였으며, 인식실험한 결과에 대해 보고한다. 시스템은 화자모델생성단과 화자식별단으로 구성하였으며, 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian Mixture Model)을 이용하여 화자모델을 작성하였으며. GMM의 파라미터를 최적화하기 위하여 MLE(Maximum Likelihood Estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum Likelihood)을 이용하여 프레임단위로 유사도를 계산하였다. 계산된 유사도는 유사도 정규화 과정을 거쳐 스코어( SC)로 표현하였으며, 가장 높은 스코어를 가지는 화자를 인식화자로 결정한다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며. 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을수 있었다.

  • PDF

프레임레벨유사도정규화를 적용한 문맥독립화자식별시스템의 구현 (Realization a Text Independent Speaker Identification System with Frame Level Likelihood Normalization)

  • 김민정;석수영;김광수;정현열
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.8-14
    • /
    • 2002
  • 본 논문에서는 Gaussian mixture model을 이용한 실시간 문맥독립화자식별시스템을 구현하여 인식실험을 수행하였으며, 인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 보인 유사도 정규화(Likelihood normalization)방법을 적용하여 인식실험을 하였다. 시스템은 크게 전처리단과 화자모델생성단, 화자식별단으로 나누어진다. 전처리단에서는 화자의 발성변화를 고려하여 CMN(Cepstral mean normalization)과 Silence removal 방법을 적용하였다. 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian mixture model)을 이용하여 화자모델을 작성하였으며, GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum likelihood)을 이용하여 유사도를 계산하였으며, 이 과정에서 유사도 정규화를 적용한 경우에는 프레임단위로 유사도를 계산하게 된다. 계산된 유사도는 스코어(S$_{C}$)로 표현하였고, 가장 높은 스코어를 가지는 화자가 인식화자로 결정된다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며, 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을 수 있었다.

  • PDF

화자검증을 위한 새로운 코호트 선택 방법 (A New Method of Selecting Cohort for Speaker Verification)

  • 김성준;계영철
    • 한국음향학회지
    • /
    • 제22권5호
    • /
    • pp.383-387
    • /
    • 2003
  • 본 논문에서는 기존의 고정크기의 코호트 집단을 기반으로 한 화자검증 방법을 다룬다. 특히, 본 논문에서는 고정크기의 코호트 대신에 화자모델들 사이의 거리를 이용하는 가변크기의 새로운 코호트를 제안한다: 제안된 새로운 방식에서는 각 화자로부터 일정한 거리 내에 있는 주변 화자모델들의 밀집도가 고려된다. 그 화자주변의 밀집도가 높으면 코호트의 크기가 자동적으로 증가되어 화자검증률이 개선되고, 반면 밀집도가 적으면 코호트의 크기가 감소되어 계산량이 줄어든다 실험결과 제안된 방법이 기존의 방식에 비하여 EER (Equal Error Rate)을 감소시킴을 확인할 수 있었다.

휴대폰 환경에서의 근적외선 얼굴 및 홍채 다중 인식 연구 (A Study on Multi-modal Near-IR Face and Iris Recognition on Mobile Phones)

  • 박강령;한송이;강병준;박소영
    • 전자공학회논문지CI
    • /
    • 제45권2호
    • /
    • pp.1-9
    • /
    • 2008
  • 휴대폰에서 보안 필요성이 증가함에 따라 개인 인증을 위하여 홍채, 지문, 얼굴과 같은 단일 생체 정보를 이용한 많은 연구들이 진행되었으나 단일 생체 인식에서는 인식 정확도에 한계가 있었다. 따라서 본 논문에서는 휴대폰 환경에서 고 인식율을 위해 얼굴과 홍채를 결합하는 방법에 대해 제안한다. 본 논문에서는 근적외선 조명과 근적외선 통과 필터를 부착한 휴대폰의 메가 픽셀 카메라를 사용하여 근적외선 얼굴 및 홍채 영상을 동시에 취득한 후, SVM(Support Vector Machine)을 기반으로 스코어 레벨에서 결합하였다. 또한, 저 연산의 로가리듬(Logarithm) 알고리즘을 사용한 얼굴 데이터의 조명 변화에 대한 정규화와 극 좌표계 변환 및 홍채 코드의 비트 이동 매칭에 의한 홍채 영역의 이동, 회전, 확대 및 축소에 대한 정규화를 통해 SVM의 분류 복잡도와 얼굴, 홍채 데이터의 본인 변화도를 최소화함으로써 인식 정확도를 향상시켰으며, 저 연산의 휴대폰 환경에서 정수혈 기반의 얼굴 및 홍채 인식 알고리즘을 사용하여 처리시간을 향상시켰다. 실험 결과, SVM을 사용한 인식의 정확성이 단일 생체(얼굴 또는 홍채), SUM, MAX, MIN 그리고 Weighted SUM을 사용하는 것보다 우수한 것을 알 수 있었다.

유전자 발현 메트릭에 기반한 모수적 방식의 유의 유전자 집합 검출 비교 연구 (A Comparative Study of Parametric Methods for Significant Gene Set Identification Depending on Various Expression Metrics)

  • 김재영;신미영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 최근 마이크로어레이 데이터를 기반으로 두 개의 샘플 그룹간에 유의한 발현 차이를 나타내는 생물학적 기능 그룹을 검출하기 위한 유전자 집합 분석(gene set analysis) 연구가 많은 주목을 받고 있다. 기존의 유의 유전자 검출 연구와는 달리, 유전자 집합 분석 연구는 유의한 유전자 집합과 이들의 기능적 특징을 함께 검출할 수 있다는 장점이 있다. 이러한 이유로 최근에는 PAGE, GSEA 등과 같은 다양한 통계적 방식의 유전자 집합 분석 방법들이 소개되고 있다. 특히, PAGE의 경우 두 샘플 그룹간의 유전자 발현 차이를 나타내는 스코어의 분포가 정규 분포임을 가정하는 모수적 접근 방식을 취하고 있다. 이러한 방법은 GSEA 등과 같은 비모수적 방식에 비해 계산량이 적고 성능이 비교적 우수한 장점이 있다. 하지만, PAGE에서 유전자 발현 차이를 정량화하기 위한 메트릭으로 사용하고 있는 AD(average difference)의 경우, 두 그룹간에 절대적 평균 발현 차이만을 고려하기 때문에 실제 유전자의 발현값 크기나 분산의 크기에 따른 상대적 중요성을 반영하지 못하는 문제가 있다. 본 논문에서는 이를 보완하기 위해 실제 유전자의 발현값 크기나 그룹 내 샘플들의 분산 정보 등을 스코어 계산에 함께 반영하는 WAD(weighted average difference), FC(Fisher's criterion), 그리고 Abs_SNR(Absolute value of signal-to-noise ratio)을 모수적 방식의 유전자 집합 분석에 적용하고 이에 따른 유의 유전자 집합 검출 결과를 실험을 통해 비교 분석하였다.

중·북부지역에서 재배된 GM 배추와 Non-GM 배추간의 식물체 특성 및 영양 성분 비교 분석 (Comparison of the Plant Characteristics and Nutritional Components between GM and Non-GM Chinese Cabbages Grown in the Central and Northern Parts of Korea)

  • 조동욱;오진표;박권우;이동진;정규환
    • 원예과학기술지
    • /
    • 제28권5호
    • /
    • pp.836-844
    • /
    • 2010
  • 본 연구는 GM 배추와 non-GM 배추 계통간의 식물체 생장 특성, 지방산의 조성 및 무기 영양 성분을 분석하여 GM 작물의 평가를 위한 기초 자료로 이용하고자 실시하였다. GM 배추(SKCP)와 모본(SC) 계통을 중부지역과 북부지역에서 2008년 가을과 2009년 봄과 가을에 밀식 및 일반 배치시험구로 나누어 40일간 재배하고 수확 후 특성을 조사하여 SKCP 계통과 SC 계통간의 차이점 및 재배 지역간의 차이를 분석하였다. 밀식 배치 시험구에서 재배된 배추 식물체의 최외각 엽의 특성 9개 항목에 대하여 조사한 결과, 두 지역에서 재배된 SKCP 계통과 SC 계통간에 통계적 유의차는 두 항목(잎의 모양과 모용수)을 제외하곤 크게 나타나지 않았다. 식물체의 지상부의 특성 6개 항목과 지하부의 특성 3개 항목을 조사한 결과, 두 지역 모두에서 SKCP 계통과 SC 계통간의 통계적 유의차는 거의 나타나지 않았다. 다만, 중륵의 길이가 두 지역에서 계통간 약간의 유의차를 보였으며, 재배 지역간에도 통계적 유의차가 발생하였다. 중부와 북부지역의 일반 배치 시험구의 경우 최외각 잎의 특성을 조사한 결과, 9개의 조사 항목 중 4개의 조사 항목에서 SKCP 계통과 SC 계통간의 통계적 유의차를 보였다. 특히 잎의 길이에서는 계통간, 재배 지역간 그리고 재배 시기별로 변이가 나타나는 것으로 조사되었다. 또한 식물체의 지상부 특성 9개의 조사 항목 중 5개의 항목에서 통계적 유의차가 발생하였으며, 생체중 무게와 중륵의 길이와 넓이에서는 계통간, 지역간 그리고 시기별로 유의차가 크게 나타났다. 2009년도 가을에 중부와 북부 지역의 일반 배치 시험구에서 재배된 배추 식물체의 잎에 존재하는 주된 지방산은 palmitic acid, oleic acid, stearic acid, linoleic acid 및 linolenic acid인 것으로 조사되었다. 5 가지 지방산의 총 함량은 재배 지역 및 식물 계통간에 통계적 유의 차가 없었으나 linolenic acid를 제외한 4가지 지방산은 중부와 북부 지역에서 SKCP 비해 SC 계통이 건중량 1g당 함량이 다소 높은 것으로 조사되었다. 배추 식물체의 잎에 존재하는 무기영양성분의 함량을 조사한 결과, 다량 원소는 질소(N), 인(P), 칼슘(Ca), 칼륨(K), 마그네슘(Mg) 및 나트륨(Na)의 6가지이었고 미량원소는 구리(Cu), 철(Fe), 망간(Mn) 및 아연(Zn)의 4가지로 조사되었다. 무기영양 물질의 대사체 분석 데이터를 표준화 작업하여 스코어를 통해 시각화하여 본 결과, GM 및 non-GM 계통간에 특이적 변이에 따른 클러스터 형성은 확인할 수 없었으나, 지역간 차이에 따른 클러스터 형성은 확인할 수 있었다.