• 제목/요약/키워드: 베이시안 융합

검색결과 11건 처리시간 0.022초

베이시안 신뢰도 융합을 이용한 신뢰도 측정 (Bayesian Fusion of Confidence Measures for Confidence Scoring)

  • 김태윤;고한석
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.410-419
    • /
    • 2004
  • 본 논문에서는 베이시안에 기반한 신뢰도 융합 기법을 제안한다. 음성인식에서 신뢰도는 인식 결과에 대한 신뢰의 정도를 말하며, 인식 결과가 맞는 지의 여부를 판단할 수 있다. 개별 신뢰도 기법의 신뢰도 값을 융합하여 최종 판단을 내리는 집중형 융합 방식과 개별 신뢰도 기법의 판단 결과들을 융합하는 분산형 융합의 두 가지 방식에 대해 최적의 베이시안 융합규칙이 제시되었다. 고립단어 인식에서의 미등록어 거절 실험 결과 집중형 베이시안 신뢰도 융합 기법은 개별 신뢰도 기법에 비해 13% 이상의 상대적인 에러 감소 효과를 보였으나, 분산형 베이시안 융합은 성능의 향상을 보이지 못했다.

HMM을 기반으로 한 사전 확률의 문제점을 해결하기 위해 베이시안 기법 어휘 인식 모델에의 사후 확률을 융합한 잡음 제거 (Noise Removal using a Convergence of the posteriori probability of the Bayesian techniques vocabulary recognition model to solve the problems of the prior probability based on HMM)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권8호
    • /
    • pp.295-300
    • /
    • 2015
  • 사전 확률분포를 모델링하는 HMM을 사용하는 어휘 인식에서 인식 어휘의 모델들의 대한 인식 확률이 이산적인 분포를 나타내며 인식을 위한 계산량이 적은 장점이 있지만 인식률을 계산했을 때 상대적으로 낮은 단점이 있다. 이를 개선하기 위하여 베이시안 기법 어휘 인식 모델을 융합한 잡음 제거 인식률 향상을 제안한다. 본 논문은 베이시안 기법 어휘 인식을 위한 모델 구성을 베이시안 기법의 최적화한 인식 모델을 구성하였다. HMM을 기반으로 한 사전 확률 방법과 베이시안 기법인 사후확률을 융합하여 잡음을 제거하고 인식률을 향상시켰다. 본 논문에서 제안한 방법을 적용한 결과 어휘 인식률에서 98.1%의 인식률을 나타내었다.

베이시안 기법과 선택적 음성특징 추출을 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Bayesian method and Selective Speech Feature)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제7권6호
    • /
    • pp.7-11
    • /
    • 2016
  • 일반적인 어휘 인식 시스템은 백색 잡음과 음성을 인식하는 환경에서 여러 음성의 혼재되어 정확한 음성을 인식하지 못하고 있다. 따라서 본 논문은 효율적인 음성 인식을 위해 잡음 음성으로 부터 원하는 음성만 선택적으로 추출하기 위한 방법과 베이시안 기법을 융합 방법을 제안한다. 음성의 선택적 추출을 위해 필터 뱅크 주파수 응답 계수를 사용한다. 하며, 이를 위해 모든 가능한 두 관측치의 조합에 대해 변수 관측치를 사용하며, 음성 신호 정보를 가지고 선택적 음성 특징 추출을 위해 잡음은 출력에 대한 에너지 비율을 구한다. 이것은 음성 특징을 추출하는 방법을 제안하며, 이를 베이시안 기법의 어휘 인식을 융합하여 잡음을 제거하고 인식률을 향상시켰다. 본 논문에서 기존의 HMM과 CHMM 방법과 비교한 결과 잡음 환경에서의 인식률이 2.3% 향상됨을 확인하였다.

모수 추정을 위한 베이시안 기법과 바타차랴 알고리즘을 융합한 어휘 인식 성능 향상 (Vocabulary Recognition Performance Improvement using a convergence of Bayesian Method for Parameter Estimation and Bhattacharyya Algorithm Model)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권10호
    • /
    • pp.353-358
    • /
    • 2015
  • 어휘 인식 시스템은 학습 모델을 구성하여 인식하므로 구성되어진 모델에서 벗어난 어휘의 입력과 유사한 어휘의 입력은 인식하지 못하거나 유사한 어휘로 인식되어 인식률 저하가 나타난다. 이런 경우 인식 모델을 확장할 수 있도록 재구성하거나 인식 모델 구성 시 확장성을 반영하므로 해결할 수 있다. 본 논문에서는 모델 구성 시 확장성을 반영할 수 있는 모수 추정을 위한 베이시안 기법을 사용하여 바타차랴 알고리즘 음성 인식 학습 모델 구성 방법을 융합하여 제안하였다. 음소가 갖는 특징을 기반으로 학습 데이터의 음소에 모수 추정을 위한 베이시안 기법을 이용하였고 유사한 학습 모델은 바타챠랴 알고리즘을 이용하여 정확한 학습 모델로 인식하도록 하였다. 바타챠랴 알고리즘 인식 모델을 구성하여 인식 성능을 평가하였다. 본 논문에서 제안한 시스템을 적용한 결과 어휘 인식률에서 97.5%의 인식률과 1.2초의 학습 시간을 나타내었다.

벡터모델 기반 바타챠랴 거리 측정 기법과 우도 원리 베이시안을 융합한 어휘 인식 모델 (Vocabulary Recognition Model using a convergence of Likelihood Principla Bayesian methode and Bhattacharyya Distance Measurement based on Vector Model)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제13권11호
    • /
    • pp.165-170
    • /
    • 2015
  • 어휘 인식 시스템은 구성되어진 모델에서 벗어난 어휘의 입력과 유사한 어휘의 입력은 인식하지 못하거나 유사한 어휘로 인식되어 인식률 저하가 나타나며, 기존의 시스템은 벡터 값을 모델로 만들어 데이터베이스로 구성하여 어휘 인식에 사용하였다. 어휘 인식을 위한 탐색 중에 형성되는 모델은 데이터베이스로 구성되어 있지 않아 인식할 수 없는 단점이 존재한다. 따라서 본 논문에서는 특징 벡터 모델을 기반으로 바타챠랴 거리 측정법을 이용한 베이시안 인식 모델을 구성하여 탐색 중에 형성되는 벡터 모델을 인식할 수 있도록 유도하였으며, 위너 필터를 적용하여 인식률을 향상시켰다. 2 방법을 융합하여 실험한 결과 향상된 신뢰도로 인해 높은 인식 성능을 확인하였으며, 본 논문에서 제안한 측정법을 이용하여 기존의 방법들에 비하여 평균 98.2%의 성능을 나타내었다.

협동 센서 융합 기반 화자 성별 분류를 위한 무선 센서네트워크 개발 (A Development of Wireless Sensor Networks for Collaborative Sensor Fusion Based Speaker Gender Classification)

  • 권호민
    • 융합신호처리학회논문지
    • /
    • 제12권2호
    • /
    • pp.113-118
    • /
    • 2011
  • 본 논문에서는 무선센서네트워크에서 이루어지는 협동적 센서융합을 이용한 화자성별분류를 제안하였다. 센서노드들은 BER(Band Energy Ratio) 기반 음성활동검출을 수행함으로써 불필요한 입력 데이터는 제거하고 관련성이 높은 데이터만을 처리 및 경판정한다. 개별적 센서노드에서 생성된 경판정 값들은 융합센터로 송신되고 전역적 결정 융합을 구축하기 때문에 전력 소모를 줄이고 네크워크 자원을 절약한다. 화자성별분류를 위한 센서융합기법으로써 베이시안(Bayesian) 센서융합 및 전역적 가중결정융합가법들이 제안되었다. 베이시안 센서융합의 경우, 배치되는 센서노드 수 변화에 따른 ROC(Receiver Operating Characteristic) 커브의 동작점을 통해 개별 센서노드 레벨에서 얻어진 경판정 값들을 처리하고 최적의 분류 융합을 결정한다. 전역적 결정을 위한 가중치로써 BER 및 MCL(Mutual Confidence Level)을 채택하여 개별적 지역 경판정 값들을 효율적으로 결합 및 융합시킨다. 센서 노드의 수가 증가함에 따라 분류화 성능이 개선되어졌으며 특히 낮은 SNH(Signal to Noise Ratio) 환경에서 성능 개선폭이 더 높게 나타남을 실험적으로 확인하였다.

자동 얼굴인식을 위한 얼굴 지역 영역 기반 다중 심층 합성곱 신경망 시스템 (Facial Local Region Based Deep Convolutional Neural Networks for Automated Face Recognition)

  • 김경태;최재영
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.47-55
    • /
    • 2018
  • 본 논문에서는 얼굴인식 성능 향상을 위해 얼굴 지역 영역 영상들로 학습된 다중개의 심층 합성곱 신경망(Deep Convolutional Neural Network)으로부터 추출된 심층 지역 특징들(Deep local features)을 가중치를 부여하여 결합하는 방법을 제안한다. 제안 방법에서는 지역 영역 집합으로 학습된 다중개의 심층 합성곱 신경망으로부터 추출된 심층 지역 특징들과 해당 지역 영역의 중요도를 나타내는 가중치들을 결합한 특징표현인 '가중치 결합 심층 지역 특징'을 형성한다. 일반화 얼굴인식 성능을 극대화하기 위해, 검증 데이터 집합(validation set)을 사용하여 지역 영역에 해당하는 가중치들을 계산하고 가중치 집합(weight set)을 형성한다. 가중치 결합 심층 지역 특징은 조인트 베이시안(Joint Bayesian) 유사도 학습방법과 최근접 이웃 분류기(Nearest Neighbor classifier)에 적용되어 테스트 얼굴영상의 신원(identity)을 분류하는데 활용된다. 제안 방법은 얼굴영상의 자세, 표정, 조명 변화에 강인하고 기존 최신 방법들과 비교하여 얼굴인식 성능을 향상시킬 수 있음이 체계적인 실험을 통해 검증되었다.

퍼지 알고리즘의 융합에 의한 다중분광 영상의 패턴분류 (Pattern Classification of Multi-Spectral Satellite Images based on Fusion of Fuzzy Algorithms)

  • 전영준;김진일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.674-682
    • /
    • 2005
  • 본 논문에서는 다중분광 영상의 분류를 위하여 퍼지 G-K(Gustafson- Kessel) 알고리즘과 PCM 알고리즘을 융합한 분류방법을 제안하였다. 제안된 방법은 학습데이타를 이용하여 퍼지 G-K 알고리즘을 수행한 후 그 결과를 이용하여 PCM 알고리즘을 수행한다 PCM 알고리즘과 퍼지 G-K 알고리즘 분류결과를 비교하여 그 결과가 일치하면 해당 항목으로 분류항목을 결정한다. 일치하지 않는 화소는 PCM 알고리즘의 평균내부거리 안쪽에 있는 화소들을 새로운 학습데이타로 하여 베이시안 최대우도 분류를 수행하여 분류항목을 결정한다. 평균내부거리 안쪽에 있는 화소 데이타는 정규분포형태를 보여준다. 다차원 다중분광 영상인 IKONOS와 LANDSAT TM 위성영상을 이용하여 제안된 알고리즘의 효율성을 검증한 결과 퍼지 G-K 알고리즘과 PCM 알고리즘 그리고 전통적인 분류 방법인 최대우도 분류 알고리즘보다 전체 정확도가 더 높은 결과를 얻을 수 있었다

Bayes 기법에 의한 가우시안 잡음제거 (Denoising the Gaussian Noise by the Bayes Techique)

  • 우창용;박남천;김재환;주창복;신위재;이상훈;김성일
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.217-220
    • /
    • 2005
  • 베이시안 기법의 잡음제거는 사진정보를 모형화하여 베이스 정리에 의해 사후정보를 계산하는 방법이다. 웨이블릿 변환 영역에서 각 대역의 원 신호 히스토그램을 일반화된 라플라시안 분포로 모형화하여 사전정보로 사용가능하다. 잡음 신호의 히스토그램에서 모형을 추정하기 위해서는 잡음편차가 필요하다. 이 논문에서는 단조변환을 이용하여 웨이블릿 변환된 잡음신호 각 대역의 편차를 추정한 후 이 편차에 가중치를 적용하여 모수를 추정한 후 베이스 기법으로 잡음을 제거하였다. 그리고 그 결과를 위너필터에 의해 잡음제거 된 결과와 PSNR로 비교하였다.

  • PDF

비디오 셧의 감정 관련 특징에 대한 통계적 모델링 (Statistical Model for Emotional Video Shot Characterization)

  • 박현재;강행봉
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1200-1208
    • /
    • 2003
  • 비디오 데이터에 존재하는 감정을 처리하는 것은 지능적인 인간과 컴퓨터와의 상호작용을 위해서 매우 중요한 일이다. 이러한 감정을 추출하기 위해서는 비디오로부터 감정에 관련된 특징들을 검출하기 위한 컴퓨팅 모델을 구축하는 것이 바람직하다. 본 논문에서는 비디오 셧에 존재하는 저급 특징들의 확률적인 분포를 이용하여 감정 이벤트 발생에 관련된 통계학적인 모델을 제안한다. 즉, 비디오 셧의 기본적인 특징을 추출하고 그 특징을 통계적으로 모델화 하여 감정을 유발하는 셧을 찾아낸다. 비디오 셧의 특징으로는 칼라, 카메라 모션 및 셧 길이의 변화를 이용한다. 이러한 특징들을 EM(Expectation Maximization) 알고리즘을 이용하여 GMM(Gaussian Mixture Model) 으로 모델링하고, 감정과 시간과의 관계를 MLE(Maximum Likelihood Estimation)를 이용하여 시간에 따른 확률분포 모델로 구성한다. 이런 두 개의 통계적인 모델들을 융합하여 베이시안 분류법을 적용하여 비디오 데이터로부터 감정에 관련된 셧을 찾아낸다.