• Title/Summary/Keyword: 가우시안 가중치

검색결과 88건 처리시간 0.025초

AWGN 환경에서 가우시안 분포와 표준편차를 이용한 잡음 제거 (Noise Removal using Gaussian Distribution and Standard Deviation in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.675-681
    • /
    • 2019
  • 잡음 제거는 영상 처리의 선행 과정에서 필수적으로 이루어지며, 잡음의 종류와 영상의 환경에 따라 다양한 기법들이 연구되고 있다. 그러나 기존 AWGN(additive white gaussian noise) 제거 기법들은 고주파 성분이 많은 영상에 대해 블러링 현상을 일으키며 다소 부족한 성능을 보인다. 따라서 본 논문에서는 영상의 AWGN 제거 과정에서 블러링 현상을 최소화하기 위한 알고리즘을 제안하였다. 제안한 알고리즘은 마스크 내부 화소 특성에 따라 고주파 성분필터와 저주파 성분 필터를 설정하며, 기준치에 입력 영상을 가감하여 각 필터의 출력을 계산한다. 최종 출력은 두 필터의 출력에 표준편차와 가우시안 분포를 통해 계산된 가중치를 적용한 것을 합산하여 구한다. 제안한 알고리즘은 기존 방법에 비해 AWGN 제거 성능이 우수하였으며, 시뮬레이션을 통해 이를 확인하였다.

가무시안 혼합모델에서 점진적 강인적응을 통한 화자확인 성능개선 (Performance Enhancement for Speaker Verification Using Incremental Robust Adaptation in GMM)

  • 김은영;서창우;임영환;전성채
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.268-272
    • /
    • 2009
  • 본 논문에서는 화자확인을 위해서 가우시안혼합모델에 forgetting factor를 갖는 점진적 강인적응 방법을 제안하였다. 화자인식 시스템에서 적은 양의 데이터로 좋은 성능을 얻기 위하여 화자모델 적응방법이 사용되고 있다. 그러나, 현재 사용되고 있는 적응방법은 불규칙한 발성변화와 잡음 같은 이씨에 취약하고, 그것은 부정확한 화자모델을 만들 수 있다. 또한 시간이 지날수록 모델에 새로운 데이터가 적응되는 비율이 줄어들게 되는 문제점이 있다. 제안된 알고리즘은 가우시안혼합모델을 이용한 화자모델에서 이상치에 의한 왜곡과 새로운 데이터에 대한 적응 비율을 일정이상으로 유지할 수 있도록 하기 위하여 점진적 강인적응 방법을 제안하였다. 점진적 강인적응은 화자인식에서 적은 양의 데이터로 등록하고 테스트된 새로운 데이터로 모델을 적응시키는 방법이다. 실험결과는 7개월에 걸쳐서 수집된 데이터로부터 제안된 방법이 이상치에 강인하고 새로운 데이터의 적응 비율을 일정하게 유지시킴을 보였다.

연속 음성 인식 시스템을 위한 향상된 결정 트리 기반 상태 공유 (Improved Decision Tree-Based State Tying In Continuous Speech Recognition System)

  • 김동화;;;김형순;김영호
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.49-56
    • /
    • 1999
  • 결정 트리 기반 상태 공유 방법은 HMM을 사용하는 많은 연속 음성 인식 시스템에서 강인하고 정확한 문맥 종속 음향 모델링 뿐만 아니라 훈련 중에는 나타나지 않은 모델들의 합성을 위하여 널리 사용되고 있다. 음성 결정 트리를 구성하기 위한 표준적인 방법은 단일 가우시안 트라이폰 모델을 이용한 1계층 프루닝 만을 사용하고 있다. 본 논문에서는 더욱 정교한 음향 모델링을 통하여 인식 성능 향상을 도모하기 위하여 새로운 2가지 접근 방법 즉, 2계층 결정 트리와 복수 혼합 결정 트리를 제안한다. 2계층 결정 트리는 상태 공유와 혼합 가중치 공유를 위하여 2계층 프루닝을 수행하며, 두 번째 계층을 사용하여 공유 상태들도 음성 문맥의 유사도에 따라서 서로 다른 가중치들을 사용할 수 있다. 두 번째 제안된 방법 에서는 훈련 과정 즉, 혼합 분할 및 재추정 과정과 함께 음성 결정 트리가 계속 갱신되어 진다. 복수 혼합 결정 트리를 구성하기 위하여 단일 가우시안 뿐만 아니라 복수 혼합 가우시안 모델이 함께 사용된다. 제안된 방법들을 이용하여 BN-96과 WSJ5k 데이터를 사용한 연속 음성 인식 실험을 수행한 결과, 표준 결정 트리를 사용한 시스템과 비교하여 공유 상태의 개수를 비슷하게 유지하면서 단어 오인식률을 줄일 수 있었다.

  • PDF

적응적 가중치를 이용한 노이즈에 강인한 초점값 연산자 (Noise Insensitive Focusing Index using Adaptive Weights)

  • 최종성;강희;강문기
    • 대한전자공학회논문지SP
    • /
    • 제47권4호
    • /
    • pp.90-96
    • /
    • 2010
  • 초점 검출 시스템은 영상 획득 과정에서 영상의 화질을 결정하는 중요한 요소이다. 초점 검출은 크게 영상의 고주파 성분을 평가하여 수치화하는 초점값 연산 부분과 이 초점값을 이용하여 렌즈를 이동시켜 초점을 일치시키는 부분으로 이루어진다. 초점값을 연산하는데 있어 저조도 잡음이 첨가된 환경에서는 잡음에 의해 그 성능이 크게 저하되게 된다. 본 논문에서는 공간 적응적인 가중치를 이용하여 저조도 잡음이 첨가된 환경에서 효율적으로 초점값을 연산할 수 있도록 하는 방법을 제안하였다. 제안된 방법은 영상의 각 픽셀에서 영상의 국부 특성과 잡음의 특성을 적응적 가중치를 연산하고, 이를 이용해 저조도 잡음에 강인한 초점값 연산자를 제안한다. 제안된 적응적 가중치는 기존의 필터 기반 초점값 연산자에도 적용이 가능한 특성을 갖는다. 잡음이 없는 상태와 가우시안 잡음이 있는 환경 하에서 제안된 연산자의 성능을 검증하였다.

표면 곡률을 이용하여 깊이 가중치 Hausdorff 거리를 적용한 3차원 얼굴 영상 인식 (Surface Curvature Based 3D Pace Image Recognition Using Depth Weighted Hausdorff Distance)

  • 이영학;심재창
    • 한국멀티미디어학회논문지
    • /
    • 제8권1호
    • /
    • pp.34-45
    • /
    • 2005
  • 본 논문은 3차원 얼굴 영상으로부터 추출된 표면 곡률에 대 하여, 깊이 값을 가중치로 하는 Hausdorff 거리를 이용한 얼굴 인식 알고리즘을 제안한다. Hausdorff 거리 방법은 두 개의 점 집합에 대한 일치성을 측정하는 방법이다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대한 정규화를 실시한다. 3차원 얼굴 영상으로부터 표면 특성의 정보인 주 곡률, 평균 곡률 그리고 가우시안 곡률 값을 추출한다. 입력 영상과 데이터베이스 영상과의 유사도 비교를 위해 두 영상에 대하여 문턱치 값에 의한 이진 영상을 추출하여 각 점에 대한 깊이 값을 가중치로 하는 깊이 가중치 Hausdoff 거리(DWHD)를 이용하여 비교하였다. 제안된 방법으로 수행한 결과, 인식률은 픽셀의 분포가 가장 적은 주 곡률의 최소 곡률이 98%로 가장 높게 나타났다.

  • PDF

AAM을 이용한 얼굴 주름 검출에 관한 연구 (A Study on Facial Wrinkle Detection using Active Appearance Models)

  • 이상범;김태묵
    • 디지털융복합연구
    • /
    • 제12권7호
    • /
    • pp.239-245
    • /
    • 2014
  • 본 논문에서는 얼굴의 전체적인 특징(윤곽선, 얼굴크기, 눈, 코) 분석에 기반을 둔 가중치 주름 검출 방법을 제안한다. 첫째 입력된 영상에서 능동적 외향 방법을 이용하여 얼굴의 전체적인 주요 성분을 검출하게 되는데, 크게 형태 기반과 외향 방법으로 구성되어 있다. 이것은 얼굴 모델을 학습하고, 학습된 모델을 기반으로 새로운 영상에서 얼굴을 정합할 때 사용된다. 두 번째로는 영상에서 얼굴과 배경을 분리하고, 얼굴에서 주름 확률이 가장 큰 곳 네 곳을 선정하여 주름 가중치를 높게 부과하다. 마지막으로 가중치를 부여한 관심 영역에 대해서 캐니에지 알고리즘을 적용하여 주름을 검출하게 된다. 제안한 알고리즘은 다양한 종류의 영상을 사용하여 실험 하였으며, 실험결과 대부분의 영상에서 높은 성능의 얼굴 및 주름 검출 결과를 보였다.

MCE기반의 다중 특징 파라미터 스코어의 결합을 통한 화자인식 성능 향상 (Performance Improvement of Speaker Recognition by MCE-based Score Combination of Multiple Feature Parameters)

  • 강지훈;김보람;김규영;이상훈
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.679-686
    • /
    • 2020
  • 본 논문에서는 화자인식 성능 향상을 위해 음원에서 개선된 특징추출 방식과 최소 분류 오차 기반의 다중 특징 벡터 스코어에 대한 가중치 추정을 사용하여 스코어 결합을 제안하였다. 제안한 특징 벡터는 Glottal Flow에서 무의미한 정보구간인 평탄한 스펙트럼 구간을 제거하기 위하여 저역통과 필터를 수행한 신호에서 인지적 선형 예측 캡스트럼 계수, 왜도, 첨도를 추출하여 구성하였다. 제안한 특징 벡터는 종래의 음원에서 멜-주파수 캡스트럼 계수, 인지적 선형 예측 캡스트럼 계수를 추출하여 가우시안 혼합 모델로 모델링한 화자인식 시스템을 개선하기 위해 사용된다. 또한, 스코어 추정과정의 신뢰성을 높이기 위하여 기존의 스코어의 확률 분포를 사용하여 가중치를 추정하는 대신 제안한 특징 벡터에서 평가된 점수와 종래의 특징 벡터에서 평가된 점수에 대하여 최소 분류 오차 기법으로 가중치를 추정하여 스코어를 결합함으로써 최적의 화자를 찾는다. 실험 결과 제안한 특징 벡터가 화자를 인식하는데 유효한 정보를 포함하고 있는 것을 확인하였다. 또한, 최소 분류 오차 기반의 다중 특징 파라미터 스코어를 결합하여 화자인식을 수행하였을 때, 종래의 화자인식 성능보다 더 우수한 성능을 나타내는 것을 확인할 수 있으며, 특히 가우시안 혼합 모델이 낮을 때 더 높은 성능향상을 보였다.

TYPE-2 퍼지 추론 구동형 RBF 신경 회로망 설계 및 최적화 (Design of Radial Basis Function Neural Network Driven to TYPE-2 Fuzzy Inference and Its Optimization)

  • 백진열;김웅기;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.247-248
    • /
    • 2008
  • 본 논문에서는 TYPE-2 퍼지 추론 기반의 RBF 뉴럴 네트워크(TYPE-2 Radial Basis Function Neural Network, T2RBFNN)를 설계하고 PSO(Particle Swarm Optimization) 알고리즘을 이용하여 모델의 파라미터를 동정한다. 제안된 모델의 은닉층은 TYPE-2 가우시안 활성 함수로 구성되며, 출력층은 Interval set 형태의 연결가중치를 갖는다. 여기에서 규칙 전반부 활성함수의 중심 선택은 C-means 클러스터링 알고리즘을 이용하고, 규칙 후반부 Interval set 형태의 연결가중치 결정에는 경사 하강법(Gradient descent method)을 이용한 오류 역전파 알고리즘을 사용하여 학습한다. 또한, 최적의 모델을 설계하기 위한 학습율 및 활성함수의 활성화 영역 결정에는 입자 군집 최적화(PSO; Particle Swarm Optimization) 알고리즘으로 동조한다. 마지막으로, 제안된 모델의 평가를 위하여 모의 데이터 집합(Synthetic dadaset)을 적용하고 근사화 및 일반화 능력에 대하여 토의한다.

  • PDF

상호정보 에너지와 델타함수 기반의 알고리즘에서 크기 조절된 입력의 전력변화에 대한 연구 (A Study on Power Variations of Magnitude Controlled Input of Algorithms based on Cross-Information Potential and Delta Functions)

  • 김남용
    • 인터넷정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.1-6
    • /
    • 2017
  • 이 논문에서는 충격성 잡음환경에서 탁월한 성능을 보이는 CIPD 알고리즘에 대해, 오차에 대한 가우시안 커널로 입력이 보정된 MCI의 전력 추이를 가중치 갱신 방정식에 반영한 새로운 방식을 제안하였다. 제안한 알고리즘이 기존의 CIPD 알고리즘보다 우수한 성능을 가지는지 평가하기 위해, 각 알고리즘의 가중치 벡터 변화량이 얼마나 충격성 잡음에 강인한가를 충격성 잡음하에서 비교하였으며, 실험 결과에서 2배 이상의 정상상태 안정성 향상, 약 1.8배 빠른 수렴속도와 약 2dB 정도 더 낮은 최소 MSE 값을 나타냈다.

임펄스 및 가우시안 잡음영상에서 잡음제거에 관한 연구 (A Study on Denoising for Impulse and Gaussian Noise Images in Digital Images)

  • ;황용연;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.779-781
    • /
    • 2013
  • 다양한 멀티미디어 서비스에 대한 요구가 증가됨에 따라, 영상을 정보전달의 수단으로 사용하기 위한 기술들이 급격히 발전하고 있다. 영상에 첨가되는 여러 가지 잡음을 제거하기 위해, 평균 필터, 메디안 필터, 가중치 필터 방법 등이 제안되었으나 기존의 방법들은 잡음제거 및 에지 보존 성능이 미흡하다. 따라서 본 논문에서는 영상에 첨가되는 복합잡음을 효과적으로 제거하기 위해 먼저 잡음을 판단한 후, 변형된 메디안 필터와 적응 가중치 평균 필터를 이용하여 처리하는 알고리즘을 제안하였다. 그리고 시뮬레이션을 통해 기존의 방법들과 비교하였으며 판단의 기준으로 PSNR(peak signal to noise ratio)을 사용하였다.

  • PDF