• 제목/요약/키워드: 인식 변화

검색결과 6,304건 처리시간 0.034초

시간영역 이미지 필터링에 의한 립리딩 성능 향상 (Time domain Filtering of Image for Lip-reading Enhancement)

  • 이지은;김진영;이주헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.45-48
    • /
    • 2001
  • 립리딩은 잡음 환경 하에서 음성 인식 성능을 향상을 위해 영상정보를 이용한 바이모달(bimodal)음성인식으로 연구되었다[1][2]. 그 일환으로 이미 영상정보를 이용한 립리딩은 구현되었다. 그러나 현재까지의 시스템들은 환경의 변화에 강인하지 못하다. 본 논문에서는 이미지 기반 립리딩 방법을 적용하여 입술 영역을 보다 안정적으로 찾아 성능을 향상 시켰다. 그러나 이 방법은 많은 데이터량을 처리해야 하므로 전처리 과정이 필요하다. 전처리로 입력영상을 그레이 레벨로 변환하는 방법과, 입술을 반으로 접는 방법, 그리고 주성분 분석(PCA: Principal Component Analysis)을 사용하였다. 또한 인식성능 향상을 위해 음성에서 잡음 제거나 분석$\cdot$합성에 효과적인 성능을 보이는 RASTA(Relative Spectral)필터를 적용하여 시간 영역에서의 변화가 적은 성분이나 급변하는 성분, 그 밖의 잡음 등을 제거하였다. 그 결과 $72.7\%$의 높은 인식 성능을 보였다.

  • PDF

대표 평균치 패턴과 가중켑스트럼을 이용한 화자인식의 성능향상에 관한 연구 (A Study ion the performance improvement of speaker recognition using average pattern and weighted cepstrum)

  • 정종순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.179-183
    • /
    • 1995
  • DTW를 사용한 텍스트종속 화자확인의 성능향상에 관한 것으로, 화자인식의 근본적인 난점인 화자 정보 추출의 어려움, 사칭자의 거부, 시간 변화에 따른 인식률 저하 등을 해결하고자 하였다. 먼저 기존의 DTW 방식을 유지하면서 DTW의 단점이라 할 수 있는 과다한 계산량과 발성 습관과 시간 변화에 따른 음성왜곡을 개선하기 위하여 기준 패턴에 통계적 의미를 도입한 대표 평균치 패턴을 사용하였다. 가중 켑스트럼은 화자별로 유용한 켑스트럼 차수를 구하여, 그 차수에 가중치를 두는 것으로 본 실험에서는 F-ratio를 사용하여 구하였다. 실험결과 대표 평균치 패턴과 F-ratio를 사용할 경우 인식률이 각각 약 3~4% 향상되었다.

  • PDF

히스토그램 처리방법을 이용한 시변 잡음환경에서의 음성인식 (Speech Recognition in Time-varying Noisy Environments using the Histogram Technique)

  • 권영욱;김형순
    • 한국음향학회지
    • /
    • 제17권3호
    • /
    • pp.47-51
    • /
    • 1998
  • 잡음 환경에서의 음성인식을 위해서는 일반적으로 전처리 과정에서 잡음의 스펙트 럼을 잘 추정할 필요가 있다. 본 논문에서는 시변잡음 환경에서 히스토그램 처리방법에 의 해 잡음의 스펙트럼을 추정하고 이를 제거하는 방법으로 스펙트럼 차감법을 사용하였다. 히 스토그램 처리방법은 음성/비음성 구간의 구분을 할 필요가 없으며 서서히 변화하는 잡음의 스펙트럼도 추정할 수 있다는 점에서 기존 방식에 비해 장점을 지닌다. 다양한 SNR 조건하 에서 시간에 따라 에너지, 그리고 주파수가 변화하는 유색 가우시안 잡음을 부가시킨 음성 에 대해, 화자독립 고립단어 인식실험을 수행하였다. 실험결과, 히스토그램 처리방법에 기반 을 둔 스펙트럼 차감법을 적용할 경우가 기존의 잡음 스펙트럼 추정방법에 비해 인식성능이 우수하였다.

  • PDF

손의 구조적 정보를 이용한 지문자 영상의 인식 (A Hand-Gesture Recognition Using Structural Information of Hand)

  • 최성현;양윤모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.502-504
    • /
    • 2001
  • 본 논문은 동작자가 표현하는 수화 동작 중, 지문자 영상을 2차원 영상처리에 의하여 이식하는 방법을 제안한다. 손에 개인에 따라 변량이 존재하고 같은 동작을 표현하더라도 항상 일정하지 않기 때문에, 지문자 인식을 위하여 손의 구조적인 정보를 이용한다. 추출된 손 영역을 입력으로 하여 손의 외곽 정보를 이용한 MAT(Medial Axis Transform)를 수행한다. 여기에서 나온 골격의 변화에 따라 각각 손가락에 해당하는 2번 쇽(Shock)과 손 바닥에 해당하는 4번 쇽의 관계에 의하여 지문자를 인식한다. 이러한 구조적인 정보를 이용함으로써 개인에 의해 나타나는 표현의 차이를 제거할 수 있고, MAT를 이용할 때 나타나는 외곽영역의 잡음에 의한 구조 변화에도 안정적으로 대처할 수 있다. 제안한 알고리즘을 이용하여 31개의 단순 지문자에 대한 270개의 입력영상을 실험한 결과 81.1%, 모양이 흡사한 지문자를 통합하여 26개의 지문자로 식별할 경우에는 91.1%의 인식율을 나타내었다.

  • PDF

역전파 학습 신경망을 이용한 고립 단어 인식시스템에 관한 연구

  • 김중태
    • 한국통신학회논문지
    • /
    • 제15권9호
    • /
    • pp.738-744
    • /
    • 1990
  • 본 논문은 음성신호의 실시간 저장법과 기존 표본 데이터에서 개선된 표본 데이터 방법을 제안하여, 신경회로망의 역전파 학습 알고리즘을 이용한 고립 단어 음성인식 시스템에 대하여 연구하였다. 각 층의 노드 수 변화에 의한 기존 표본 데이터방식과 새로운 표본 데이터 방식에서의 인식률과 에러율 변화를 비교하였다. 본 연구 결과, 인식률은 95.1%를 얻었다.

  • PDF

지역 Gabor 필터와 얼굴영역 정보를 이용한 얼굴인식에 관한 연구 (Face Recognition using Local Gabor Filter and Facial Ellipse Information)

  • 엄민영;신대규;김현술;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2598-2600
    • /
    • 2002
  • 본 논문은 다양한 크기와 복잡한 배경을 포함한 질의 얼굴 영상이 들어 왔을 때 질의 영상의 얼굴 타원 정보 내에서의 Corner point들에서의 Gabor 웨이블릿 특성을 이용한 얼굴 인식에 관한 것이다. 기존에 방법은 다른 크기와 배경의 질의 영상이 들어왔을 때에는 배경에서의 Corner Point들에 대한 영향과 영상의 크기가 다름으로 인해 Corner point의 변화와 Gabor 특징벡터의 변화 때문에 인식률이 저하되었다. 이러한 단점을 보완하고자 질의 영상의 얼굴 타원 정보를 추출하여 배경에 의한 영향을 제거하고, 크기를 보정해줌으로써 기존의 우수한 성능을 유지함과 동시에 다양한 크기와 배경을 가진 질의 얼굴 영상을 인식할 수 있도록 한 것이다.

  • PDF

웨이블릿 기반 LDA와 ICA의 선택적 융합에 의한 얼굴인식 (Wavelet Based Face Recognition using Selective LDA and ICA Fusion)

  • 민준오;고현주;전명근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.2065-2068
    • /
    • 2003
  • 본 논문은 복합적인 상황을 고려한 데이터를 이용하여 얼굴인식을 하는 연구로서, 이산 웨이블렛을 기반으로 하는 다 해상도 분석 방법을 사용하고, 각 해상도에서 얻어진 계수를 이용하여 LDA와 ICA기법을 융합하는 방법을 제안한다. 기존의 얼굴인식방법은 정면에서 바라본 임의의 얼굴영상을 이용하므로, 예상하지 못한 얼굴 로션 변화에 대한 고려와 빛의 변화에 대해 고려하지 못했었다. 그러나, 본 연구에서는 다양한 상황을 고려한 데이터를 취득하여 해상도 별로 분리된 대역에 FLD와 ICA를 선택적으로 융합한 알고리즘을 적용하므로서 인식율을 높일 수 있었다

  • PDF

고유전체에 부착된 RFID 태그의 인식률 향상에 관한 연구 (Improving RFID Read Rate associated with the high permittivity environments)

  • 채규수
    • 한국산학기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.1673-1677
    • /
    • 2008
  • 본 논문은 UHF 대역의 RFID(Radio frequency identification) 태그의 인식률에 대한 연구이다. RFID 태그 안테나가 고유전율을 가지는 제품에 부착되는 경우에 태그 안테나의 성능 변화 때문에 인식률 저하 문제가 발생 한다. 본 연구에서는 상용화 된 태그 안테나를 도자기 표면에 부착하였을 때 안테나의 전기적인 특성 변화를 살펴보았고 태그 안테나를 튜닝한 후 태그 인식률이 현저히 개선됨을 보였다.

영상 크기변화에 강인한 실시간 속도표지판 인식 (Real time speed-limit sign recognition invariant to image scale)

  • 황민철;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1358-1360
    • /
    • 2015
  • 본 논문에서는 MB-LBP(Multi-scale Block Local Binary Patterns)와 공간피라미드를 이용하여 생성된 특징을 랜덤 포레스트(Random Forest) 분류기에 적용하여 영상내의 표지판 속도를 인식하는 알고리즘을 제안한다. 입력 영상에서 표지판 영역은 다양한 위치와 크기를 가지며 주위 배경이 후보 영역에 포함되므로 먼저 입력 영상에 원형 Hough Transform을 적용하여 원형의 표지판 후보 영역만을 검출한다. 그 후 영상의 화질을 향상시키기 위해 히스토그램 평활화와 모폴로지 연산을 적용하여 표지판의 숫자 영역과 배경 영역의 대비를 높이도록 한다. 표지판의 크기 변화에 강건한 시스템의 구현을 위해 후보 영역에서 LBP(Local Binary Patterns)보다 우수한 성능을 보이는 MB-LBP를 적용하고, 다양한 크기의 속도 표지판을 인식하기 위해 공간 피라미드를 사용하여 지역적 특징과 전역적 특징 모두를 추출하였다. 추출된 특징은 랜덤 포레스트(Random Forest)를 이용하여 각 9개의 속도 표지판으로 분류, 각 속도별 클래스에 대한 인식 성능을 측정하였다.

감시 카메라 영상의 객체 인식을 위한 회전 변화에 강인한 질감 분류 (Rotation Transformation Invariant Texture Classification for Object Recognition of Surveillance Camera Image)

  • 김원희;박성모;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.171-172
    • /
    • 2009
  • 질감 분류 기술은 패턴인식과 컴퓨터 비전 분야에서 널리 사용되는 기술로서, 최근 들어서는 감시 카메라 시스템에서의 정확한 객체 인식을 위한 회전 변화에 강인한 질감 분류 연구가 진행되고 있다. 본 논문에서는 순환 가보 웨이블렛 필터를 이용한 회전 변환에 강인한 질감 분류 방법을 제안한다. 제안하는 방법은 순환 가보 웨이블렛 필터링된 영상에서 전역 및 지역 특징 벡터를 계산하고 특징 벡터의 차이를 이용한 유사도 측정 판별식으로 질감 분류를 수행한다. Brodatz 질감 앨범을 이용한 실험에서 기존의 방법들보다 2~6% 향상된 질감 분류 비율을 확인할 수 있었다. 제안하는 방법은 질감 기반 객체 인식에 관련된 응용 분야에서 유용하게 사용될 수 있다.