• Title/Summary/Keyword: 인식실험

Search Result 6,462, Processing Time 0.028 seconds

The Analysis of Face Recognition Rate according to Distance and Interpolation using PCA in Surveillance System (감시카메라 시스템에서 PCA에 의한 보간법과 거리별 얼굴인식률 분석)

  • Moon, Hae-Min;Kwak, Keun-Chang;Pan, Sung-Bum
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.21 no.6
    • /
    • pp.153-160
    • /
    • 2011
  • Recently, the use of security surveillance system including CCTV is increasing due to the increase of terrors and crimes. At the same time, interest of face recognition at a distance using surveillance cameras has been increasing. Accordingly, we analyzed the performance of face recognition according to distance using PCA-based face recognition and interpolation. In this paper, we used Nearest, Bilinear, Bicubic, Lanczos3 interpolations to interpolate face image. As a result, we confirmed that existing interpolation have an few effect on performance of PCA-based face recognition and performance of PCA-based face recognition is improved by including face image according to distance in traning data.

FUSION BASED RECOGNITION METHOD FOR HANDWRITTEN NUMERALS ON BANK SHEETS (은행 수납장표 자동인식을 위한 융합기반 필기 숫자 인식방법)

  • 전효세;소영성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.449-451
    • /
    • 1999
  • 지금까지 많은 필기 숫자 인식 방법들이 제안되었지만 고도의 신뢰도가 요구되는 은행 수납 장표상의 숫자 인식에 적합한 방법은 아직 발표된 것이 미미한 실정이다. 본 연구에서는 세 개의 분류기의 결과를 융합하여 100%에 가까운 신뢰도를 낼 수 있는 필기숫자 인식 시스템을 제안하였다. Karhunen-Loeve Transform(KLT)를 통하여 특징을 추출하였으며 오류 역전파 신경망(BP), LVQ를 적용한 SOFM(SOFM-LVQ)과 Weignted Several Nearest Neighbor(WSNN)을 분류기로 사용하였다. 융합을 위해서는 다수결(Majority Voting)이 아닌 만장일치제(Unanimous Voting)을 적용하여 신뢰도를 높혔다. ETL-6 DB를 사용하여 실험하였으며 실험 결과 99.95%의 높은 신뢰도를 기록하였다.

  • PDF

A Study on the Rtension of HMM Parameters for Speech Recognition (음성인식을 위한 HMM의 파라메터 확장에 관한 연구)

  • 박창호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.152-156
    • /
    • 1994
  • 본 논문에서는 연속출력 확률분포 HMM 모델의 단점을 보완하기 위해 1) 지속시간 확률분포를 갖는 HMM, 2) 동적특징 파라메터를 부여한 HMM, 3) 혼합연속출력 확률분포 HMM을 구성하여 한국어 단음절에 대한 인식실험을 하였다. 실험결과 화자 종속에서는 연속출력 확률분포 HMM 보다 지속시간 확률분포를 갖는 HMM의 경우 0.70%, 동적특징 파라메터를 부여한 HMM의 경우 1.06%, 혼합연속출력 확률분포 HMM의 경우 1.64%의 인식류리 향상되었다. 화자 독립에서는 연속출력 확률분포 HMM보다 동적특징 파라메터를 부여한 HMM의 경우 1.4%, 혼합연속 출력 확률분포 HMM의 경우 2.36%, 지속시간 확률분포를 갖는 HMM의 경우 2.78%의 인식률이 향상되었다.

  • PDF

The bootstrap VQ model for automatic speaker recognition system (VQ 방식의 화자인식 시스템 성능 향상을 위한 부쓰트랩 방식 적용)

  • Kyung YounJeong;Lee Jin-Ick;Lee Hwang-Soo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.39-42
    • /
    • 2000
  • A bootstrap and aggregating (bagging) vector quantization (VQ) classifier is proposed for speaker recognition. This method obtains multiple training data sets by resampling the original training data set, and then integrates the corresponding multiple classifiers into a single classifier. Experiments involving a closed set, text-independent and speaker identification system are carried out using the TIMIT database. The proposed bagging VQ classifier shows considerably improved performance over the conventional VQ classifier.

  • PDF

Implementation of Digital Map Information Retrieval System Using Speech Recognition (음성을 이용한 수치지도정보 검색시스템의 구현)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.55-58
    • /
    • 1998
  • 본 논문에서는 음성인식기능을 이용하여 지리정보 검색시스템을 구현하고 그 성능 평가 결과에 관하여 보고한다. 성능평가실험을 위하여 사용한 수치지도 자료는 1:5,000의 대구광역시 수성구의 국가 기본도를 사용하였으며, 이 수치지도에서 속성단어와 제어단어를 포함한 68단어를 음성인식과 지도정보 검색의 대상으로 한다. 또한, 음성인식 결과와 지도자료와의 인터페이스는 OLE Automation 프로그래밍 기법을 이용하였으며, Pentium 150MHz, 64MB 메모리를 가진 개인용 컴퓨터 환경하에서 개발하였다. 성능평가 실험결과 남성 3인이 지도검색용 68단어를 실제 사무실 환경하에서 마이크를 통하여 on-line 테스트하여 평균 98.02%의 인식률을 얻었다. 이사의 결과로부터 음성인식기능을 이용한 수치지도 정보검색 시스템의 실용화 가능성을 확인할 수 있었다.

  • PDF

Fusing texture and depth edge information for face recognition (조명에 강인한 얼굴인식을 위한 텍스쳐 정보와 깊이 에지 기반의 퓨전 벡터 생성기법)

  • Ahn Byung-Woo;Sung Won-Je;Yi June-Ho
    • Proceedings of the Korea Institutes of Information Security and Cryptology Conference
    • /
    • 2006.06a
    • /
    • pp.246-250
    • /
    • 2006
  • 얼굴의 중요한 특징부분을 잘 나타내는 깊이 에지 정보를 사용하면 표정과 조명변화로 인한 얼굴 픽셀의 밝기 값 변화에 대해 강인한 특징벡터를 생성할 수 있다. 본 논문에서는 깊이 에지(depth edge)를 이용한 새로운 특징벡터를 제안하고 그 유용성에 대하여 실험하였다. 새롭게 제안한 특징벡터는 얼굴의 깊이 에지 영상을 수평과 수직 방향으로 투영하여 얻어지는 에지 강도 히스토그램을 이용하기 때문에 얼굴의 움직임으로 인한 변형에 영향을 받지 않는다. 또한, 실시간 검출과 인식이 매우 용이하다. 제안한 깊이 에지 기반 특징벡터와 백색광 영상의 픽셀 값 기반 특징벡터에 대해 부공간 투영기반의 얼굴인식 알고리즘을 적용하여 성능을 비교 평가하였다. 실험 결과, 얼굴의 깊이 에지에 기반한 얼굴인식이 기존의 백색광만을 이용한 방법에 비해 높은 인식성능을 보였다

  • PDF

Real-time Human Activity Recognition Using Multiple Of Gaussian based Background Model with Hierarchical Index Structure (계층적 색인 구조를 갖는 다중 가우시안 기반의 배경 모델을 이용한 실시간 인간 행동 인식 연구)

  • Choi, Jin;Han, Tae-Woo;Cho, Yong-Il;Yang, Hyun-S.
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.750-754
    • /
    • 2007
  • 본 논문은 실내의 로비나 복도에 설치된 방범 카메라로부터 얻어진 일련의 영상으로부터 '걷기', '뛰기', '앉기', '일어서기', '넘어짐'의 비교적 짧은 시간에 일어나는 인간 행동들을 실시간으로 인식하는 시스템의 구현에 관해 다룬다. 먼저 입력으로 받은 영상을 계층적 색인 구조를 갖는 다중 가우시안 기반의 배경 모델을 이용하여 윤곽을 추출하고 객체를 인식하여 시간차에 의한 가중치로 누적하여 시간 템플릿을 만든다. 만들어진 시간 템플릿으로부터 특징을 추출하여 신경망 모델에 적용하여 5가지 인간행동을 구분한다. 구현된 시스템으로 인간행동 인식 실험을 수행하였는데, 실험 참가자들의 행동 방식이 약간씩 달랐음에도 불구하고 높은 인식률을 보여주었다.

  • PDF

Speech Recognition in Time-varying Noisy Environments using the Histogram Technique (히스토그램 처리방법을 이용한 시변 잡음환경에서의 음성인식)

  • 권영욱;김형순
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.3
    • /
    • pp.47-51
    • /
    • 1998
  • 잡음 환경에서의 음성인식을 위해서는 일반적으로 전처리 과정에서 잡음의 스펙트 럼을 잘 추정할 필요가 있다. 본 논문에서는 시변잡음 환경에서 히스토그램 처리방법에 의 해 잡음의 스펙트럼을 추정하고 이를 제거하는 방법으로 스펙트럼 차감법을 사용하였다. 히 스토그램 처리방법은 음성/비음성 구간의 구분을 할 필요가 없으며 서서히 변화하는 잡음의 스펙트럼도 추정할 수 있다는 점에서 기존 방식에 비해 장점을 지닌다. 다양한 SNR 조건하 에서 시간에 따라 에너지, 그리고 주파수가 변화하는 유색 가우시안 잡음을 부가시킨 음성 에 대해, 화자독립 고립단어 인식실험을 수행하였다. 실험결과, 히스토그램 처리방법에 기반 을 둔 스펙트럼 차감법을 적용할 경우가 기존의 잡음 스펙트럼 추정방법에 비해 인식성능이 우수하였다.

  • PDF

Face Detection and Recognition in MPEG Compressed Video (MPEG 압축 비디오 상에서의 얼굴 영역 추출 및 인식)

  • 여창욱;황본우;이성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.452-454
    • /
    • 1998
  • 본 논문에서는 MPEG 압축 비디오 상에서 얼굴 영역을 추출하고 이를 인식하는 방법에 대하여 제안한다. 제안된 방법은 크게 MPEG 압축 비디오의 처리를 위한 축소된 DC 영상의 구성 단계, 축소된 DC 영상에서의 얼굴 영역 추출 단계, 그리고 얼굴 영역이 추출된 프레임에 대한 압축 복원 및 얼굴 인식의 3단계로 구성되어있다. DC 영상의 구성 단계에서는 압축 복원 없이 DCT 계수의 DC 값과 2개의 AC 값만을 사용하여 부분적인 2차원 역 DCT 변환을 이용한 방법을 사용하였으며, 얼굴 영역 추출 단계에서는 DC 영상에 대해 얼굴의 색상 및 형태 정보를 이용한 얼굴 후보 영역 추출 방법과 K-L 변환 및 역 변환의 오차에 의한 얼굴 영역 추출 방법을 사용하였다. 얼굴 인식 단계에서는 얼굴 영역이 추출된 프레임에 대하여 GOP 단위의 압축 복원을 수행한 후 고유 얼굴 영상을 이용한 방법으로 얼굴 인식을 수행하였다. 제안된 방법의 성능을 검증하기 위하여 뉴스와 드라마 MPEG 비디오를 대상으로 실험을 수행하였으며, 실험 결과 제안된 방법이 효율적임을 알 수 있었다.

  • PDF

An Overview of Hangul Handwritten Image Database PE92 (한글 필기체 영상 데이터베이스 PE92의 소개)

  • Kim, D.H.;Bang, S.Y.
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.567-575
    • /
    • 1992
  • 한글 문자인식 시스템을 개발하기 앞서 생각해야 할 것이 인식실험에 사용될 문자 데이타를 수집하는 것이다. 이 논문에서는 연구 개발자들에게 문자인식 실험에 필요한 충분한 데이타를 제공하며 필기체 문자 데이타를 표준화하여 문자인식 시스템 상호간의 성능을 객관적으로 평가하기 위하여 한글 필기체 문자 데이터베이스 PE92를 개발하였다. 여기서는 PE92 데이타베이스의 소개로서 먼저 PE92를 수집하는데 있어 고려사항들, 즉 필기자, 수집문자의 수, 수집용지의 규격, 데이타베이스의 저장, 데이타의 압축에 대하여 알아본다. 다음 PE92 데이타베이스의 규격을 알아본다.

  • PDF