• 제목/요약/키워드: Problem Recognition

검색결과 1,862건 처리시간 0.03초

Half-Against-Half Multi-class SVM Classify Physiological Response-based Emotion Recognition

  • ;고광은;박승민;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제23권3호
    • /
    • pp.262-267
    • /
    • 2013
  • The recognition of human emotional state is one of the most important components for efficient human-human and human- computer interaction. In this paper, four emotions such as fear, disgust, joy, and neutral was a main problem of classifying emotion recognition and an approach of visual-stimuli for eliciting emotion based on physiological signals of skin conductance (SC), skin temperature (SKT), and blood volume pulse (BVP) was used to design the experiment. In order to reach the goal of solving this problem, half-against-half (HAH) multi-class support vector machine (SVM) with Gaussian radial basis function (RBF) kernel was proposed showing the effective techniques to improve the accuracy rate of emotion classification. The experimental results proved that the proposed was an efficient method for solving the emotion recognition problems with the accuracy rate of 90% of neutral, 86.67% of joy, 85% of disgust, and 80% of fear.

위치 변환 패턴 인식을 위한 다항식 고차 뉴럴네트워크 (Polynomial Higher Order Neural Network for Shift-invariant Pattern Recognition)

  • 정종수;홍성찬
    • 한국정보처리학회논문지
    • /
    • 제4권12호
    • /
    • pp.3063-3068
    • /
    • 1997
  • 일반적인 역전파(Back Propagation)의 알고리즘을 다층 다항식 고차 뉴럴네트워크에 적용하여 위치 변환 패턴에 있어 정확한 인식을 할 수 있도록 네트워크의 구조를 개선했다. 본 논문의 목적은 다층 다항식 고차 뉴럴네트워크를 이용하여 여러 가지 패턴 인식이 가능한 이유를 자세히 논한다. 실제 예로는 일정한 문자 인식의 예제로 변형된 영문자 T-C 패턴을 가지고 실험했으며, 네트워크의 일반성(Generalization)을 측정하기 위해서는 거울반사 대칭(Mirror Symmetry)문제를 시뮬레이션 했다. 그 결과 종래의 모델보다 기술적인 우수성을 확인 할 수가 있었다. 본 연구가 제안한 방식에 의한 위치 변환된 T-C 패턴에 대하여서는 90%의 인식율을 얻을 수 있었으며, 일반성의 실험에서 거울반사 대칭(Mirror Symmetry)에 대한 인식율은 70%를 얻었다. 이 실험결과는 종래의 모델에서는 구하기 어려운 인식율이며 기존 연구와 비교한 결과 본 제안 방식의 기술적 우위성을 확연히 판단 할 수 있다.

  • PDF

119구급대원이 경험한 폭력대응에 대한 문제점과 정책대안의 주관적 인식유형 (Type of subjective recognition on the problem and policy alternatives to violence response experienced by emergency medical technicians)

  • 이가연;최은숙
    • 한국응급구조학회지
    • /
    • 제26권1호
    • /
    • pp.37-56
    • /
    • 2022
  • Purpose: This study aimed to identify and present suitable recognition types of policy alternative for before and after response, according to the recognition types of problems in response to violence. Methods: This study investigated 36 EMT's of 17 cities and provinces nationwide. The study was approved by the Kongju National University Institute Review Board (KNU_IRB_2021-17). Data were collected from May 1, 2021 to August 30, 2021 and analyzed by Q factor analysis using the PC-QUNAL program. Results: Recognition types of the problem in 119 EMT's response to violence were described as "I type; lack of professional manpower," "II type; inadequate policy on violence," and "III type; lack of awareness on the emergency field." Recognition types of policy alternative on response to violence by 119 EMT's were described as "Itype; training and public relations oriented," "II type; work environment improvement," "III type; violence handling specialization demand," and "IV type; recovery support seeker." Conclusion: This study provides the foundation required to develop and implement the policies regarding the response to violence; therefore, contributing to EMT's provision.

Pose-normalized 3D Face Modeling for Face Recognition

  • Yu, Sun-Jin;Lee, Sang-Youn
    • 한국통신학회논문지
    • /
    • 제35권12C호
    • /
    • pp.984-994
    • /
    • 2010
  • Pose variation is a critical problem in face recognition. Three-dimensional(3D) face recognition techniques have been proposed, as 3D data contains depth information that may allow problems of pose variation to be handled more effectively than with 2D face recognition methods. This paper proposes a pose-normalized 3D face modeling method that translates and rotates any pose angle to a frontal pose using a plane fitting method by Singular Value Decomposition(SVD). First, we reconstruct 3D face data with stereo vision method. Second, nose peak point is estimated by depth information and then the angle of pose is estimated by a facial plane fitting algorithm using four facial features. Next, using the estimated pose angle, the 3D face is translated and rotated to a frontal pose. To demonstrate the effectiveness of the proposed method, we designed 2D and 3D face recognition experiments. The experimental results show that the performance of the normalized 3D face recognition method is superior to that of an un-normalized 3D face recognition method for overcoming the problems of pose variation.

상태공유 HMM을 이용한 서브워드 단위 기반 립리딩 (Subword-based Lip Reading Using State-tied HMM)

  • 김진영;신도성
    • 음성과학
    • /
    • 제8권3호
    • /
    • pp.123-132
    • /
    • 2001
  • In recent years research on HCI technology has been very active and speech recognition is being used as its typical method. Its recognition, however, is deteriorated with the increase of surrounding noise. To solve this problem, studies concerning the multimodal HCI are being briskly made. This paper describes automated lipreading for bimodal speech recognition on the basis of image- and speech information. It employs audio-visual DB containing 1,074 words from 70 voice and tri-viseme as a recognition unit, and state tied HMM as a recognition model. Performance of automated recognition of 22 to 1,000 words are evaluated to achieve word recognition of 60.5% in terms of 22word recognizer.

  • PDF

An Efficient Binarization Method for Vehicle License Plate Character Recognition

  • Yang, Xue-Ya;Kim, Kyung-Lok;Hwang, Byung-Kon
    • 한국멀티미디어학회논문지
    • /
    • 제11권12호
    • /
    • pp.1649-1657
    • /
    • 2008
  • In this paper, to overcome the failure of binarization for the characters suffered from low contrast and non-uniform illumination in license plate character recognition system, we improved the binarization method by combining local thresholding with global thresholding and edge detection. Firstly, apply the local thresholding method to locate the characters in the license plate image and then get the threshold value for the character based on edge detector. This method solves the problem of local low contrast and non-uniform illumination. Finally, back-propagation Neural Network is selected as a powerful tool to perform the recognition process. The results of the experiments i1lustrate that the proposed binarization method works well and the selected classifier saves the processing time. Besides, the character recognition system performed better recognition accuracy 95.7%, and the recognition speed is controlled within 0.3 seconds.

  • PDF

최대우도를 부가한 주파수 변이 PMC 방법의 잡음 음성 인식 성능개선 (Recognition Performance Improvement for Noisy-speech by Parallel Model Compensation Adaptation Using Frequency-variant added with ML)

  • 최숙남;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제16권8호
    • /
    • pp.905-913
    • /
    • 2013
  • 잡음에 강건한 음성 인식을 위한 주파수 변이를 이용한 PMC( Parallel Model Compensation Using Frequency-variant, FV-PMC) 방법은 인식시 입력음성에 혼입이 예상되는 잡음들을 평균 주파수 변이도를 임계치로 하여 몇 가지 잡음 군으로 분류한 후 각 잡음 군 별로 인식을 수행하는 방법이다. 이 방법은 기준 임계치를 이용하여 양호하게 분류된 잡음 음성들에 대해서는 매우 우수한 성능을 보이나, 미 분류된 잡음 음성들에 대해서는 기존의 PMC 방법에서와 같이 무잡음 모델과 결합하여 음성 인식을 수행함으로 인해 평균 음성 인식률이 낮아지는 문제점이 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 기존의 방법에서 사용하였던 평균주파수 임계치 방법 대신에 최대 우도를 부가하여 미분류를 방지함으로써 입력 잡음음성에 포함되는 잡음의 군별 잡음 분류 율을 높여 인식률을 제고하는 개선된 주파수 변이 PMC 인식방법을 제안하였다. Aurora 2.0 데이터베이스를 이용한 인식실험결과, 기존의 FV-PMC 방법에 비해 향상된 결과를 확인할 수 있었다.

불균형 데이터 처리를 위한 과표본화 기반 앙상블 학습 기법 (Oversampling-Based Ensemble Learning Methods for Imbalanced Data)

  • 김경민;장하영;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권10호
    • /
    • pp.549-554
    • /
    • 2014
  • 필기체 낱글자 인식을 위해서 사용되는 데이터는 일반적으로 다수의 사용자들로부터 수집된 자연언어 문장들을 이용하기 때문에 해당 언어의 언어적 특성에 따라서 낱글자의 종류별 개수 차이가 매우 큰 특징이 있다. 일반적인 기계학습 문제에서 학습데이터의 불균형 문제는 성능을 저하시키는 중요한 요인으로 작용하지만, 필기체 인식에서는 데이터 자체의 높은 분산과 비슷한 모양의 낱글자 등이 성능 저하의 주요인이라 생각하기 때문에 이를 크게 고려하지 않고 있다. 본 논문에서는 이러한 데이터의 불균형 문제를 고려하여 필기체 인식기의 성능을 향상시킬 수 있는 과표본화 기반의 앙상블 학습 기법을 제안한다. 제안한 방법은 데이터의 불균형 문제를 고려하지 않은 방법보다 전체적으로 향상된 성능을 보일 뿐만 아니라 데이터의 개수가 부족한 낱글자들의 분류성능에 있어서도 향상된 결과를 보여준다.

줌 카메라를 통해 획득된 거리별 얼굴 영상을 이용한 원거리 얼굴 인식 기술 (The Long Distance Face Recognition using Multiple Distance Face Images Acquired from a Zoom Camera)

  • 문해민;반성범
    • 정보보호학회논문지
    • /
    • 제24권6호
    • /
    • pp.1139-1145
    • /
    • 2014
  • 지능형 서비스를 제공하는 로봇에서 특정 사람을 인지하거나 구별하는 인식 기술은 매우 중요하다. 기존 단일 거리 얼굴 영상을 학습으로 사용한 얼굴 인식 알고리즘은 원거리로 갈수록 얼굴 인식률이 떨어지는 문제점이 있다. 실제 거리별 얼굴 영상을 이용한 방법은 얼굴 인식률은 향상되지만, 사용자 협조가 요구되는 단점이 있다. 본 논문에서는 줌카메라를 통해 거리별 얼굴 영상을 획득하여 학습으로 사용하는 LDA 기반 원거리 얼굴 인식을 제안한다. 제안하는 방법은 기존 단일거리 얼굴 영상을 학습으로 이용한 방법에 비해 7.8% 향상된 성능을 보였고, 거리별 얼굴 영상을 학습으로 이용한 방법과 비교했을 때 8.0% 저하된 성능을 보였다. 그러나 거리별 얼굴 영상을 취득하기 위해 추가적인 시간과 사용자 협조가 요구되지 않는 장점이 있다.

잡음환경에서 음성인식 성능향상을 위한 바이너리 마스크를 이용한 스펙트럼 향상 방법 (Method for Spectral Enhancement by Binary Mask for Speech Recognition Enhancement Under Noise Environment)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제29권7호
    • /
    • pp.468-474
    • /
    • 2010
  • 음성인식의 실용화에 가장 저해되는 요소는 배경잡음과 채널잡음에 의한 왜곡이다. 일반적으로 배경잡음은 음성인식 시스템의 성능을 저하시키고 이로 인해 사용 장소의 제약을 받게 한다. DSR (Distributed Speech Recognition) 기반의 음성인식 역시 이와 같은 문제로 성능 향상에 어려움을 겪고 있다. 이러한 문제를 해결하기 위해 다양한 잡음제거 알고리듬이 사용되고 있으나 낮은 SNR환경에서 부정확한 잡음추정으로 발생하는 스펙트럼 손상과 잔존 잡음은 음성인식기의 인식환경과 학습 환경의 불일치를 만들게 되어 인식률을 저하시키는 원인이 된다. 본 논문에서는 이와 같은 문제를 해결하기 위해 잡음제거 알고리듬으로 MMSE-STSA 방법을 사용하였고 손상된 스펙트럼을 보상하기 위해 Ideal Binary Mask를 이용하였다. 잡음환경 (SNR 15 ~ 0 dB)에 따른 실험결과 제안된 방법을 사용했을 때 향상된 스펙트럼을 얻을 수 있었고 향상된 인식성능을 확인했다.