• 제목/요약/키워드: Machine Recognition

검색결과 1,070건 처리시간 0.032초

Automatic Gesture Recognition for Human-Machine Interaction: An Overview

  • Nataliia, Konkina
    • International Journal of Computer Science & Network Security
    • /
    • 제22권1호
    • /
    • pp.129-138
    • /
    • 2022
  • With the increasing reliance of computing systems in our everyday life, there is always a constant need to improve the ways users can interact with such systems in a more natural, effective, and convenient way. In the initial computing revolution, the interaction between the humans and machines have been limited. The machines were not necessarily meant to be intelligent. This begged for the need to develop systems that could automatically identify and interpret our actions. Automatic gesture recognition is one of the popular methods users can control systems with their gestures. This includes various kinds of tracking including the whole body, hands, head, face, etc. We also touch upon a different line of work including Brain-Computer Interface (BCI), Electromyography (EMG) as potential additions to the gesture recognition regime. In this work, we present an overview of several applications of automated gesture recognition systems and a brief look at the popular methods employed.

머신비전 자동검사를 위한 대상객체의 인식방향성 개선 (Recognition Direction Improvement of Target Object for Machine Vision based Automatic Inspection)

  • 홍승범;홍승우;이규호
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1384-1390
    • /
    • 2019
  • 본 논문은 머신비전기반 자동검사를 위한 대상객체의 인식방향성 개선 연구로서, 영상카메라에 의한 자동 비전검사의 과정에서 제한성이 따르는 대상 객체의 인식방향성을 개선하는 방법을 제안한다. 이를 통하여 머신비전 자동검사에서 시험대상물의 위치와 방향에 상관없이 검사대상의 영상을 검출할 수 있게 함으로써 별도 검사지그의 필요성을 배제하고 검사과정의 자동화 레벨을 향상시킨다. 본 연구에서는 검사대상으로서 와이어 하네스 제조과정에서 실제 적용할 수 있는 기술과 방법을 개발하여 실제 시스템으로 구현한 결과를 제시한다. 시스템구현 결과는 공인기관의 평가를 통하여, 정밀도, 검출인식도, 재현률 및 위치조정 성공률에서 모두 성공적인 측정결과를 얻었고, 당초 설정하였던 10종류의 컬러구별 능력, 1초 이내 검사시간, 4개 자동모드 설정 등에서도 목표달성을 확인하였다.

MHI의 형태 정보를 이용한 동작 인식 (Gesture Recognition using MHI Shape Information)

  • 김상균
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.1-13
    • /
    • 2011
  • 본 논문에서는 MHI(Motion History Image)의 형태학적 정보를 이용하여 동작을 인식하는 제스처 인식(Gesture Recognition) 시스템을 제안한다. 입력되는 영상으로부터 동작에 관한 정보를 제공하는 MHI를 획득하고, 이 MHI로부터 x, y 각각의 좌표에 대한 기울기(gradient) 영상을 추출한다. 각각의 기울기 영상에 형태 문맥기법(shape context method)을 적용하여 형태 정보를 추출하고, 추출된 형태 정보 값들을 특징 값으로 사용한다. 이렇게 획득한 특징값들을 최종적으로 SVM(Support Vector Machine) 분류기로 학습 및 분류하여 동작을 인식한다. 제안하는 시스템은 MHI의 형태학적인 정보들을 사용함으로써 동작의 방향성을 인식할수 있고 다수 사람의 동작 인식이 가능하다. 뿐만 아니라 간단한 특징 추출 방법으로 높은 인식률의 시스템을 구현하였다.

회전 기계 고장 진단을 위한 최근접 이웃 분류기의 기각 전략 (Rejection Scheme of Nearest Neighbor Classifier for Diagnosis of Rotating Machine Fault)

  • 최영일;박광호;기창두
    • 한국정밀공학회지
    • /
    • 제19권3호
    • /
    • pp.52-58
    • /
    • 2002
  • The purpose of condition monitoring and fault diagnosis is to detect faults occurring in machinery in order to improve the level of safety in plants and reduce operational and maintenance costs. The recognition performance is important not only to gain a high recognition rate bur a1so to minimize the diagnosis failures error rate by using off effective rejection module. We examined the problem of performance evaluation for the rejection scheme considering the accuracy of individual c1asses in order to increase the recognition performance. We use the Smith's method among the previous studies related to rejection method. Nearest neighbor classifier is used for classifying the machine conditions from the vibration signals. The experiment results for the performance evaluation of rejection show the modified optimum rejection method is superior to others.

재난재해 현장의 지형인지를 위한 통합 센서 모듈 개발 (Development of an Integrated Sensor Module for Terrain Recognition at Disaster Sites)

  • 서명국;윤복중;신희영;이경준
    • 드라이브 ㆍ 컨트롤
    • /
    • 제17권3호
    • /
    • pp.9-14
    • /
    • 2020
  • A special purpose machine with two manipulators and quadruped crawler system is being developed to work at disaster sites where it is intended to quickly respond in the initial stages after the event. In this study, a terrain recognition module is developed so that the above special purpose machine can quickly obtain ground information to help choose its path while recognizing objects in its way, this is intended to enhance the remote driver's limited situational awareness. Terrain recognition modules were developed for two tasks (real-time path guidance, precision terrain measurements). The real-time path guidance analyzes terrain and obstacles while moving, while the precision terrain measurement feature provides more accurate terrain information by precisely measuring the ground in front of the vehicle while stationary. In this study, an air-cooled sensor protection module was developed so that the terrain recognition module can continue its vital tasks in the event of exposure to foreign substances, including scattered dust, mist and rainfall, as well as high temperatures.

가중 원형 정합을 이용한 인쇄체 숫자 인식 (Machine-printed Numeral Recognition using Weighted Template Matching)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제10권3호
    • /
    • pp.554-559
    • /
    • 2009
  • 본 논문에서는 인쇄체 숫자를 인식하기 위해 가중 원형 정합(weighted template matching) 방법을 제안한다. 원형 정합은 입력 영상 전체를 하나의 전역적인 특징으로 처리하는 데 반해, 제안된 가중 원형 정합은 패턴의 특징이 나타나는 국부적인 영역에 해밍 거리(Hamming distance)의 가중치를 두어 패턴 특징을 강조하여 숫자 패턴의 인식률을 높인다. 실험에서는 기존의 원형 정합을 사용했을 때, 오류 역전파 신경망을 사용했을 때와 가중 원형 정합을 사용했을 때의 혼돈 행렬(confusion matrix)을 각각 서로 비교한다. 실험 결과는 본 논문에서 제안한 방법에 의해 인쇄체 숫자의 인식률이 크게 향상된 것을 보인다.

Caffe를 이용한 얼굴 인식 파이프라인 모델 구현 (Implementation of Face Recognition Pipeline Model using Caffe)

  • 박진환;김창복
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.430-437
    • /
    • 2020
  • 제안 모델은 얼굴 검출과 랜드마크 및 얼굴 인식 알고리즘을 이용하여 인공신경망으로 학습을 통해 얼굴 예측률과 인식률을 향상하는 모델을 구현하였다. 제안 모델은 특정 인물의 얼굴 영상에서 랜드마킹을 한 후, 기존에 학습된 Caffe 모델을 이용하여 얼굴검출과 임베딩 벡터 128D를 추출하였다. 학습은 기계학습 알고리즘인 SVM (support vector machine)과 DNN (deep neural network)을 구축하여 학습하였다. 얼굴인식은 학습된 모델을 이용하여 학습된 인물 중 다른 얼굴 영상으로 테스트하였다. 실험 결과, SVM 보다는 DNN으로 학습한 결과가 우수한 예측률과 인식률을 보였다. DNN의 중간층을 증가하게 되면 예측률은 높아지나 인식률이 감소하는 현상이 발생하였다. 이것은 인식하고자 하는 대상이 적음으로써 발생하는 과적합으로 판단된다. 제안 모델은 명확한 얼굴 영상을 추가하여 학습한 결과, 높은 예측률과 인식률의 결과를 얻을 수 있음을 확인할 수 있었다. 본 연구는 좀 더 많은 얼굴 영상 데이터를 이용함으로써 보다 효과적인 딥러닝 구축을 통해 보다 향상된 인식률과 예측률을 얻을 수 있을 것이다.

Human Face Recognition using Multi-Class Projection Extreme Learning Machine

  • Xu, Xuebin;Wang, Zhixiao;Zhang, Xinman;Yan, Wenyao;Deng, Wanyu;Lu, Longbin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권6호
    • /
    • pp.323-331
    • /
    • 2013
  • An extreme learning machine (ELM) is an efficient learning algorithm that is based on the generalized single, hidden-layer feed-forward networks (SLFNs), which perform well in classification applications. Many studies have demonstrated its superiority over the existing classical algorithms: support vector machine (SVM) and BP neural network. This paper presents a novel face recognition approach based on a multi-class project extreme learning machine (MPELM) classifier and 2D Gabor transform. First, all face image features were extracted using 2D Gabor filters, and the MPELM classifier was used to determine the final face classification. Two well-known face databases (CMU-PIE and ORL) were used to evaluate the performance. The experimental results showed that the MPELM-based method outperformed the ELM-based method as well as other methods.

  • PDF

A Study on Learning Mathematics for Machine Learning

  • Jun, Sang Pyo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.257-263
    • /
    • 2019
  • This paper is a study on mathematical aspects that can be basic for understanding and applying the contents of machine learning. If you are familiar with mathematics in the field of computer science, you can create algorithms that can diversify researches and implement them faster, so you can implement many real-life ideas. There is no curriculum standard for mathematics in the field of machine learning, and there are many absolutely lacking mathematical contents that are taught in the curriculum presented at existing universities. Machine learning now includes speech recognition systems, search engines, automatic driving systems, process automation, object recognition, and more. Many applications that you want to implement combine a large amount of data with many variables into the components that the programmer generates. In this course, the mathematical areas required for computer engineer (CS) practitioners and computer engineering educators have become diverse and complex. It is important to analyze the mathematical content required by engineers and educators and the mathematics required in the field. This paper attempts to present an effective range design for the essential processes from the basic education content to the deepening education content for the development of many researches.

Noise Robust Automatic Speech Recognition Scheme with Histogram of Oriented Gradient Features

  • Park, Taejin;Beack, SeungKwan;Lee, Taejin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제3권5호
    • /
    • pp.259-266
    • /
    • 2014
  • In this paper, we propose a novel technique for noise robust automatic speech recognition (ASR). The development of ASR techniques has made it possible to recognize isolated words with a near perfect word recognition rate. However, in a highly noisy environment, a distinct mismatch between the trained speech and the test data results in a significantly degraded word recognition rate (WRA). Unlike conventional ASR systems employing Mel-frequency cepstral coefficients (MFCCs) and a hidden Markov model (HMM), this study employ histogram of oriented gradient (HOG) features and a Support Vector Machine (SVM) to ASR tasks to overcome this problem. Our proposed ASR system is less vulnerable to external interference noise, and achieves a higher WRA compared to a conventional ASR system equipped with MFCCs and an HMM. The performance of our proposed ASR system was evaluated using a phonetically balanced word (PBW) set mixed with artificially added noise.