• 제목/요약/키워드: Recognition Model

검색결과 3,390건 처리시간 0.028초

저가 카메라를 이용한 스마트 장난감 게임을 위한 모형 자동차 인식 (Recognition of Model Cars Using Low-Cost Camera in Smart Toy Games)

  • 강민혜;홍원기;고재필
    • 대한임베디드공학회논문지
    • /
    • 제19권1호
    • /
    • pp.27-32
    • /
    • 2024
  • Recently, there has been a growing interest in integrating physical toys into video gaming within the game content business. This paper introduces a novel method that leverages low-cost camera as an alternative to using sensor attachments to meet this rising demand. We address the limitations associated with low-cost cameras and propose an optical design tailored to the specific environment of model car recognition. We overcome the inherent limitations of low-cost cameras by proposing an optical design specifically tailored for model car recognition. This approach primarily focuses on recognizing the underside of the car and addresses the challenges associated with this particular perspective. Our method employs a transfer learning model that is specifically trained for this task. We have achieved a 100% recognition rate, highlighting the importance of collecting data under various camera exposures. This paper serves as a valuable case study for incorporating low-cost cameras into vision systems.

Spatio-temporal Semantic Features for Human Action Recognition

  • Liu, Jia;Wang, Xiaonian;Li, Tianyu;Yang, Jie
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권10호
    • /
    • pp.2632-2649
    • /
    • 2012
  • Most approaches to human action recognition is limited due to the use of simple action datasets under controlled environments or focus on excessively localized features without sufficiently exploring the spatio-temporal information. This paper proposed a framework for recognizing realistic human actions. Specifically, a new action representation is proposed based on computing a rich set of descriptors from keypoint trajectories. To obtain efficient and compact representations for actions, we develop a feature fusion method to combine spatial-temporal local motion descriptors by the movement of the camera which is detected by the distribution of spatio-temporal interest points in the clips. A new topic model called Markov Semantic Model is proposed for semantic feature selection which relies on the different kinds of dependencies between words produced by "syntactic " and "semantic" constraints. The informative features are selected collaboratively based on the different types of dependencies between words produced by short range and long range constraints. Building on the nonlinear SVMs, we validate this proposed hierarchical framework on several realistic action datasets.

Hidden Markov Model과 Karhuman Loevs Transform를 이용한 얼굴인식 (A Face Recognition using the Hidden Markov Model and Karhuman Loevs Transform)

  • 김도현;황선기;강용석;김태우;김문환;배철수
    • 한국정보전자통신기술학회논문지
    • /
    • 제4권1호
    • /
    • pp.3-8
    • /
    • 2011
  • 본 논문은 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터베이스 안에서 누구인지를 식별하는 얼굴인식 방법을 제안하였으며, 또한 HMM과 KLT를 이용한 얼굴인식 알고리즘의 수행결과를 비교, 분석하였다. 얼굴인식 방법으로 측정벡터는 직교변환(Karhuman Loevs Trans-form : KLT)의 상관관계를 이용하여 얻은 HMM의 정역학특성을 사용하여 HMM 기존의 얼굴인식 방법에서 인식률을 개선하였으며, 실험결과로써 조명의 조건에 따른 여러 가지 복잡한 주변 상황변화에서도 제안된 방식의 효율성을 입증할 수 있었다.

Hybrid Neural Classifier Combined with H-ART2 and F-LVQ for Face Recognition

  • Kim, Do-Hyeon;Cha, Eui-Young;Kim, Kwang-Baek
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1287-1292
    • /
    • 2005
  • This paper presents an effective pattern classification model by designing an artificial neural network based pattern classifiers for face recognition. First, a RGB image inputted from a frame grabber is converted into a HSV image which is similar to the human beings' vision system. Then, the coarse facial region is extracted using the hue(H) and saturation(S) components except intensity(V) component which is sensitive to the environmental illumination. Next, the fine facial region extraction process is performed by matching with the edge and gray based templates. To make a light-invariant and qualified facial image, histogram equalization and intensity compensation processing using illumination plane are performed. The finally extracted and enhanced facial images are used for training the pattern classification models. The proposed H-ART2 model which has the hierarchical ART2 layers and F-LVQ model which is optimized by fuzzy membership make it possible to classify facial patterns by optimizing relations of clusters and searching clustered reference patterns effectively. Experimental results show that the proposed face recognition system is as good as the SVM model which is famous for face recognition field in recognition rate and even better in classification speed. Moreover high recognition rate could be acquired by combining the proposed neural classification models.

  • PDF

항공기 음성인식 소프트웨어 품질 평가 모델 연구 (The Study on the Quality Assessment Model of Aircraft Voice Recognition Software)

  • 이승목
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권2호
    • /
    • pp.73-83
    • /
    • 2019
  • 음성인식은 최근 인공지능 기술과 접목되면서 오인식률이 크게 개선되었고 사용자 관점에서 효과적이고 효율적인 HMI(Human Machine Interface)를 제공하고 있다. 이러한 추세는 방위산업 분야에서도 반영되고 있고 특히 항공분야에서 F-35에 적용이 되었다. 하지만 이러한 기술에 대해서 품질평가를 위해 방위산업 특히 항공분야에는 객관적이고 평가 가능한 정량적인 모델이 필요하다. 본 연구에서는 이러한 음성인식의 소프트웨어 측면에서 항공기에 적용하기 위한 정량적인 평가 모델을 제시한다. 평가 모델 제시를 위해 음성인식 적용 기술과 ISO/IEC 25000(SQuaRE) 제품 품질 속성을 이용해 평가 항목을 추출한다. 이러한 두 가지 항목의 연계를 통해 정량적인 평가 모델을 제시하고 사례 연구를 활용해 평가 결과를 확인한다.

세그멘테이션 알고리즘을 사용한 도로 Sign 인식 모델 (Recognition Model of Road Signs Using Image Segmentation Algorithm)

  • 황영;송정영
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.233-237
    • /
    • 2013
  • 이미지 인식은 패턴인식의 중요한 한 연구 분야이다. 본 논문은 이미지 세그멘테이션 알고리즘을 소개하고, 이의 응용으로 도로 Sign 인식시스템에 적용하여 그 결과를 고찰하였다. 본 논문에서, 우리는 이미지 프로세싱 기술의 도움으로 도로 Sign 의 체계적인 연구를 하였고, 이에 해당하는 알고리즘을 만들었다. 도로 Sign을 인식하기 위하여, 본 논문은 이미지 세그멘테이션 알고리즘 파트와 이미지 인식파트의 두 부분으로 나누어서 기술하였다. 인식실험은 도로 Sign 인식 알고리즘 모델이 스마트 폰에 유용하게 사용될 것과, 그 외 여러분야에 사용될 수 있음을 보여 준다.

바타챠랴 거리 측정 기법을 사용한 가우시안 모델 기반 음소 인식 향상 (Improving Phoneme Recognition based on Gaussian Model using Bhattacharyya Distance Measurement Method)

  • 오상엽
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.85-93
    • /
    • 2011
  • 기존의 어휘 인식에서는 일반적인 벡터 값을 데이터베이스를 이용하여 구하므로 탐색 중에 형성되는 음소를 처리하지 못하는 문제점을 제공하며, 음소 데이터에 대한 모델을 구성할 수 없는 단점으로 인하여 가우시안 모텔의 정확성을 확보하지 못하게 된다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 바타챠랴 거리 측정법을 이용하여 정확한 음소로 인식할 수 있도록 유도하였으며 유사 음소 인식과 오인식 오류를 최소화하여 인식률을 향상시켰다. 연속 확률 분포의 공유로부터 가우시안 모델 최적화를 실험한 결과 향상된 신뢰도로 인해 높은 인식 성능을 확인하였으며, 본 논문에서 제안한 바타챠랴 거리 측정법을 이용하여 실험한 결과 기존의 방법들에 비하여 평균 1.9%의 성능 향상을 나타내었으며 신뢰성을 바탕으로 인식율에서 평균 2.9%의 성능 향상을 나타내었다.

GMM 지원을 위해 k-means 알고리즘을 이용한 어휘 인식 성능 개선 (Vocabulary Recognition Performance Improvement using k-means Algorithm for GMM Support)

  • 이종섭
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.135-140
    • /
    • 2015
  • 일반적인 CHMM 어휘 인식 시스템은 어휘 인식에 대한 모델들의 관측 확률 인식률이 낮고, 일부 단위 음소 모델에만 적용되어 제한적으로 사용되는 문제점이 있다. 또한, 어휘 탐색에서 어휘의 의미가 다양하여 탐색된 어휘가 사용자의 요구에 부합되지 않는 문제점을 가진다. 이러한 문제를 개선하기 위해 GMM(Gaussian Mixture Model)을 이용한 음소인식을 수행하고, 개선된 k-means 알고리즘을 이용하여 어휘 특성에 따른 제한적인 탐색 문제점을 해결하였다. 성능 실험은 기존의 시스템과 비교하여 정확도와 재현율로 대변되는 효과성을 측정하였으며, 성능 실험 결과 정확도는 83%, 재현율은 67%로 나타났다.

분할기반 은닉 마르코프 모델과 다층 퍼셉트론 결합 영문수표필기단어 인식시스템 (A Segmentation-Based HMM and MLP Hybrid Classifier for English Legal Word Recognition)

  • 김계경;김진호;박희주
    • 한국지능시스템학회논문지
    • /
    • 제11권3호
    • /
    • pp.200-207
    • /
    • 2001
  • 본 논문에서는 분할기반 은닉 마르코프 모델(segmentation based hidden Markov model)과 다층 퍼셉트론 (multi-layer perceptron)을 결합한 영문수표 필기단어 (legal word) 인식시스템을 제안하였다. 가변길이의 필기체 영문 단어 분할결과를 인식할 수 있도록 은닉 마르코프 모델을 이용하여 명확한 분할기반 (explicit segmentation-based) 단어단위 (word level) 인식기를 구현하고 다층 퍼셉트론을 이용하여 내재적 분할기반 (implicit segmentation-based) 단어단위 인식기를 구현하였다. 그리고 이종(heterogeneous)의 두 인식기를 새로운 결합 확률추정방식에 따라 결합함으로서 상호 보완 능력을 극대화시킬 수 있는 영문수표 필기단어 인식시스템을 구현하였다. 제안한 시스템을 캐나다 콘코디아 대학의 CENPARMI 영문 수표 데이터베이스에 적용하여 실험해 본 결과 기존의 연구결과에 비해 비교적 우수한 인식성능을 얻을 수 있었다.

  • PDF

변형 VGG 모델의 전처리를 이용한 부품도면 문자 인식 성능 개선 (Performance Improvement of Optical Character Recognition for Parts Book Using Pre-processing of Modified VGG Model)

  • 신희란;이상협;박장식;송종관
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.433-438
    • /
    • 2019
  • 본 논문에서는 기계 서비스 부품 도면에서 숫자를 인식하기 위하여 입력 영상에 대한 전처리와 딥러닝 모델을 제안한다. 서비스 부품 도면의 숫자를 인식하는데 있는 지시선과 도형에 의한 오검출 또는 오인식을 개선하기 위하여 수학적 형태학 필터링 전처리를 한다. 숫자 인식을 위하여 VGG-16 모델을 축소 변형한 7 개의 계층을 가지는 VGG 모델을 적용함으로써 인식 성능을 개선한다. 서비스 부품 도면의 숫자 인식 실험 결과, 제안하는 방법이 인식률 95.57%, 정확도는 92.82%로 종래의 방법에 현저히 개선된 결과를 얻었다.