• 제목/요약/키워드: Information Recognition

검색결과 9,120건 처리시간 0.037초

Facial Expression Recognition Method Based on Residual Masking Reconstruction Network

  • Jianing Shen;Hongmei Li
    • Journal of Information Processing Systems
    • /
    • 제19권3호
    • /
    • pp.323-333
    • /
    • 2023
  • Facial expression recognition can aid in the development of fatigue driving detection, teaching quality evaluation, and other fields. In this study, a facial expression recognition method was proposed with a residual masking reconstruction network as its backbone to achieve more efficient expression recognition and classification. The residual layer was used to acquire and capture the information features of the input image, and the masking layer was used for the weight coefficients corresponding to different information features to achieve accurate and effective image analysis for images of different sizes. To further improve the performance of expression analysis, the loss function of the model is optimized from two aspects, feature dimension and data dimension, to enhance the accurate mapping relationship between facial features and emotional labels. The simulation results show that the ROC of the proposed method was maintained above 0.9995, which can accurately distinguish different expressions. The precision was 75.98%, indicating excellent performance of the facial expression recognition model.

온라인 음악 관리 서비스를 위한 사용자 음원 인식 시스템 개발 (Development of User Music Recognition System For Online Music Management Service)

  • 성보경;고일주
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.91-99
    • /
    • 2010
  • 최근 디지털 콘텐츠 서비스 분야에서 사용자 맞춤형 서비스를 위해 사용자 자원 인식의 필요성이 대두되고 있다. 특히 온라인 기반 음악 서비스의 경우 사용자 취향 분석, 음원 추천 및 음악 관련 정보 제공을 위해 사용자 음원인식 기술이 요구되고 있다. 현재 태그정보를 기초로 사용자 음원 인식 후 음악 관련 정보를 제공하는 서비스가 제공되고 있지만, 태그정보의 변조 및 삭제 등의 취약점으로 인식 오류가 급증하고 있다. 이러한 문제의 보완 방안으로 음악 자체를 이용하는 내용기반 사용자 음원 인식 기법에 대한 연구가 이루어지고 있다. 본 논문에서는 음악의 파형에서 추출된 특징 정보를 기초로 온라인상에서 사용자 음원을 인식하는 방법에 대해 논하고자 한다. 사용자 음원의 내용기반 인식을 위해 구조에 적합한 음원의 전처리 후 특징 추출을 하였다. 추출된 특징은 음악 서버에 특징 형태로 저장된 음원과의 매칭 과정을 통한 인식을 진행하여 태그데이터에 독립적으로 사용자 음원을 인식할 수 있게 되었다. 제안된 사용자 음원 인식 방법의 검증을 위해 600개의 음악을 무작위 선정하고, 각각을 5가지 음질로 변화하였다. 이렇게 생성된 3000개의 실험음원을 30만곡을 포함하는 음악 서버를 기준으로 인식실험을 진행하였다. 평균 인식율은 85%를 나타내었다. 제안하는 내용기반 음원 인식을 통하여 태그기반 음원 인식의 취약점에 대한 극복을 하였으며, 음원 인식의 성능은 실제 온라인 음악 서비스에 적용할 가능성을 보여주었다.

An Extended Generative Feature Learning Algorithm for Image Recognition

  • Wang, Bin;Li, Chuanjiang;Zhang, Qian;Huang, Jifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권8호
    • /
    • pp.3984-4005
    • /
    • 2017
  • Image recognition has become an increasingly important topic for its wide application. It is highly challenging when facing to large-scale database with large variance. The recognition systems rely on a key component, i.e. the low-level feature or the learned mid-level feature. The recognition performance can be potentially improved if the data distribution information is exploited using a more sophisticated way, which usually a function over hidden variable, model parameter and observed data. These methods are called generative score space. In this paper, we propose a discriminative extension for the existing generative score space methods, which exploits class label when deriving score functions for image recognition task. Specifically, we first extend the regular generative models to class conditional models over both observed variable and class label. Then, we derive the mid-level feature mapping from the extended models. At last, the derived feature mapping is embedded into a discriminative classifier for image recognition. The advantages of our proposed approach are two folds. First, the resulted methods take simple and intuitive forms which are weighted versions of existing methods, benefitting from the Bayesian inference of class label. Second, the probabilistic generative modeling allows us to exploit hidden information and is well adapt to data distribution. To validate the effectiveness of the proposed method, we cooperate our discriminative extension with three generative models for image recognition task. The experimental results validate the effectiveness of our proposed approach.

물체-행동 컨텍스트를 이용하는 확률 그래프 기반 물체 범주 인식 (Probabilistic Graph Based Object Category Recognition Using the Context of Object-Action Interaction)

  • 윤성백;배세호;박한재;이준호
    • 한국통신학회논문지
    • /
    • 제40권11호
    • /
    • pp.2284-2290
    • /
    • 2015
  • 다양한 외형 변화를 가지는 물체의 범주 인식성능을 향상 시키는데 있어서 사람의 행동은 매우 효과적인 컨텍스트 정보이다. 본 연구에서는 Bayesian 접근법을 기반으로 하는 간단한 확률 그래프 모델을 통해 사람의 행동을 물체 범주 인식을 위한 컨텍스트 정보로 활용하였다. 다양한 외형의 컵, 전화기, 가위 그리고 스프레이 물체에 대해 실험을 수행한 결과 물체의 용도에 대한 사람의 행동을 인식함으로써 물체 인식 성능을 8%~28%개선할 수 있었다.

Fast Face Gender Recognition by Using Local Ternary Pattern and Extreme Learning Machine

  • Yang, Jucheng;Jiao, Yanbin;Xiong, Naixue;Park, DongSun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권7호
    • /
    • pp.1705-1720
    • /
    • 2013
  • Human face gender recognition requires fast image processing with high accuracy. Existing face gender recognition methods used traditional local features and machine learning methods have shortcomings of low accuracy or slow speed. In this paper, a new framework for face gender recognition to reach fast face gender recognition is proposed, which is based on Local Ternary Pattern (LTP) and Extreme Learning Machine (ELM). LTP is a generalization of Local Binary Pattern (LBP) that is in the presence of monotonic illumination variations on a face image, and has high discriminative power for texture classification. It is also more discriminate and less sensitive to noise in uniform regions. On the other hand, ELM is a new learning algorithm for generalizing single hidden layer feed forward networks without tuning parameters. The main advantages of ELM are the less stringent optimization constraints, faster operations, easy implementation, and usually improved generalization performance. The experimental results on public databases show that, in comparisons with existing algorithms, the proposed method has higher precision and better generalization performance at extremely fast learning speed.

An Adaptive Face Recognition System Based on a Novel Incremental Kernel Nonparametric Discriminant Analysis

  • SOULA, Arbia;SAID, Salma BEN;KSANTINI, Riadh;LACHIRI, Zied
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권4호
    • /
    • pp.2129-2147
    • /
    • 2019
  • This paper introduces an adaptive face recognition method based on a Novel Incremental Kernel Nonparametric Discriminant Analysis (IKNDA) that is able to learn through time. More precisely, the IKNDA has the advantage of incrementally reducing data dimension, in a discriminative manner, as new samples are added asynchronously. Thus, it handles dynamic and large data in a better way. In order to perform face recognition effectively, we combine the Gabor features and the ordinal measures to extract the facial features that are coded across local parts, as visual primitives. The variegated ordinal measures are extraught from Gabor filtering responses. Then, the histogram of these primitives, across a variety of facial zones, is intermingled to procure a feature vector. This latter's dimension is slimmed down using PCA. Finally, the latter is treated as a facial vector input for the advanced IKNDA. A comparative evaluation of the IKNDA is performed for face recognition, besides, for other classification endeavors, in a decontextualized evaluation schemes. In such a scheme, we compare the IKNDA model to some relevant state-of-the-art incremental and batch discriminant models. Experimental results show that the IKNDA outperforms these discriminant models and is better tool to improve face recognition performance.

Modulation Recognition of BPSK/QPSK Signals based on Features in the Graph Domain

  • Yang, Li;Hu, Guobing;Xu, Xiaoyang;Zhao, Pinjiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권11호
    • /
    • pp.3761-3779
    • /
    • 2022
  • The performance of existing recognition algorithms for binary phase shift keying (BPSK) and quadrature phase shift keying (QPSK) signals degrade under conditions of low signal-to-noise ratios (SNR). Hence, a novel recognition algorithm based on features in the graph domain is proposed in this study. First, the power spectrum of the squared candidate signal is truncated by a rectangular window. Thereafter, the graph representation of the truncated spectrum is obtained via normalization, quantization, and edge construction. Based on the analysis of the connectivity difference of the graphs under different hypotheses, the sum of degree (SD) of the graphs is utilized as a discriminate feature to classify BPSK and QPSK signals. Moreover, we prove that the SD is a Schur-concave function with respect to the probability vector of the vertices (PVV). Extensive simulations confirm the effectiveness of the proposed algorithm, and its superiority to the listed model-driven-based (MDB) algorithms in terms of recognition performance under low SNRs and computational complexity. As it is confirmed that the proposed method reduces the computational complexity of existing graph-based algorithms, it can be applied in modulation recognition of radar or communication signals in real-time processing, and does not require any prior knowledge about the training sets, channel coefficients, or noise power.

MHI의 형태 정보를 이용한 동작 인식 (Gesture Recognition using MHI Shape Information)

  • 김상균
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.1-13
    • /
    • 2011
  • 본 논문에서는 MHI(Motion History Image)의 형태학적 정보를 이용하여 동작을 인식하는 제스처 인식(Gesture Recognition) 시스템을 제안한다. 입력되는 영상으로부터 동작에 관한 정보를 제공하는 MHI를 획득하고, 이 MHI로부터 x, y 각각의 좌표에 대한 기울기(gradient) 영상을 추출한다. 각각의 기울기 영상에 형태 문맥기법(shape context method)을 적용하여 형태 정보를 추출하고, 추출된 형태 정보 값들을 특징 값으로 사용한다. 이렇게 획득한 특징값들을 최종적으로 SVM(Support Vector Machine) 분류기로 학습 및 분류하여 동작을 인식한다. 제안하는 시스템은 MHI의 형태학적인 정보들을 사용함으로써 동작의 방향성을 인식할수 있고 다수 사람의 동작 인식이 가능하다. 뿐만 아니라 간단한 특징 추출 방법으로 높은 인식률의 시스템을 구현하였다.

Embedded System 기반 Vision Box 설계와 적용 (Design and Application of Vision Box Based on Embedded System)

  • 이종혁
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1601-1607
    • /
    • 2009
  • 비전 시스템은 카메라를 통하여 획득한 이미지 정보를 캡쳐 후, 이를 분석하여 물체를 인식하는 것으로서, 차종 분류를 포함 한 다양한 산업현장에서 사용하고 있다. 이런 필요성으로 인하여 차종 분류를 위한 많은 연구가 이루어지고 있으나 복잡한 계산과정으로 인하여 처리 시간이 많이 소요되는 단점이 있다. 본 논문에서는 임베디드 시스템을 기반으로 하는 Vision Box를 설계하고 이를 사용한 차종인식 시스템을 제안하였다. 제안한 Vision Box의 성능을 자동차의 차종분류를 통한 사전 테스트 결과 최적 화된 환경 조건에서는 100%의 차종별 인식률을 보였으며, 조명 및 회전의 작은 변화에 따른 테스트에서 차종인식은 가능하였으나, 패턴점수가 낮아졌다. 제안한 Vision Box 시스템을 산업 현장에 적용한 결과 처리시간, 인식률 등에서 산업체의 요구 조건을 만족 할 수 있음을 확인할 수 일었다.

바이모달 정보를 이용한 기절상황인식 시스템에 관한 연구 (A Study on the Recognition System of Faint Situation based on Bimodal Information)

  • 소인미;정성태
    • 한국멀티미디어학회논문지
    • /
    • 제13권2호
    • /
    • pp.225-236
    • /
    • 2010
  • 본 논문은 카메라 영상 정보와 기울기 센서 정보를 통합한 바이모달 응급상황 인식방법을 제안한다. 제안된 방법은 어느 한 센서가 오작동 하거나 사용자가 착용형 기울기 센서를 착용하지 않거나, 영상 획득의 어려움이 있는 욕실과 같은 곳에 있는 경우에도 응급 상황을 감지하여 센서 간에 상호 협력과 보완을 함으로써 응급 상황을 인식할 수 있다. 본 논문에서는 HMM 학습 및 인식을 통해 걷는 동작, 바닥에 앉는 동작, 소파에 앉는 동작, 눕는 동작, 기절 동작을 판단할 수 있도록 하였다. 영상의 특징 벡터와 기울기 센서의 특징 벡터를 결합하여 학습하고 인식했을 때, 인식률의 향상을 가져올 수 있었다. 또한 다양한 조명의 변화에도 적응적 배경 모델을 통해 움직이는 객체를 강건하게 검출할 수 있어서 높은 인식률을 유지할 수 있었다.