• Title/Summary/Keyword: 프레임 분류

Search Result 545, Processing Time 0.027 seconds

Image Sequence Compression based on Adaptive Classification of Interframe Difference Image Blocks (프레임간 차영상 블록의 적응분류에 의한 영상시퀀스 압축)

  • Ahn, Chul-Joon;Kong, Seong-Gon
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.8 no.6
    • /
    • pp.122-128
    • /
    • 1998
  • This paper presents compression of image sequences based on the classification of interframe difference image blocks. classification process consists of image activity classification and energy distribution classification. In the activity classification, interframe difference image blocks are classified into activity blocks and non-activity blocks using the edge detection. In the distribution classification, activity blocks are further classified into vertical blocks, horizontal blocks, and small activity blocks using the AC energy distribution features. The RBFN, trained with numerical classification results, successfully classifies difference image blocks according to image details. Image sequence compressing based on the classification of interframe difference image blocks using the RBFN shows better compression results and less training time than the classical sorting method and the MLP network.

  • PDF

A Design of Real-time Facial Age Recognition System based on Depth-Camera (심도카메라 기반의 실시간 얼굴 나이 인식 시스템 설계)

  • Ko, Ginam;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.655-657
    • /
    • 2012
  • 본 논문에서는 심도(Depth) 카메라로부터 실시간 획득한 RGBD 데이터에서 심도 정보 기반의 AAM(Active Appearance Models)과 나이 인식 알고리즘[1]을 통해 4 개의 AG(Age Group)으로 분류하는 실시간 얼굴 나이 인식 시스템(Real-time Facial Age Recognition System)을 설계한다. 기존의 AAM 을 이용한 실시간 얼굴 특징 추출은 평균 약 4.17%의 프레임 손실율을 보였으나, 심도 정보를 활용한 AAM 은 평균 약 0.43%의 프레임 손실율만을 보였다[5]. 본 논문에서는 심도 정보를 활용한 AAM과 병렬 처리 방법인 CUDA 를 결합하여 나이 특징을 추출하고, 실시간 시스템에 적용 가능하도록 나이 인식 알고리즘을 개선하여 실시간 나이 인식 시스템을 설계한다. 설계된 시스템은 1)머리 위치 추적, 2)얼굴 인식 및 특징점 추출, 3)나이 특징 추출, 4) 나이 특징 분석, 5) 나이 분류의 5 가지 단계를 통해 최종적으로 4 개의 AG 로 분류한다.

A Recognition Framework for Facial Expression by Expression HMM and Posterior Probability (표정 HMM과 사후 확률을 이용한 얼굴 표정 인식 프레임워크)

  • Kim, Jin-Ok
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.3
    • /
    • pp.284-291
    • /
    • 2005
  • I propose a framework for detecting, recognizing and classifying facial features based on learned expression patterns. The framework recognizes facial expressions by using PCA and expression HMM(EHMM) which is Hidden Markov Model (HMM) approach to represent the spatial information and the temporal dynamics of the time varying visual expression patterns. Because the low level spatial feature extraction is fused with the temporal analysis, a unified spatio-temporal approach of HMM to common detection, tracking and classification problems is effective. The proposed recognition framework is accomplished by applying posterior probability between current visual observations and previous visual evidences. Consequently, the framework shows accurate and robust results of recognition on as well simple expressions as basic 6 facial feature patterns. The method allows us to perform a set of important tasks such as facial-expression recognition, HCI and key-frame extraction.

Phoneme Segmentation Using Voice/Unvoiced/Silence Classifier and Spectral Information (유성/무성/묵음 분류기와 주파수 스펙트럼을 이용한 음소 경계 검출)

  • Lee Sang-Rae;Han Hyun-Bae;Hahn Minsoo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.86-91
    • /
    • 1999
  • 본 논문에서는 유성/무성/묵음 분류기와 주파수 스펙트럼 비교를 통하여 음소 경계 검출기를 구현하였다. 음소경계 검출은 음성 인식, 합성 및 분석 둥의 분야에서 매우 중요하다 유성/무성/묵음 분류기를 이용하여 유성음으로 판별되는 구간은 스펙트럼 비교를 통하여 음소 단위로 세분하였고 무성음으로 판별되는 구간은 한국어의 음성 특성을 고려하여 하나의 음소 단위로 간주하였다. 유성음 구간에 대한 스펙트럼 비교는 수정된 Itakura-Saito distance measure 와 Euclidean MFCC(Mel Frequency Cepstrum Coeffcients) distance measure를 사용하였고 비교 프레임은한 프레임을 건너 윈 경우가 가장 결과가 좋았다. 최종적으로 평균 음소 길이 정보를 이용하여 음소의 경계로 검출된 구간을 더 세분하거나 통합하였다. 유성/무성/묵음 분류기의 경우는 사무실에서 녹음한 고립단어에 대하여 $94.247\%$의 정확도를 보였고 음소 경계 검출의 경우는 $72.8\%$의 정확도를 보였다.

  • PDF

A Neural Networks Approach to Voiced-Unvoice-Silence Classification Incorporating Amplitude Distribution (음성 진폭분포로 신경망을 구동한 유-무-묵음 분류)

  • 이인섭;최정아;배명진;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • v.9 no.6
    • /
    • pp.15-21
    • /
    • 1990
  • 유-무-묵음 분류 과정은 음성분석시에 아주 중요한 문제중의 하나이다. 음성에너지, ZCR, 자기 상관계수, LPC 계수, 예측에러 에너지등을 퍼래미터로 사용하여 지금까지 많은 분류기법이 제안되어져 왔다. 이런기법들은 기본적으로 퍼래미터를 추출해야 하고, 이 때문에 많은 계산량이 요구되고, 이들 퍼 래미터는 음성 본래의 정보들의 대부분을 상실하게 된다. 이 때문에 각 프레임의 진폭분포를 사용하는 새로운 앨고리즘을 제안하였다. 첫째로 V-U-S 영역은 개별 진폭분포형태를 가지기 때문에 주어진 프레 임에서 진폭분포를 구한다. 그런 다음에는 신경망을 통해 분류를 하게 된다. 신경망은 문덕값을 별도로 선정할 필요없고, 배경잡음에 강력하며, 또한 실시간 처리에 적합하다.

  • PDF

Vision-Based Train Position and Movement Estimation Using a Fuzzy Classifier (퍼지 분류기를 이용한 비전 기반 열차 위치 및 움직임 추정)

  • Song, Jae-Won;An, Tae-Ki;Lee, Dae-Ho
    • Journal of Digital Convergence
    • /
    • v.10 no.1
    • /
    • pp.365-369
    • /
    • 2012
  • We propose a vision-based method that estimates train position and movement for railway monitoring in which we use a fuzzy classifier to determine train states. The proposed method employs frame difference and background subtraction for estimating train motion and presence, respectively. These features are used as the linguistic variables of the fuzzy classifier. Experimental results show that the proposed method can correctly estimate train position and movement. Therefore the method can be used for railway monitoring systems which estimate crowd density or protect safety.

Recognition of Korean Isolated Digits Using Classification and Prediction Neural Networks (예측형과 분류형 신경망을 이용한 한국어 숫자음 인식)

  • 한학용;김주성;고시영;허강인;안점영
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.24 no.12B
    • /
    • pp.2447-2454
    • /
    • 1999
  • This paper proposes a N-APPEM(Nonlinear A Posteriori Probability Estimation Method) with a frame normalization method to conventional classification network to increase speech recognition ability. It also tests the recognition ability of the classification and prediction neural networks for the Korean isolated digits. From the experimental results, the prediction network with MLP(Multi-Layer Perceptron) achieves the highest recognition ability of 98.0%. The prediction requires very complicated networks increased linearly with the number of incoming speech categories. However, the classification network with the N-APPEM and the normalization improves the recognition ability up to 85.5% with a sin81e network, which is almost 12.0% improvement.

  • PDF

An Efficient Face Region Detection for Content-based Video Summarization (내용기반 비디오 요약을 위한 효율적인 얼굴 객체 검출)

  • Kim Jong-Sung;Lee Sun-Ta;Baek Joong-Hwan
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.7C
    • /
    • pp.675-686
    • /
    • 2005
  • In this paper, we propose an efficient face region detection technique for the content-based video summarization. To segment video, shot changes are detected from a video sequence and key frames are selected from the shots. We select one frame that has the least difference between neighboring frames in each shot. The proposed face detection algorithm detects face region from selected key frames. And then, we provide user with summarized frames included face region that has an important meaning in dramas or movies. Using Bayes classification rule and statistical characteristic of the skin pixels, face regions are detected in the frames. After skin detection, we adopt the projection method to segment an image(frame) into face region and non-face region. The segmented regions are candidates of the face object and they include many false detected regions. So, we design a classifier to minimize false lesion using CART. From SGLD matrices, we extract the textual feature values such as Inertial, Inverse Difference, and Correlation. As a result of our experiment, proposed face detection algorithm shows a good performance for the key frames with a complex and variant background. And our system provides key frames included the face region for user as video summarized information.

A Study on the Service Framework for LBS based on GIS (GIS 기반의 위치기반서비스 프레임워크 연구)

  • Jin, Hui-Chae;Kim, Do-Hyeon
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2004.12a
    • /
    • pp.45-59
    • /
    • 2004
  • GIS가 일반 사용자에게 보급되기 시작하면서 이동 GIS를 활용한 다양한 서비스와 위치 기반서비스들이 등장하고 활용되고 있다. 본 논문에서는 GIS 기반의 위치기반서비스에 대한 일반적인 서비스 프레임워크를 제시하고 서비스가 수행되는 모형을 살펴본다. 또한 이를 통하여 각각의 소요 기술을 파악하고 연구 진행 중인 다양한 기술의 활용방안에 대하여 살펴보도록 한다. 연구내용으로는 먼저 전통적인 GIS를 바탕으로 하는 GIS 기반의 위치기반서비스 구조를 발굴하여 일반적인 서비스 프레임워크로 작성한다. 서비스 프레임워크에서는 전통 GIS와 위치기반서비스의 서비스 수행관계, 인터페이스 관계 등을 표현하여 일반화하도록 하고, 이를 기반으로 한 서비스 운영형태를 제시한다. 그리고 서비스 프레임워크에 포함된 관련 분야의 기술 분류를 수행한다. 기술 분류는 위치기반서비스와 GIS를 바탕으로 주요 요구기술을 도출하여 이를 기능별로 구분하여 표준화 기술을 분류한다. 이들 기술은 각각의 기술발전 과정에 따라 다양한 과정으로 발전하게 되고 이에 따라서 서비스의 모양도 다양한 형태로 발전할 것으로 보인다. 마지막으로 이를 종합한 기술 로드맵을 제시하여 표준화 및 향후 발전방안을 제시하게 된다. 이를 바탕으로 GIS에 기반한 위치기반서비스의 일반화된 서비스 모형을 제시할 수 있고, 필요한 기술의 발굴, 기술발전에 따른 다양한 서비스의 예측이 가능할 것으로 보이며 GIS 서비스의 일반화에 크게 기여할 것으로 보인다.

  • PDF

Real-time face detection and tracking using hierarchical classifier (계층적 분류기를 이용한 실시간 얼굴 검출 및 추적)

  • Kim, Su-Hui;Yang, Chang-Ho;Lee, Bae-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.497-500
    • /
    • 2003
  • 본 논문은 계층적 분류기를 제안하여 실시간으로 얼굴 영역을 검출하고, PT(pan-tilt) 카메라를 통해 동적으로 얼굴을 추적할 수 있는 강인한 추적 알고리즘을 구현하고자 한다. 제안된 알고리즘은 분류기 학습, 실시간 얼굴 영역 검출, 추적의 세 단계로 구성된다. 분류기 학습은 AdaBoost 알고리즘을 이용하여, 독특한 얼굴 특징을 추출하는 계층적 분류기를 생성한다. 계층적 분류기는 높은 정확도를 가진 분류기들이 단계적으로 결합됨으로써 우수한 검출 성능으로 수행된다. 실시간 얼굴 영역 검출은 생성된 계층적 분류기를 통해, 빠르고 효율적으로 얼굴 영역을 찾아낸다. 추적은 PT 카메라를 통해 동적으로 검출 영역을 확장시키며, 이전 단계에서 추출된 얼굴 영역의 위치 정보를 이용하여 수행한다. 제안된 알고리즘은 계산의 효율성과 검출 성능을 동시에 증가시키며, 얼굴 검출 수행은 2초당 약 15프레임을 실시간으로 처리한다.

  • PDF