통합 검색 | Korea Science

Automatic Emotion Classification of Music Signals Using MDCT-Driven Timbre and Tempo Features

Kim, Hyoung-Gook;Eom, Ki-Wan
- The Journal of the Acoustical Society of Korea
- /
- 제25권2E호
- /
- pp.74-78
- /
- 2006
This paper proposes an effective method for classifying emotions of the music from its acoustical signals. Two feature sets, timbre and tempo, are directly extracted from the modified discrete cosine transform coefficients (MDCT), which are the output of partial MP3 (MPEG 1 Layer 3) decoder. Our tempo feature extraction method is based on the long-term modulation spectrum analysis. In order to effectively combine these two feature sets with different time resolution in an integrated system, a classifier with two layers based on AdaBoost algorithm is used. In the first layer the MDCT-driven timbre features are employed. By adding the MDCT-driven tempo feature in the second layer, the classification precision is improved dramatically.
PDF KSCI

PTZ 카메라를 이용한 얼굴 추적 및 인식 시스템에 관한 연구 (A Study on the system of the Face Tracking and Recognition by a PTZ camera)

김승규;김형수;고동환;조용군;강훈
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2006년도 하계종합학술대회
- /
- pp.883-884
- /
- 2006
In this paper, we propose the real-time system that detects and recognizes the human face by PTZ camara. Generally, Face detection algorithms are disturbed by variable illuminations in a image. To avoid those, we use the robust adaboost algorithm for face detection. For recognition, we use PCA algorithm. we focus on the real-time system. It will be necessary in many applications.
PDF

지능형 자동차를 위한 비디오 기반의 교통 신호등 인식 시스템 (A Video based Traffic Light Recognition System for Intelligent Vehicles)

추연호;이복주;최영규
- 반도체디스플레이기술학회지
- /
- 제14권2호
- /
- pp.29-34
- /
- 2015
Traffic lights are common in cities and are important cues for the path planning of intelligent vehicles. In this paper, we propose a robust and efficient algorithm for recognizing traffic lights from video sequences captured by a low cost off-the-shelf camera. Instead of using color information for recognizing traffic lights, a shape based approach is adopted. In learning and detection phase, Histogram of Oriented Gradients (HOG) feature is used and a cascade classifier based on Adaboost algorithm is adopted as the main classifier for locating traffic lights. To decide the color of the traffic light, a technique based on histogram analysis in HSV color space is utilized. Experimental results on several video sequences from typical urban environment prove the effectiveness of the proposed algorithm.
PDF KSCI

얼굴 검출과 인식 및 모션추적에 의한 증강현실 구현 (Implementing Augmented Reality By Using Face Detection, Recognition And Motion Tracking)

이희만
- 한국컴퓨터정보학회논문지
- /
- 제17권1호
- /
- pp.97-104
- /
- 2012
내추럴 유저 인터페이스 기술(NUI)의 발달은 게임이나 컴퓨터 사용 및 기타 전자기기 사용법에 일대 변화를 가져오고 있다. 본 논문에서는 스마트 폰 사용자의 얼굴을 식별하고 또한 얼굴 움직임 동작을 감지하여 증강현실을 구현한다. 모바일 기기의 전면 카메라를 이용하여 얼굴의 위치를 Viola-Jones방법을 사용하여 검색하고 검색한 얼굴의 식별 및 움직임 검출을 Eigenface 알고리즘을 사용하며, 식별된 사람에 대응되는 그래픽스 오브젝트를 GPS나 가속도 센서 등의 정보와 후면 카메라의 영상과 함께 합성하는 증강현실 시스템을 구현한다. 증강현실 시스템은 모바일 기기의 성능에 적합한 알고리즘 및 방법으로 구현하여야 한다.
https://doi.org/10.9708/jksci.2012.17.1.097 인용 PDF KSCI

색상정보와 AdaBoost 알고리즘을 이용한 얼굴검출 (Face Detection using Color Information and AdaBoost Algorithm)

나종원;강대욱;배종성
- 한국정보통신학회논문지
- /
- 제12권5호
- /
- pp.843-848
- /
- 2008
얼굴 검출은 대부분 얼굴의 움직임 정보를 이용한다. 기존에 얼굴 검출 방법은 프레임간의 차를 이용하여 움직임을 검출하는 방법이 사용되어 왔으나 대부분이 실시간을 고려하지 않은 수학적 접근법을 사용하거나 알고리즘이 지나치게 복잡하여 실시간 구현에 용이하지 않았다. 본 논문에서는 실시간 얼굴검출을 위하여 감시카메라에서 입력된 RGB 영상을 YCbCr 영상으로 변환한 후 연속된 두 영상의 차를 구하고 Glassfire 라벨링을 실시했다. 라벨링 결과 가장 넓은 구역의 면적과 Area 임계치 값을 비교하여 임계값 이상의 면적이면 동작변환으로 인식하고 영상을 추출하였다. 이렇게 추출된 동작변환 영상을 대상으로 얼굴 검출을 실시하였다. 얼굴 검출에 필요한 특징을 추출하기 위해 AdaBoost 알고리즘을 사용하였다.
https://doi.org/10.6109/jkiice.2008.12.5.843 인용 PDF KSCI

스마트 폰 기반 차량 환경에서의 랜덤 포레스트를 이용한 시선 인식 시스템 (Gaze Recognition System using Random Forests in Vehicular Environment based on Smart-Phone)

오병훈;정광우;홍광석
- 한국인터넷방송통신학회논문지
- /
- 제15권1호
- /
- pp.191-197
- /
- 2015
본 논문에서는 스마트 폰 기반 차량 환경에서의 랜덤 포레스트를 이용한 시선 인식 시스템을 제안한다. 제안한 시스템은 Adaboost 알고리즘을 이용한 얼굴 검출, 히스토그램 정보를 이용한 얼굴 구성 요소 추출, 그리고 랜덤 포레스트 알고리즘 기반의 시선 인식으로 구성되어 있다. 카메라로부터 획득한 영상정보를 바탕으로 운전자의 얼굴을 검출하고, 이를 기반으로 운전자의 얼굴 구성 요소를 추정한다. 그리고 추정된 구성 요소로부터 시선 인식에 필요한 특징 벡터를 추출하고, 랜덤 포레스트 인식 알고리즘을 이용하여 9개 방향에 대한 시선을 인식한다. 실험을 위해 실제 환경에서 다양한 시선 방향을 포함하여 DB를 수집하였으며, 실험 결과 얼굴 검출률은 약 82.02%, 시선 인식률은 약 84.77% 성능을 확인하였다.
https://doi.org/10.7236/JIIBC.2015.15.1.191 인용 PDF KSCI

스테레오 시청각 기반의 화자 검출 시스템 (A Speaker Detection System based on Stereo Vision and Audio)

안준호;홍광석
- 인터넷정보학회논문지
- /
- 제11권6호
- /
- pp.21-29
- /
- 2010
본 논문에서 다수의 사용자 중에서 현재 발성하고 있는 화자를 검출하는 스테레오 시청각 기반의 화자 검출 시스템을 제안한다. 제안한 시스템은 두 개의 마이크를 이용한 음원 위치추정, 스테레오 카메라를 이용한 영상정합 및 발화자 후보 위치 추정, 그리고 모바일 기반의 화자 검출 정보 획득으로 구성되어 있다. 스테레오 카메라로부터 획득한 화자의 영상정보를 바탕으로 Adaboost 알고리즘과 Haar-like 특징을 이용하여 발화자 후보들의 얼굴을 검출하고 이를 기반으로 삼각측량법을 이용하여 발화자 후보들의 위치를 추정한다. 그리고 2개의 마이크로부터 획득한 화자의 음성정보를 바탕으로 CPSP(Cross Power Spectrum Phase)기반의 TDOA(Time Differnce of Arrival)추정을 통해 음원의 방향을 추정한다. 최종적으로 스테레오 카메라를 통해 측정된 정보와 마이크를 통해 얻은 정보를 비교 분석하여 현재 발화자를 검출한다. 검출된 화자 정보에 대한 보다 차별화 된 서비스 제공을 위해 TCP 서버/클라이언트 구조 기반의 모바일 화자 검출 정보 획득 시스템을 구현하고 평가하였다.
PDF KSCI

향상된 코덱으로 압축된 프레임에서 고속 얼굴 검출 기법 연구 (Study of Fast Face Detection in Video frames compressed by advanced CODEC)

윤소정;유성근;엄유미
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2014년도 하계학술대회
- /
- pp.254-257
- /
- 2014
최근 얼굴 인식 기술과 하드웨어의 빠른 발전으로 인해 실시간 얼굴 검출이 가능한 다양한 어플리케이션이 제시되고 있다. 특히 네트워크의 발달과 영상 장비의 저 비용화로 IP 기반의 네트워크 감시 카메라와 얼굴 검출 기술을 이용한 스마트 감시 카메라의 요구와 저장된 감시카메라의 영상에서 얼굴 검출을 할 수 있는 스마트 감시 시스템의 요구가 증대되고 있다. 그러나 대부분의 감시 시스템은 네트워크 대역폭과 저장 용량을 감소시키기 위하여 영상을 압축하고 있다. 압축된 영상을 전부 디코딩 하고 모든 프레임에서 얼굴 검출을 하는 것은 시스템 성능 요구사항을 증대시키므로 압축된 영상을 이용한 빠른 얼굴 검출기법이 요구되고 있다. 본 논문은 기존의 Haar like features와 adaboost 학습기 등의 고속화된 얼굴 검출 알고리즘과 모션정보를 이용한 프레임 저감기법을 이용하여 압축된 프레임에서 고속으로 얼굴검출을 하는 방법을 제시하고 방송 응용분야에 대해 논의 하고자 한다.
PDF

비정규 영상의 개선을 위한 LAB 컬러조명보정 (LAB color illumination revisions for the improvement of non-proper image)

나종원
- 한국항행학회논문지
- /
- 제14권2호
- /
- pp.191-197
- /
- 2010
많은 적용과 응용을 하더라도 얼굴 검출의 이미지 분석은 상당히 어렵다. 본 논문으로 불규칙한 조명의 영향으로 미검출되는 얼굴에 조명이 고루 분포되도록 얼굴영역을 검출하였으며, 기존의 정면 얼굴만을 검출하던 결과를 보완하였다. LAB 컬러조명보정으로 기존의 아다부스트 얼굴 검출에 비해 32% 향상된 얼굴검출 결과를 보였다. 입력된 두 영상의 차를 구해 Glassfire 라벨링을 실시했다. Area 임계치 값을 비교하여 임계값 이상의 면적이 되면 제안한 LCFD시스템 알고리즘인 RGB평활화와 LAB영상보정을 하였다. 이렇게 추출된 동작변환 영상을 대상으로 얼굴영역 검출을 실시하였다. 얼굴 검출에 필요한 특징을 추출하기 위해 AdaBoost알고리즘을 사용하였다. 본 논문으로 기울어진 얼굴영역과 멀리 떨어져 있는 얼굴영역, Multi-view 얼굴영역 검출까지 가능하였다. 또한 조명의 방향에 관계없이 높은 검출률을 보였으며, 사용자 인증 분야 등에 일반 PC만으로 적용 가능함이 입증되었다.
PDF KSCI

회전변화에 무관한 실시간 다중 얼굴 검출 엔진 개발 (Development of Rotation Invariant Real-Time Multiple Face-Detection Engine)

한동일;최종호;유성준;오세창;조재일
- 대한전자공학회논문지SP
- /
- 제48권4호
- /
- pp.116-128
- /
- 2011
본 논문에서는 기존의 방법에 비해서 사용되는 메모리의 증가가 없이, 혹은 메모리의 증가를 최소화하는 영상 메모리의 회전 변환 기법을 개발하여 얼굴 회전 변화에 강인한 고성능 실시간 얼굴 검출 엔진 구조를 제안하였으며 FPGA 구현을 통하여 제안 구조의 타당성을 검증하였다. 고성능 얼굴 검출을 위해 기존에 사용하던 조명 변화에 강인한 MCT(Modified Census Transform) 변환 기법과 최적화된 학습데이터 생성을 위한 Adaboost 학습 기법 이외에 얼굴 회전 변환에 강인함을 위한 영상 회전 기법을 이용하였다. 제안한 하드웨어 구조는 색좌표 변환부, 잡음 제거부, 메모리 인터페이스부, 영상 회전부, 크기 조정부, MCT 생성부, 얼굴 후보 검출부/ 신뢰도 비교부, 좌표 재조정부, 데이터 검증부, 검출 결과 표시부/컬러 기반 검출 결과 표시부로 구성되어있다. 구현 및 검증을 위해 Virtex5 LX330 FPGA 보드와 QVGA급 CMOS 카메라, LCD Display를 이용하였으며, 다양한 실생활 환경 및 얼굴 검출 표준 데이터베이스에 대해서 뛰어난 성능을 나타냄을 검증하였다. 결과적으로 실생활 환경에서 초당 60프레임 이상의 속도로 실시간 처리가 가능하며, 조명 변화 및 얼굴 회전 변화에 강인하고, 동시에 32개의 다양한 크기의 얼굴 검출이 가능한 고성능 실시간 얼굴 검출 엔진을 개발하였다.
PDF KSCI

검색결과 106건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)