• 제목/요약/키워드: Beat Recognition

검색결과 13건 처리시간 0.029초

HMM을 이용한 지휘 동작의 인식 (Recognition of Conducting Motion using HMM)

  • 문형득;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.25-30
    • /
    • 2004
  • 본 논문은 지휘자의 지휘 동작으로부터 일련의 영상들을 추출하여 지휘자가 지휘하는 박자를 인식하는 방법을 제안하고 있다 색상판별에 의해서 손의 위치를 감지하였으며 양자화를 통해서 그 위치를 기호화함으로써 지휘 동작을 일련의 기호로 표현하였다. 변형을 포함하는 기호열의 인식에 좋은 결과를 보이는 HMM(Hidden Markov Model)을 사용함으로써 표현된 기호열을 지휘박자로 인식하도록 하는 시스템을 구성하였다.

  • PDF

피아노 연주 로봇의 개발 (Development of Piano Playing Robot)

  • 박광현;정성훈;;;변증남
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.334-336
    • /
    • 2007
  • This paper presents a beat gesture recognition method to synchronize the tempo of a robot playing a piano with the desired tempo of the user. To detect an unstructured beat gesture expressed by any part of a body, we apply an optical flow method, and obtain the trajectories of the center of gravity and normalized central moments of moving objects in images. The period of a beat gesture is estimated from the results of the fast Fourier transform. In addition, we also apply a motion control method by which robotic fingers are trained to follow a set of trajectories, Since the ability to track the trajectories influences the sound a piano generates, we adopt an iterative learning control method to reduce the tracking error.

  • PDF

지휘행동 이해를 위한 손동작 인식 (Hand Gesture Recognition for Understanding Conducting Action)

  • 제홍모;김지만;김대진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.263-266
    • /
    • 2007
  • We introduce a vision-based hand gesture recognition fer understanding musical time and patterns without extra special devices. We suggest a simple and reliable vision-based hand gesture recognition having two features First, the motion-direction code is proposed, which is a quantized code for motion directions. Second, the conducting feature point (CFP) where the point of sudden motion changes is also proposed. The proposed hand gesture recognition system extracts the human hand region by segmenting the depth information generated by stereo matching of image sequences. And then, it follows the motion of the center of the gravity(COG) of the extracted hand region and generates the gesture features such as CFP and the direction-code finally, we obtain the current timing pattern of beat and tempo of the playing music. The experimental results on the test data set show that the musical time pattern and tempo recognition rate is over 86.42% for the motion histogram matching, and 79.75% fer the CFP tracking only.

  • PDF

Determining Key Features of Recognition Korean Traditional Music Using Spectrogram

  • Kim Jae Chun;Kwak Kyung Sup
    • The Journal of the Acoustical Society of Korea
    • /
    • 제24권2E호
    • /
    • pp.67-70
    • /
    • 2005
  • To realize a traditional music recognition system, some characteristics pertinent to Far East Asian music should be found. Using Spectrogram, some distinct attributes of Korean traditional music are surveyed. Frequency distribution, beat cycle and frequency energy intensity within samples have distinct characteristics of their own. Experiment is done for pre-experimentation to realize Korean traditional music recognition system. Using characteristics of Korean traditional music, $94.5\%$ of classification accuracy is acquired. As Korea, Japan and China have the same musical roots, both in instruments and playing style, analyzing Korean traditional music can be helpful in the understanding of Far East Asian traditional music.

Presentation Attack Detection (PAD) for Iris Recognition System on Mobile Devices-A Survey

  • Motwakel, Abdelwahed;Hilal, Anwer Mustafa;Hamza, Manar Ahmed;Ghoneim, Hesham E.
    • International Journal of Computer Science & Network Security
    • /
    • 제21권12spc호
    • /
    • pp.415-426
    • /
    • 2021
  • The implementation of iris biometrics on smartphone devices has recently become an emerging research topic. As the use of iris biometrics on smartphone devices becomes more widely adopted, it is to be expected that there will be similar efforts in the research community to beat the biometric by exploring new spoofing methods and this will drive a corresponding requirement for new liveness detection methods. In this paper we addresses the problem of presentation attacks (Spoofing) against the Iris Recognition System on mobile devices and propose novel Presentation Attack Detection (PAD) method which suitable for mobile environment.

긴장과 이완상태의 자동인식을 위한 SOM의 적용 (Applying of SOM for Automatic Recognition of Tension and Relaxation)

  • 정찬순;함준석;고일주;장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.65-74
    • /
    • 2010
  • 본 연구에서는 비행슈팅게임을 플레이하는 피험자의 긴장 또는 이완상태를 자동으로 인식하는 시스템을 제안한다. 기존 연구에서는 피험자에게 자극원을 제시하여 나타난 변화 값을 비교하기 때문에 자동으로 분류하는데 한계가 있었다. 본 연구에서는 피험자의 상태 변화를 자동으로 분류하여 인식할 수 있도록 비지도학습의 SOM을 적용한다. 긴장과 이완상태의 자동인식을 위한 SOM의 적용은 두 가지 단계로 구성된다. 첫 번째 단계는 ECG측정 및 분석으로 피험자에게 게임을 플레이하게 한 후 ECG를 측정하여 HRV 분석으로 특징벡터를 추출한다. 두 번째 단계는 SOM 학습 및 인식으로 특징이 추출된 심박신호의 입력벡터들을 SOM으로 학습하여 피험자의 긴장과 이완상태를 분류하여 인식 한다. 실험 결과는 세 가지로 나누어진다. 첫 번째, HRV의 주파수변화와 두 번째 심박신호의 SOM 학습결과를 나타냈다. 세 번째 단계는 SOM학습의 성능을 알기 위해서 매칭율을 분석했다. HRV의 주파수분석의 LF/HF 비율을 1.5 기준으로 SOM의 승자뉴런 거리와 매칭한 결과 평균 72%의 매칭율을 보였다.

심전도 신호의 커플링 이미지를 이용한 개인 인식 방법 (Personal Recognition Method using Coupling Image of ECG Signal)

  • 김진수;김성혁;반성범
    • 스마트미디어저널
    • /
    • 제8권3호
    • /
    • pp.62-69
    • /
    • 2019
  • 심전도 신호는 위조가 불가능하며 양쪽 손목에서 신호를 간편히 취득할 수 있는 장점이 있다. 본 논문에서는 심전도 신호의 방향 정보를 이용해 커플링 이미지를 생성하고, 이를 이용한 개인 인식 방법을 제안한다. 제안하는 커플링 이미지는 정방향 심전도 신호와 R-peak를 기준으로 회전된 역방향 심전도 신호를 이용해 생성하며, 생성한 커플링 이미지는 개인별로 고유한 패턴과 명암을 나타낸다. 또한 같은 주기의 심전도 신호 연산을 통해 R-peak 영역 데이터가 증가하여 개인 인식 성능 향상이 가능하다. 생성한 커플링 이미지는 제안한 합성곱 신경망을 이용해 패턴 및 명암에 대한 특징을 추출하며, 네트워크 속도 향상을 위해 다수의 풀링층을 사용해 데이터 크기를 축소한다. 실험은 47명의 공개된 심전도 데이터를 이용하며, 공개된 네트워크 중 top-5 성능이 상위권인 5개 네트워크와 제안한 네트워크를 이용해 비교 실험을 진행한다. 실험 결과 제안한 네트워크의 개인인식 성능이 99.28%로 가장 높게 나타남에 따라, 제안한 커플링 이미지를 이용한 개인 인식 방법이 유효함을 확인하였다.

한국어 음성인식 플랫폼 (ECHOS) 개발 (Development of a Korean Speech Recognition Platform (ECHOS))

  • 권오욱;권석봉;장규철;윤성락;김용래;장광동;김회린;유창동;김봉완;이용주
    • 한국음향학회지
    • /
    • 제24권8호
    • /
    • pp.498-504
    • /
    • 2005
  • 교육 및 연구 목적을 위하여 개발된 한국어 음성인식 플랫폼인 ECHOS를 소개한다. 음성인식을 위한 기본 모듈을 제공하는 BCHOS는 이해하기 쉽고 간단한 객체지향 구조를 가지며, 표준 템플릿 라이브러리 (STL)를 이용한 C++ 언어로 구현되었다. 입력은 8또는 16 kHz로 샘플링된 디지털 음성 데이터이며. 출력은 1-beat 인식결과, N-best 인식결과 및 word graph이다. ECHOS는 MFCC와 PLP 특징추출, HMM에 기반한 음향모델, n-gram 언어모델, 유한상태망 (FSN)과 렉시컬트리를 지원하는 탐색알고리듬으로 구성되며, 고립단어인식으로부터 대어휘 연속음성인식에 이르는 다양한 태스크를 처리할 수 있다. 플랫폼의 동작을 검증하기 위하여 ECHOS와 hidden Markov model toolkit (HTK)의 성능을 비교한다. ECHOS는 FSN 명령어 인식 태스크에서 HTK와 거의 비슷한 인식률을 나타내고 인식시간은 객체지향 구현 때문에 약 2배 정도 증가한다. 8000단어 연속음성인식에서는 HTK와 달리 렉시컬트리 탐색 알고리듬을 사용함으로써 단어오류율은 $40\%$ 증가하나 인식시간은 0.5배로 감소한다.

FM 방송 중 블록 단위 음성 음악 판별 시스템의 설계 및 구현 (Design and Implementation of Speech Music Discrimination System per Block Unit on FM Radio Broadcast)

  • 장현종;엄정권;임준식
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.25-28
    • /
    • 2007
  • 본 논문은 FM 라디오 방송의 오디오 신호를 블록 단위로 음성 음악을 판별하는 시스템을 제안하는 논문이다. 본 논문에서는 음성 음악 판별 시스템을 구축하기 위해 다양한 특정 파라미터와 분류 알고리즘을 제안 한다. 특정 파라미터는 신호처리 분야(Centroid, Rolloff, Flux, ZCR, Low Energy), 음성 인식 분야(LPC, MFCC), 음악 분석 분야(MPitch, Beat)에서 각각 사용되는 파라미터를 사용하였으며 분류 알고리즘으로는 패턴인식 분야(GMM, KNN, BP)와 퍼지 신경망(ANFIS)을 사용하였고, 거리 구현은 Mahalanobis 거리를 사용하였다.

  • PDF

키넥트를 이용한 인간 움직임의 주파수 예측 및 이를 활용한 응용 프로그램 구현 (Frequency Estimation of Human Movements Using Kinect and Its Application)

  • 서명규;김상엽;주장복;이철
    • 한국멀티미디어학회논문지
    • /
    • 제20권8호
    • /
    • pp.1248-1257
    • /
    • 2017
  • We propose a frequency estimation algorithm of human movements using Kinect. We collect the 3D coordinates of the joints of a human body and then obtain the frequency-domain description of the movements using the discrete Fourier transform (DFT). By choosing the frequency with the biggest magnitude in the selected frequencies of each of human's joint, we obtain the major beat of the human movements. Experimental results show that the proposed algorithm accurately estimates the frequency of human movements. We expect that the proposed algorithm would be applied to many AR and VR applications as a preprocessing.