• 제목/요약/키워드: Automatic Music Genre Classification

검색결과 12건 처리시간 0.025초

음악 장르 분류를 이용한 자동차 오디오 시스템에서의 이퀄라이저 자동 조절 방식 (Automatic Equalizer Control Method Using Music Genre Classification in Automobile Audio System)

  • 김형국;남상순
    • 한국ITS학회 논문지
    • /
    • 제8권4호
    • /
    • pp.33-38
    • /
    • 2009
  • 본 논문은 자동차 오디오 시스템에 내장된 라디오에서 실시간으로 재생되는 연속적인 오디오 신호로부터 음악 신호를 선별하고, 해당 음악에 대한 실시간 음악장르 분류를 통해 자동으로 이퀄라이저를 조절하는 방식을 제안한다. 제안된 방식에서는 음악분류 정확도를 높이고 실시간 신호처리를 실행하기 위해 연속적인 오디오 신호로부터 추출한 음색 특징 벡터와 리듬 특징 벡터를 GMM (Gaussian mixture model) 분류 방식에 적용하여 음악 분류를 수행한다. 제안된 방식은 카오디오 시스템의 라디오로부터 출력된 오디오 신호로부터 분할된 다양한 오디오 구간을 5가지 음악장르로 분류하여 음악 장르 분류 성능을 측정하였다.

  • PDF

생성적 적대 신경망(GAN)을 이용한 딥러닝 음악 장르 분류 시스템 모델 개선 (Deep Learning Music Genre Classification System Model Improvement Using Generative Adversarial Networks (GAN))

  • 배준
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.842-848
    • /
    • 2020
  • 아이튠즈, 스포티파이, 멜론 등 음악시장은 바야흐로 스트리밍의 시대로 접어들었고, 음악 소비자의 취향에 맞는 음악 선곡과 제안을 위해 음악장르 자동 구분 시스템에 대한 요구와 연구가 활발하다. 이전 논문에서 제안한 소프트 맥스를 이용한 딥러닝 음악장르 자동구분 투표 시스템을 더욱 발전시켜 생성적 적대 신경망(GAN)을 이용하여 이전 시스템의 미흡한 점이었던 장르 미분류 곡들에 대한 정확도를 높이는 방법을 제안한다. 이전 연구에서는 전체 곡을 작은 샘플 로 나누고 각각의 샘플을 CNN 분석하여 그 결과들의 총합으로 장르 구분을 하는 투표 시스템으로 곡 장르분류 정확도를 높일 수 있었다. 하지만 곡의 스펙트로그램이 곡의 장르를 파악하기에 모호한 곡의 경우에는 미분류 곡으로 남겨놓을 수밖에 없었다. 이 논문에서는 생성적 적대 신경망을 이용하여 미분류 곡의 스펙트로그램을 판독하기 쉬운 장르의 스펙트로그램으로 바꾸어 미분류 곡의 장르 구분 정확도를 높이는 시스템을 제안하고 그 실험결과 기존 방식에 비해 우수한 결과를 도출해낼 수 있었다.

Decorrelated Filter Bank를 이용한 음악 장르 분류 시스템 (Music Genre Classification System Using Decorrelated Filter Bank)

  • 임신철;장세진;이석필;김무영
    • 한국음향학회지
    • /
    • 제30권2호
    • /
    • pp.100-106
    • /
    • 2011
  • 음원의 디지털화가 진행되면서 음악 데이터베이스가 방대해지고 있다. 따라서, 음악 데이터를 보다 효과적으로 관리하기 위해 음악의 특성에 따라 장르별로 자동 분류해주는 시스템이 필요하다. 기존 장르 분류 시스템은 대부분 Mel-Frequency Cepstral Coefficient (MFCC)를 특징 벡터로 이용하고 있다. 본 논문에서는 Auditory Filter Bank를 이용한 Decorrelated Filter Bank (DFB)와 Octave-based Spectral Contrast (OSC)에 texture window를 적용하여 특징을 추출한 후, Support Vector Machine (SVM)을 이용하여 장르 분류를 시도하였다. 기존의 Marsyas 장르 분류 시스템과 비교한 결과 DFB와 OSC로 복합적인 특징 벡터를 구성하면 더 적은 차수의 특징벡터를 사용함에도 4.2 %의 향상된 분류 성공률을 얻을 수 있었다.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

소프트맥스를 이용한 딥러닝 음악장르 자동구분 투표 시스템 (Deep Learning Music genre automatic classification voting system using Softmax)

  • 배준;김장영
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.27-32
    • /
    • 2019
  • 인간이 가진 뛰어난 능력 중의 하나인 곡 분류 과정을 딥러닝 알고리즘을 통해 구현하는 연구는 단일데이터를 이용한 유니모달 모델, 멀티모달 모델, 뮤직비디오를 이용한 멀티모달 방식 등이 있다. 이 연구에서는 곡의 스펙트로그램을 짧은 샘플들로 분할하여 각각을 CNN으로 분석한 뒤 그 결과를 투표하는 시스템을 제안하여 더 좋은 결과를 얻었다. 딥러닝 알고리즘 중 CNN이 RNN에 비해 음악 장르 구분에 있어 우수한 성능을 보였으며 CNN과 RNN을 같이 적용했을 때 성능이 좋아짐을 알 수 있었다. 음악샘플을 나누어 각각의 CNN 결과를 투표하는 시스템이 이전 모델에 비해 좋은 결과를 나타내었고 이 모델에 Softmax 레이어를 추가한 모델이 가장 좋은 성능을 보였다. 디지털 미디어의 폭발적인 성장과 수많은 스트리밍 서비스 속에서 음악장르의 자동분류에 대한 필요는 점점 증가하고 있는 추세이다. 향후 연구에서는 미분류 곡의 비율을 낮추고 최종적으로 미분류된 곡들의 장르구분에 대한 알고리즘을 개발할 필요가 있을 것이다.

MPEG 부호화 영역에서 Video Genre 자동 분류 방법 (Automatic Video Genre Classification Method in MPEG compressed domain)

  • 김태희;이웅희;정동석
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.836-845
    • /
    • 2002
  • Video Summary는 길이가 긴 Video를 고속으로 효율적으로 열람할 수 있도록 하는 도구의 하나이다. Video Summary는 대표 프레임(Key-frame)들의 집합으로 볼 수 있는데 대표 프레임은 Video의 Genre에 따라서 달리 정의 및 생성될 수 있다. 즉 모든 Genre의 Video에 대해서 획일적인 방법으로 Summary를 만드는 것은 적절하지 못한 결과를 초래할 수 있다. Video의 Genre를 구별해내는 기술은 위와 같이 효율적인 Video Summary 생성에 유용한 처리 과정이라 할 수 있다. 본 논문에서는 이와 같이 효율적 Video 관리를 위해 MPEG 부호화 영역에서 MPEG Video의 Genre를 분류하는 방법을 제안한다. 제안된 방법은 프레임을 복호하지 않고 비트스트림을 직접 처리하여 기존 방법들에 비해 계산이 비교적 단순하고 처리시간을 단축시키는 장점을 가지고 있다. 또한 제안된 방법은 대부분의 작업을 시각 정보만을 이용하여 수행하며 이 정보들의 시, 공간적 해석을 통해 Genre를 확인하게 된다. 실험은 만화(Cartoon), 광고(Commercial), Music Video, 뉴스, Sports, Talk Show의 6개 Genre Video에 대하여 실행하였다. 실험 결과, 구조가 명확한 Talk Show와 Sports의 경우 90% 이상의 결과를 얻었다.

지능형 오디오 그래픽 이퀄라이저 시스템 구현 (Implementation of an Intelligent Audio Graphic Equalizer System)

  • 이강규;조윤호;박규식
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.76-83
    • /
    • 2006
  • 오디오 이퀄라이저의 주목적은 사용자가 원하는 음색을 낼 수 있도록 음악의 주파수 특성을 변환 하는 것으로 대형 오디오시스템으로부터 휴대용 MP3플레이어까지 음악을 재생하는 대부분의 기기에 사용되고 있다. 현재까지는 각 음악 장르에 적합한 음색을 재생하기위해 사용자가 각 이퀄라이저 주파수 대역 별로 일일이 수동으로 조절해 주어야 한다는 불편함이 있다. 본 논문에서는 내용기반 음악 장르 분류 기술을 이용하여 음악 장르를 분류하고, 분류된 장르에 알맞은 이퀄라이저를 자동으로 적용하여 주는 지능형 오디오 그래픽 이퀄라이저 시스템을 제안하였다. 이퀄라이져의 경우 초기 음악 재생 중 이퀄라이저 적용에 의한 갑작스런 음의 변화를 방지하기 위하여 Coarse Level과 Fine Level의 2단계 장르분류 절차를 거치면서 각 단계별 이퀄라이저를 적용 하였다. 제안된 시스템의 각 단계별 분류 성공률은 약 80%에 이르며, 2초 안에 모든 동작이 이루어지는 것을 확인 하였다. 제안된 시스템은 PC상에서 비주얼 C 을 이용하여 3-밴드 지능형 이퀄라이저의 SW GUI를 구현 하였다.

Automatic Video Genre Identification Method in MPEG compressed domain

  • Kim, Tae-Hee;Lee, Woong-Hee;Jeong, Dong-Seok
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1527-1530
    • /
    • 2002
  • Video summary is one of the tools which can provide the fast and effective browsing fur a lengthy video. Video summary consists of many key-frames that could be defined differently depending on the video genre it belongs to. Consequently, the video summary constructed by the uniform manner might lead into inadequate result. Therefore, identifying the video genre is the important first step in generating the meaningful video summary. We propose a new method that can classify the genre of the video data in MPEG compressed bit-stream domain. Since the proposed method operates directly on the com- pressed bit-stream without decoding the frame, it has merits such as simple calculation and short processing time. In the proposed method, only the visual information is utilized through the spatial-temporal analysis to classify the video genre. Experiments are done for 6 genres of video: Cartoon, Commercial, Music Video, News, Sports, and Talk Show. Experimental result shows more than 90% of accuracy in genre classification for the well-structured video data such as Talk Show and Sports.

  • PDF

상황인지 음악추천을 위한 음악 분위기 검출 (Detection of Music Mood for Context-aware Music Recommendation)

  • 이종인;여동규;김병만
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.263-274
    • /
    • 2010
  • 상황인지 음악추천 서비스를 제공하기 위해서는 무엇보다 상황 또는 문맥에 따라 사용자가 선호하는 음악의 분위기를 파악할 필요가 있다. 음악 분위기 검출에 대한 기존 연구의 대부분은 수작업으로 대표구간을 선정하고, 그 구간의 특징을 이용하여 분위기를 판별한다. 이러한 접근 방법은 분류 성능이 좋은 반면 전문가의 간섭을 요구하기 때문에 새로운 음악에 대해서는 적용하기 어렵다. 더욱이, 곡의 진행에 따라 음악 분위기가 달라지기 때문에 음악의 대표 분위기를 검출하는 것이 더욱 어려워진다. 본 논문에서는 이러한 문제점들을 보완하기 위해 음악 분위기를 자동으로 판별하는 새로운 방법을 제안하였다. 먼저 곡 전체를 구조적 분석 방법을 통하여 비슷한 특성을 갖는 세그먼트들로 분리한 후 각각에 대해 분위기를 판별한다. 그리고 세그먼트별 분위기 파악 시 Thayer 의 2차원 분위기 모델에 기초한 회귀분석 방법으로 개인별 주관적 분위기 성향을 모델링하였다. 실험결과, 제안된 방법이 80% 이상의 정확도를 보였다.

A New Tempo Feature Extraction Based on Modulation Spectrum Analysis for Music Information Retrieval Tasks

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.95-106
    • /
    • 2007
  • 본 논문은 음악 정보검색에 사용되는 효과적인 템포 특징 추출방식을 제안한다. 제안된 템포 정보는 협소 밴드상의 일시적인 변조 성분에 의해 형성된다. 이러한 변조 성분은 시간 축 상의 음악 신호로부터 스펙트럼을 구한 후, 각 스펙트럼 성분에 대한 주파수 영역 분석을 통해 획득된 변조 스펙트럼으로 구성된다. 실제 구현에 있어서는 MP3 음악파일로부터 부분 디코딩에 의해 출력된 변형된 이산 코사인 변환 계수에 퓨리에 변환을 취하여 변조스펙트럼을 구하였다. 획득된 변조 스펙트럼의 진폭으로부터 고속으로 추출된 음악 템포 특징값은 다양한 음악 정보 검색에 적용되었다. 음악 무드 및 장르 분류에서는 로그 변조 주파수 계수를 적용하여 분류 성능을 개선시켰으며, 적응 변조 스펙트럼에서 유도된 비트 벡터는 오디오 핑거프린팅에 적용되어 잡음환경 하에서도 검색 성능을 크게 향상시켰다.

  • PDF