• 제목/요약/키워드: Music source

검색결과 146건 처리시간 0.025초

상황인식 및 음원 속성에 따른 공간 설치형 음악 추천 시스템, DJ로봇 (Music Recommendation System in Public Space, DJ Robot, based on Context-awareness and Musical Properties)

  • 김병오;한동숭
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.286-296
    • /
    • 2010
  • DJ로봇 개발을 위한 연구는 디지털과 네트워크의 시대를 맞이하여 매우 빠른 속도로 변화하고 있는 대중들의 음악 서비스 요구에 부응하기 위한 것이다. 기존의 연구들은 대체적으로 개인화된 환경, 개인화된 장비를 전제로 음악 서비스 개발에 나서고 있지만 DJ로봇은 공공이 공유하는 공간을 전제로 삼고 있다. DJ로봇은 우리나라 전통적 공간과 전통 음악을 우선적으로 한다. 최근 한국 문화에 대한 외국의 호의와 수요가 확대됨에 따라 우리 전통 혹은 고유한 특질에 기초한 콘텐츠의 산업적 활용 가치가 점점 높아지고 있기 때문이다. 한편, DJ로봇은 외부 환경 변화를 감지하는 방식과 심리학, 감성공학 등에 의한 음악의 속성을 설정하는 방식의 결합으로 구성되어 있다. 설치 공간의 온도, 습도, 조도, 풍속, 소음 등의 환경 요소를 측정 및 적용하고 헤브너의 감성분류법에 기초하여 감성공학에 의한 반복적인 실험과 검증을 통해 음원의 객관성을 확보할 것이다. DJ로봇은 전통 공간의 사운드스케이프를 아름답게 변화시키는 동시에 수용자 감성과 연계된 전통음악 BGM의 활용을 통하여 아직까지 극소수 사람들 사이에서만 소통되고 있는 전통음악을 보다 다양하고 적극적인 기능을 지닌 문화콘텐츠로 재탄생 시키는 일에 기여할 것이다.

Multi-channel Speech Enhancement Using Blind Source Separation and Cross-channel Wiener Filtering

  • Jang, Gil-Jin;Choi, Chang-Kyu;Lee, Yong-Beom;Kim, Jeong-Su;Kim, Sang-Ryong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권2E호
    • /
    • pp.56-67
    • /
    • 2004
  • Despite abundant research outcomes of blind source separation (BSS) in many types of simulated environments, their performances are still not satisfactory to be applied to the real environments. The major obstacle may seem the finite filter length of the assumed mixing model and the nonlinear sensor noises. This paper presents a two-step speech enhancement method with multiple microphone inputs. The first step performs a frequency-domain BSS algorithm to produce multiple outputs without any prior knowledge of the mixed source signals. The second step further removes the remaining cross-channel interference by a spectral cancellation approach using a probabilistic source absence/presence detection technique. The desired primary source is detected every frame of the signal, and the secondary source is estimated in the power spectral domain using the other BSS output as a reference interfering source. Then the estimated secondary source is subtracted to reduce the cross-channel interference. Our experimental results show good separation enhancement performances on the real recordings of speech and music signals compared to the conventional BSS methods.

커널 스펙트럼 모델 backfitting 기반의 로그 스펙트럼 진폭 추정을 적용한 배경음과 보컬음 분리 (Music and Voice Separation Using Log-Spectral Amplitude Estimator Based on Kernel Spectrogram Models Backfitting)

  • 이준용;김형국
    • 한국음향학회지
    • /
    • 제34권3호
    • /
    • pp.227-233
    • /
    • 2015
  • 본 논문은 커널 스펙트럼 모델 backfitting 기반의 로그 스펙트럼 진폭 추정부를 적용한 배경음과 보컬음 분리를 제안한다. 기존의 커널 스펙트럼 모델 기반의 배경음과 보컬음 분리는 추출하고자하는 객체의 모델을 기반으로 위너형태의 평균 제곱의 오차의 이득값을 학습함으로써 배경음과 보컬음을 분리하는 기술이다. 본 논문은 기존의 커널 스펙트럴 모델 기반의 배경음과 보컬음 분리 방식에서 위너형태의 이득값 대신 로그 스펙트럼 진폭 추정을 적용하여 기존 방식 보다 명료한 배경음과 보컬음을 추출한다. 실험결과는 본 논문에서 제안한 방식이 기존의 방식들보다 더 우수하다는 것을 보인다.

빔공간-영역 다채널 비음수 행렬 분해 알고리즘을 이용한 음원 분리 기법 Part II: 빔공간-변환 기법에 대한 고찰 (Audio Source Separation Method based on Beamspace-domain Multichannel Non-negative Matrix Factorization, Part II: A Study on the Beamspace Transform Algorithms)

  • 이석진;박상하;성굉모
    • 한국음향학회지
    • /
    • 제31권5호
    • /
    • pp.332-339
    • /
    • 2012
  • 빔공간 변환(beamspace transform) 기법은 공간 영역의 신호를 입사각 혹은 그 사인함수의 영역으로 변환하는 기법으로, MUSIC과 같은 음원 정위 및 추적(source localization and tracking) 문제나 적응 빔형성(adaptive beamforming)과 같은 문제에서 많이 사용되는 기법이다. 다채널 음원 분리 기법에 사용될 때에는, 음원의 정보 뿐만아니라 해당 음원의 이미지(image)를 재구성하여야 하므로 역변환 기법 또한 중요하다. 본 논문에서는 멀티 채널 음원 분리 기법을 위한 빔공간 변환 기법과 그 역변환 기법에 대하여 고찰하였으며, 특히 빔공간-영역 다채널 비음수 행렬 분해 기법에 적용되었을 때 그 성능에 미치는 영향을 중점적으로 살펴보았다.

Harmonic and Percussive Separation Based on NMF and Tonality Mask

  • Choi, Keunwoo;Chon, Sang Bae;Kang, Kyeongok
    • ETRI Journal
    • /
    • 제34권6호
    • /
    • pp.958-961
    • /
    • 2012
  • In this letter, we present a new algorithm for the harmonic and percussive separation of jazz music. Using a short-time Fourier transform and nonnegative matrix factorization, the signal is decomposed into rank components. Each component is then split into harmonic and percussive parts using masks calculated based on their tonalities. Finally, the harmonic and percussive parts are separated after applying the masks and a summation. We evaluate the algorithm based on real audio examples using both objective and subjective assessments. The proposed algorithm performs well for the separation of harmonic and percussive parts of jazz excerpts.

타악기 음원 분리에 기반한 모노-스테레오 업믹싱 기법 (A Mono-To-Stereo Upmixing Algorithm Based on the Harmonic-Percussive Separation)

  • 최근우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.60-63
    • /
    • 2013
  • In this research, a mono-to-stereo upmixing algorithm based on music source separation is proposed. For the upmixing, a harmonic and percussive separation for jazz music is implemented. Then, the sources are re-panned by equalizing the loudness of left and right sides of listeners in the one proposed approach. In the other approach, the harmonic sources are spread by a decorrelator while the percussive sources are panned to the center. In the experiments, the re-panning algorithm showed advanced performance in terms of localization and timbral quality.

  • PDF

대구 패션 소비자의 구매성향 분석 - 동성로 야시골목을 중심으로 - (An Analysis on Shopping Orientations of Small Store User in Yhasi street of Dong-Sung Ro, Daegu)

  • 김정원
    • 한국의류산업학회지
    • /
    • 제3권1호
    • /
    • pp.61-69
    • /
    • 2001
  • The purpose of this study was to analyze the purchasing behavior related factors of Small Store User in Yhasi street of Dong-Sung Ro, Daegu. Frequency, $X^2$-test MANOVA, ANOVA and Duncan multiple range test were used to analyze the sample. The results of this study were as follows: 1) The largest sample were as follows: un married female, college students of twenties, 101-200 thousand won for salaries. 2) The factors of purchasing behavior were classified into 8 factors, enjoy shopping, store image, unique goods, culture space, salesperson, low price, information seeking, value via price orientation. 3) There were significant differences found between attitude on information source, number of seeking store, music in shop, music sound, size, display, price, street, in their factors of purchasing behavior (unique goods, value via price, low price, store image, enjoy shopping) 4) There were significant differences found between demographic characteristics (personal sales, location, transportation) in their factors of purchasing behavior (salesperson, cultural space, store image).

  • PDF

사운드스케이프 적용을 위한 옥외 P.A. 시스템 적정 인지레벨에 관한 실험적 연구 (An Experimental Study on the Optimistic Recognition Level of Public Address System as a Soundscape Application Facility)

  • 송민정;장길수;신훈;신용규;이태강
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 춘계학술대회논문집
    • /
    • pp.726-729
    • /
    • 2006
  • As a active soundscape facility, P.A. system is a useful instrument to give place identity and vitality by letting out music, environmental music, bird singing sound etc. In this study, to know the optimistic distance and sound level range of introducing sound, sound levels due to distance were measured and subject responses were checked by questionnaire. Levels from 64dB to 71dB are recommended by subjects. And the optimistic level of introducing level is related with level variance of sound source. The results of this study could used for street furniture location design and P.A. system output level.

  • PDF

음향 홀로-그래피에서 빔 형성을 이용한 부분 음장 분리 (Beamforming-based Partial Field Decomposition in Acoustical Holography)

  • 황의석;조영만;강연준
    • 한국소음진동공학회논문집
    • /
    • 제11권6호
    • /
    • pp.200-207
    • /
    • 2001
  • In this paper, a new method for Partial field decomposition is developed that is based on the beamforming algorithm for the application of acoustical holography to a composite sound field generated by multiple incoherent sound sources. In the proposed method, source Positions are first predicted by MUSIC(multiple signal classification) algorithm. The composite sound fields can then be decomposed into each partial field by the beamforming. Results of both numerical simulations and experiments show that the method can find each partial field very accurately and effectively, and that it also has Potential to be used for application to distributed sources.

  • PDF

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.