• 제목/요약/키워드: music enhancement

검색결과 50건 처리시간 0.032초

변별적 가중치 학습을 이용한 3GPP2 SVM의 실시간 음성/음악 분류 성능 향상 (Enhancement of Speech/Music Classification for 3GPP2 SMV Codec Employing Discriminative Weight Training)

  • 강상익;장준혁;이성로
    • 한국음향학회지
    • /
    • 제27권6호
    • /
    • pp.319-324
    • /
    • 2008
  • 본 논문에서는 변별적 가중치 학습 (discriminative weight training) 기반의 3GPP2 Selectable Mode Vocoder (SMV) 실시간 음성/음악 분류 성능을 향상 시키는 방법을 제안한다. SMV의 음성/음악 실시간 분류 알고리즘에서 사용된 특징벡터와 분류방법을 분석하고, 이를 기반으로 분류성능향상을 위해 MCE (minimum classification error)방법을 도입하여, 각 특징 백터별로 다른 가중치를 적용하는 음성/음악 결정법 (decision rule)을 제시한다. 구체적으로 SMV의 음성/음악 분류알고리즘에서 사용되어진 특징벡터만을 선택적으로 사용하여 가중치를 적용한 값을 기하 평균한 값을 문턱값과 비교하는 실시간 분류기법이 제시되었다. SMV의 음성/음악 분류에 제안한 방법의 성능 평가를 위해 SMV 원래의 분류알고리즘과 비교하였으며, 다양한 음악장르에 대해 시스템의 성능을 평가한 결과 가중치를 적용하였을 때 기존의 SMV의 방법보다 우수한 음성/음악 분류 성능을 보였다.

신경망 기반 음원 분리 시스템의 학습 속도 향상을 위한 음역대 강조 기법 (Frequency Range Enhancement for Faster Convergence of Neural Music Source Separation Systems)

  • 김민석;최우성;정순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.567-569
    • /
    • 2020
  • 여러 악기가 섞여 있는 음원으로부터 원하는 악기 소리를 추출하는 음원 분리 기법 중 최근 신경망 기반 시스템이 활발히 연구되고 있다. 악기마다 고유의 음역대를 가진다는 사실에 감안하여, 연구진은 기존 음원 분리 신경망에 적은 수의 학습 파라미터를 추가하여 학습 속도를 대폭 향상시킬 수 있는 음역대 강조 기법을 제안한다.

사회적 배려대상 음악영재의 환경요인 특징 탐색 (Exploring the Characteristics of Environmental Catalysts of the Disadvantaged Gifted in Music)

  • 김성혜;이경진
    • 영재교육연구
    • /
    • 제24권4호
    • /
    • pp.629-655
    • /
    • 2014
  • 본 연구의 목적은 영재성에 영향을 미치는 것으로 규명된 환경요인이 사회적 배려대상 음악영재에게는 어떻게 영향을 미치는지 그 특징을 탐색하는 것이다. 이를 위해 사회적 배려대상 음악영재 19명을 대상으로 설문 형식의 자기평가와 자기소개서, 면담 자료를 수집하고, 주로 면담 자료를 Gagn$\acute{e}$의 환경요인을 기반으로 그 특징을 분석하였다. 연구결과, 사회적 배려대상 음악영재의 주변 환경은 대체로 학생들의 음악활동과 학습에 좋은 자극을 주지 못했다. 그리고 부모가 음악에 대해 많은 관심을 가지고 경제적 심리적 지원을 하지만 음악영재성에 대한 잘못된 인식과 조언 등을 제공하여 부정적인 영향을 미치기도 했다. 또한 사회적 배려대상 음악영재들은 자신을 가르치는 교사가 전문성이 부족하다고 인식하고 있었고, 대부분의 연구대상이 이수중인 지역교육프로그램과 학교 방과후 프로그램은 음악영재교육의 특성을 갖추지 못하고 있었다. 그리고 음악영재에게 중요한 수상 경험이나 연주기회, 결정경험이 충분히 이루어지지 못했다. 이러한 연구결과를 기반으로, 사회적 배려대상 음악영재에 대한 사회적 인식의 개선, 부모교육의 필요성, 음악영재 교사교육 강화, 음악영재성 계발을 위한 프로그램 개발 및 보급, 학습동기와 성취동기 고취를 위한 다양한 기회 제공 등을 위한 정책을 제언하였다.

차량환경에서 음성명령어기 사용을 위한 음성개선방법 (Speech Enhancement for Voice commander in Car environment)

  • 백승권;한민수;남승현;이봉호;함영권
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.9-16
    • /
    • 2004
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다 특히 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단일 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman 필터를 이용하여 시간상 단구간 정적 잡음을 제거한다. 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다.

Multi-channel Speech Enhancement Using Blind Source Separation and Cross-channel Wiener Filtering

  • Jang, Gil-Jin;Choi, Chang-Kyu;Lee, Yong-Beom;Kim, Jeong-Su;Kim, Sang-Ryong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권2E호
    • /
    • pp.56-67
    • /
    • 2004
  • Despite abundant research outcomes of blind source separation (BSS) in many types of simulated environments, their performances are still not satisfactory to be applied to the real environments. The major obstacle may seem the finite filter length of the assumed mixing model and the nonlinear sensor noises. This paper presents a two-step speech enhancement method with multiple microphone inputs. The first step performs a frequency-domain BSS algorithm to produce multiple outputs without any prior knowledge of the mixed source signals. The second step further removes the remaining cross-channel interference by a spectral cancellation approach using a probabilistic source absence/presence detection technique. The desired primary source is detected every frame of the signal, and the secondary source is estimated in the power spectral domain using the other BSS output as a reference interfering source. Then the estimated secondary source is subtracted to reduce the cross-channel interference. Our experimental results show good separation enhancement performances on the real recordings of speech and music signals compared to the conventional BSS methods.

음악중재 청소년 금연교실 파일럿 연구: 포커스 그룹 인터뷰 (Using Focus Group Interview to Explore the Effectiveness of Adolescent Smoking Cessation Program with Music Therapy)

  • 황명희송
    • 보건교육건강증진학회지
    • /
    • 제27권4호
    • /
    • pp.131-139
    • /
    • 2010
  • Objectives: This pilot study was designed to examine whether the adolescent smoking cessation program with harmonica therapy was effective or not. It was qualitatively explored perceived smoking consequences, cessation and relapse experience, specific harmonica help to overcome smoking urge, preference of harmonica toward cessation, and harmonica intervention planning to quit. Methods: The treatment program was conducted 30-minute, 6-session, and once a week basis. Qualitative data using Focus Group Interview were collected at the completion of the program with 6 participants, and analyzed by Krueger's systematic process. Results: Participants were smoking daily and consumed 3-10 cigarettes. They recognized undesirable smoking consequences in terms of cost, interpersonal relationship, and health that might lead to cessation attempts in the past. Participants who did not want to quit smoking at the program beginning changed their attitude to quit after exploring partial cessation efforts with the help of harmonica therapy. They believe harmonica's consistent help of quitting and leading to success. Conclusion: Adolescent attitudinal change toward smoking cessation has promising insight of motivation enhancement through harmonica therapy that was a major barrier to successful quit.

음성통신망에서 디지털 오디오 신호 음질개선을 위한 전처리방법 (Preprocessing method for enhancing digital audio quality in speech communication system)

  • 송근배;안철용;김재범;박호종;김석호
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.200-206
    • /
    • 2006
  • 본 논문은 음성 부호화기에서 입력 오디오 신호가 보다 효과적으로 처리되도록 하기 위해 입력오디오신호를 전 처리하는 방법을 소개한다. 이를 위해 본 논문은 잡음억제 및 적응이득제어 방법을 도입한다. 여기서 입력 오디오 신호는 잡음 부가된 신호로 간주되며 그 오디오 신호의 부호화오차신호는 부가된 잡음신호로 간주된다. 입력 오디오 신호는 기존의 잡음억제방식에 따라 잡음신호 즉, 부호화 오차신호가 억제된 뒤 적응이득제어기를 거쳐 최종적으로 음성 부호화기에 인가된다. 결과적으로 이러한 동작을 통하여 입력 오디오 신호의 주파수 스펙트럼 분포가 음성 부호화기 특성에 맞게 재배치된다 이 방법의 하나의 단점은 부호화 오차를 계산하기 위해 사전에 추가적인 부호화 동작이 필요하다는 것이다. 반면, 이 방법은 일반적인 구조를 가지고 있으며 따라서 기존의 여러 음성부호화기에 쉽게 적용될 수 있다는 장점을 가진다. 주관적인 선호도 조사결과 제안된 방법이 복잡한 음악신호로 기인한 성가신 잡음을 사전에 억제해 주며 결과적으로 음질개선을 가져다준다는 것을 확인할 수 있었다.

스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠의 명료도 향상 (Intelligibility Enhancement of Multimedia Contents Using Spectral Shaping)

  • 지유나;박영철;황영수
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.82-88
    • /
    • 2016
  • 본 논문에서는 스펙트럼 성형기법을 이용한 멀티미디어 콘텐츠 명료도 향상 알고리즘을 제안한다. 영화, 동영상과 같은 오디오-비주얼 미디어 콘텐츠에서 다이얼로그는 영상의 내용을 이해하기 위한 중요한 요소이다. 하지만 종종 영상내의 효과음, 배경음악 등과 같이 함께 믹싱 된 오디오 성분에 의해 중요한 정보를 지닌 다이얼로그의 명료도가 떨어지는 문제점이 제기되어왔다. 뿐만 아니라 멀티미디어 콘텐츠의 이용 환경이 다양해지면서 청자의 주변 환경 또한 오디오 볼륨에 영향을 미치는 요소가 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 영상의 중요 단서를 담고 있는 사운드트랙의 음성 성분 명료도를 높이고자 한다. 제안된 알고리즘은 먼저 영상의 스테레오 오디오 신호에서 음성 존재 확률(Speech Presence Probability)을 이용한 소프트 마스커를 통해 다이얼로그 성분을 검출한다. 추출된 다이얼로그 성분은 스펙트럼 성형 기법을 적용하여 명료도에 중요한 영향을 미치는 고주파대역의 성분을 증폭시키는 등 음성 신호 스펙트럼의 에너지를 재분배하여 신호의 명료도를 향상 시켰다. 마지막으로 크기 정규화 과정을 통해 프로세스 전과 후의 전체 오디오의 파워를 동일하게 유지함으로써 증폭으로 인한 스피커의 오디오 포화(saturation)를 방지하였다. 실험을 통해 본 알고리즘이 동일한 오디오 볼륨에서 영상의 명료도를 향상시킴을 확인 할 수 있었다.

위상차와 음압 레벨차를 이용한 텔레비전에서의 스테레오 음상 확대 (Stereo Sound Image Expansion Using Phase Difference and Sound Pressure Level Difference in Television)

  • 박해광;오제화
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1243-1246
    • /
    • 1998
  • Three-dimensional(3-D) sound is a technique for generating or recreating sounds so they are perceived as emanating from locations in a three-dimensional space. Three dimensional sound has the potential of increasing the feeling of realism in music or movie soundtracks. Three-dimensional sound effects depend on psychoacoustic spectral and phase cues being presented in a reproduced signal. In this paper we propose an effective algorithm for the sound image expansion in television system using stereo image enhancement techniques. Compared to the other techniques of three-dimensional sound, the proposed algorithm use only two speakers to enhance the sound image expansion, while maintaining the original sound characteristics.

  • PDF

열차 승객을 위한 멀티미디어콘텐츠 및 인터넷 검색 시스템 설계에 관한 연구 (Design of Multimedia Contents and Internet Search System for Passenger in Train)

  • 장덕진;강송희;박현휴;강대호;허재석;송달호
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2010년도 춘계학술대회 논문집
    • /
    • pp.442-447
    • /
    • 2010
  • For the remarkable enhancement of high-speed rail passenger services, a system which provides various multimedia contents and Internet search functions was designed. The system gets inputs from a passenger and displays various multimedia contents on the touch sensitive LCD panel attached on a passenger seat. This kind of service is new in Korea and not easy to find in other countries, either. In this paper, we presented a design of a system which provides not only one-way broadcasting services but also searching capability of various information interactively. Informations to be provided are train schedule, transfer information, tour information, E-books, movies, music, ets. Successful completion of the system development in the following years is expected to strengthen international competitiveness of Korean railway industry.

  • PDF