• 제목/요약/키워드: Sound Synthesis

검색결과 139건 처리시간 0.022초

고정된 공간 축 샘플링 간격을 적용한 뜯는 현악기의 현에 관한 물리적 모델링 (Physical Modeling of Plucked String Based on Fixed Spatial Sampling Interval)

  • 강명수;김규년
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.3-12
    • /
    • 2001
  • 뜯는 현악기의 물리적 모델에서는 선형 시스템에 의해 현을 따라 이동하는 파동이 모델링 된다. 현재 양질의 악기 음 합성을 위해 사용되는 물리적 모델링 방법은 J.O. Smith가 제안한 디지털 도파관[1] 이론을 기초로 한다. J.O. Smith는 디지털 도파관 모델을 유도하기 위해 파동 방정식의 해를 이용했으며, 시간 변수를 기준으로 한 모델을 유도했다. 본 논문에서는 기존의 이론에 파동 방정식의 공간 변수도 고려해 악기를 모델링 함으로써 기존의 디지털 도파관 모델을 변형한 새로운 모델을 제시하였다. 새로운 악기 모델에서는 파동의 속도에 관계없이 공간 변수의 샘플링 간격을 일정하게 유지한 상태에서 시간 변수의 변화에 따른 파동의 이동을 묘사할 수 있도록 하였다. 이렇게 함으로써 새로운 악기 모델은 악기의 물리적인 움직임을 더 정확히 묘사할 수 있으며, 결과적으로 더 좋은 음질의 뜯는 현악기 음을 합성할 수 있다.

  • PDF

고음질 합성용 스펙트럼 보상된 시간축조절 피치 변경법 (On a Pitch Alteration Method by Time-axis Scaling Compensated with the Spectrum for High Quality Speech Synthesis)

  • 배명진;이원철;임성빈
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.89-95
    • /
    • 1995
  • 파형부호화법은 음성신호에서 잉여성분 제거과정을 통해 유용한 파형의 꼴을 단순히 보존하는 방법이다. 음성합성분야에서 고음질의 파형부호화법은 분석에 의한 합성방식으로 주로 적용된다. 그렇지만 이러한 부호화법에서 파라미터들은 여기용과 성도 여파기용으로 분리되지 않기 때문에 이 파형부호화법을 규칙에 의한 합성 방식으로 사용하기는 어렵다. 파형부호화합을 규칙합성에 적용하려면 운율조절을 위해 피치변경법이 필요하다. 본 논문에서는 시간축 스케일링과 주파수상에서의 스펙트럼 보정을 통해 파형부호화법에서 피치를 변경할 수 있는 새로운 피치변경법을 제안하였다. 이 방식은 파형의 위상성분을 보존하는 시간-주파수 혼성법이고, 50%의 피치변경을 수행하였을 때 2.5%정도의 스펙트럼 왜곡을 나타내었다.

  • PDF

조합 알고리즘에 의한 초음파 트랜스듀서의 최적 지향성합성 (Optimal Directivity Synthesis of Ultrasonic Transducers Using a Combined Algorithm)

  • 조기량
    • 한국음향학회지
    • /
    • 제19권1호
    • /
    • pp.25-31
    • /
    • 2000
  • 이 논문에서는 직적법을 이용하여 반복법인 BFGS법의 초기값을 설정하는 알고리즘을 제안하고, 이를 이용하여 점배열음원 형태의 적응형 초음파 트랜스듀서의 최적 지향성합성을 시도했다. 이의 유효성을 확인하기 위하여 부엽의 레벨을 -30dB 이하로 제한한 임의의 빔폭을 갖는 준이상 빔, 회전 빔, 그리고 다중 빔을 보기로 하여 점배열음원으로 형성되는 2차원 음장내의 지향성합성 문제 및 복수의 주파수에 대한 적응 지향성합성 시스템의 적응성 문제를 검토하였다. 수치계산 결과, 제안한 방법은 BFGS법 단독에 의한 지향성합성보다 수렴속도가 빠르고, 목적 지향성합성을 위한 오차개선도 탁월하며, BFGS법과 같은 반복법에서 문제가 되는 초기치의 선택이 필요하지 않다는 장점도 있다. 또한, 제안법은 직접법 단독으로는 불가능한 적응제어도 가능하다.

  • PDF

성도 변형에 따른 모음 포먼트의 변화 고찰 (A Study on Vowel Formant Variation by Vocal Tract Modification)

  • 양병곤
    • 음성과학
    • /
    • 제3권
    • /
    • pp.83-92
    • /
    • 1998
  • Vowels are classified by vocal tract shapes. These shapes form constriction points along the tract, which have an influence on such vocal tract resonance as $F_l,\;F_2,\;F_3$, and so on. This study reviews the perturbation theory of the tract and determines the corresponding formant frequencies from modified vocal tracts using vocal tract area function. Then, formant variation is observed from the theory. Finally, each set of $F_l,\;F_2,\;and\;F_3$ frequency is input to a speech synthesis software to make a vowel sound. Auditory impression of each sound without any modification of its vocal tract shape is almost the same as the corresponding phonetic symbol. Formant frequencies of $F_l,\;F_2,\;F_3$ vary according to the perturbation theory. Generally, constriction along the node causes formant values to decrease while constriction along the anti-node cause it to increase. Vocal tracts modified by more than $3\;cm^2$ change vowel qualities of /a/ and /i/ into those of f /v/ and /$\varepsilon$/, respectively. This study will be helpful in simulating sounds from modified vocal tracts before any operation. Further studies are desirable to compare vocal tract shapes of various languages and their sounds together.

  • PDF

눈동자 추적 기반 입력 및 딥러닝 기반 음성 합성을 적용한 루게릭 환자 의사소통 지원 시스템 (Communication Support System for ALS Patient Based on Text Input Interface Using Eye Tracking and Deep Learning Based Sound Synthesi)

  • 박현주;정승도
    • 디지털산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.27-36
    • /
    • 2024
  • Accidents or disease can lead to acquired voice dysphonia. In this case, we propose a new input interface based on eye movements to facilitate communication for patients. Unlike the existing method that presents the English alphabet as it is, we reorganized the layout of the alphabet to support the Korean alphabet and designed it so that patients can enter words by themselves using only eye movements, gaze, and blinking. The proposed interface not only reduces fatigue by minimizing eye movements, but also allows for easy and quick input through an intuitive arrangement. For natural communication, we also implemented a system that allows patients who are unable to speak to communicate with their own voice. The system works by tracking eye movements to record what the patient is trying to say, then using Glow-TTS and Multi-band MelGAN to reconstruct their own voice using the learned voice to output sound.

Pekeris 도파관에서 음선 접근법을 이용한 지면파 해석 (Interpretation of Ground Wave Using Ray Method in Pekeris Waveguide)

  • 최지웅
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.208-212
    • /
    • 2009
  • 지면파는 해저면 음속이 깊이에 따라 일정할 경우 해저면 음속으로 진행하는 음파로 일반적으로 모드분산으로부터 설명된다. 모드분산은 도파관의 기하학적 구조에 의한 음파의 반사 및 굴절에 의해 발생되므로 본 논문에서는 지면파를 음선이론에 기초하여 모의하였다. 지면파는 일련의 선두파들의 조합으로써 해석될 수 있으므로 [Choi와 Dahl, J. Acoust. Soc. Am. 119, 3660-3668 (2006)], 음선 접근법을 이용하여 시간영역에서 여러 경로로 전파되는 선두파들의 채널 임펄스 응답과 선두파 신호의 컨볼루션을 취하여 지면파를 모의한다. 모의된 지면파는 광대역 시간영역 포물선 방정식 기법을 이용하여 모의된 지면파와 비교, 검증된다.

개선된 발현악기의 루프 필터 설계 방법 (Development of Loop Filter Design of Plucked String Instruments)

  • 조상진
    • 한국음향학회지
    • /
    • 제30권2호
    • /
    • pp.107-113
    • /
    • 2011
  • 본 논문에서는 발현악기 물리적 모델링에서의 개선된 루프필터 설계 방법을 제안한다. V$\"{a}$lim$\"{a}$ki가 제안한 기존의 루프필터 설계 방법은 악기의 음이 오래 지속되는 경우에는 타당하지만, 그렇지 못한 경우에는 악기 음의 주파수 의존 감쇠를 표현하지 못하는 문제점이 있다. 이를 해결하기 위해 녹음된 악기의 단위음에 대해 감쇠구간을 선택, 배음의 개수를 최소 5개부터 20개까지 변경하며 루프필터의 파라미터를 추정하고 이를 이용한 합성음과 원 신호 간 주파수 영역에서의 신호 대 잡음비가 가장 좋은 파라미터를 선택한다. 제안한 방법의 성능 검증을 위해 몸통의 구조와 현의 재질이 각각 다른 기타, 가야금, 거문고를 대상악기로 선정하였다. 제안한 방법은 배음의 지속시간에 상관없이 악기 음의 주파수 의존 감쇠를 잘 표현하는 루프필터 파라미터를 추정해 낼 수 있었다.

가상악기의 음색 분석 연구 - 바이올린, 얼후, 해금을 중심으로 - (A Study of Analysis about Virtual Musical Instruments' Timbre - Focused on Violin, Erhu, Haegeum -)

  • 성기영;이유정
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권7호
    • /
    • pp.219-227
    • /
    • 2019
  • 이 논문에서는 대표적인 찰현악기인 서양의 바이올린, 중국의 얼후 그리고 우리나라 해금의 음색을 비교 분석하기 위해 각 악기의 구조와 특성에 대해서 선행적으로 살펴보았다. 음색의 분석을 위해서는 현재 컴퓨터 음악을 활용한 작품 창작시 많이 사용되고 있는 가상악기의 샘플링 된 음원을 이용하였고, EQ와 배음 분석을 통해 각각의 악기가 가지고 있는 음색과 배음의 특성을 시각적으로 확인하였다. 또한, 각각의 정수배의 배음들의 음압을 분석하여 구체적으로 제시함으로써, 악기가 가지고 있는 고유한 음색의 구성을 이해할 수 있도록 하였다. 이를 토대로 향후 사운드 합성(Sound Synthesis)에 기본이 되는 사인파(Sine Wave)를 이용한 악기 소리의 합성 등을 통해 서양의 가상악기에 비해 상대적으로 적은 우리나라 국악기의 가상악기 음원 개발에도 적지 않은 도움이 되기를 기대하여 본다.

개선된 산조 가야금의 물리적 모델링을 이용한 오른손 주법의 음 합성 (Sound Synthesis of Right-Hand Playing Styles Using Improved Physical Modeling of Sanjo Gayageum)

  • 조상진;정의필
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.362-369
    • /
    • 2006
  • 본 논문에서는 기존의 산조 가야금의 물리적 모델링을 개선하여 오른손 주법에 따른 음을 합성하였다. 가야금 현의 모델에 사용된 루프 필터의 파라미터를 녹음된 단위음의 감쇠 영역으로부터 추정하여 정확도를 향상시키고 계산량을 줄였다. 몸통은 임펄스 응답으로부터 주 공명 주파수를 추출하여 설계한 공명기로 대체되었으며, 주 공명 주파수가 제거 된 임펄스 응답은 크기가 줄어든 여기신호로 사용되었다 안족의 주파수 응답은 15차 all-pole 필터로 근사화 하였다. 가야금의 오른손 연주법 중 연퉁기기는 피드포워드 콤 필터로 구현하였으며 필터의 파라미터는 녹음된 단위음으로부터 추출하였다. 개선된 산조 가야금의 물리적 모델을 이용한 뜯기와 퉁기기, 연퉁기기의 합성음은 원래 음과 매우 유사하였다.

머리 전달 함수의 보간에 적합한 왜곡 척도 (A Relevant Distortion Criterion for Interpolation of the Head-Related Transfer Functions)

  • 이기승;이석필
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.85-95
    • /
    • 2009
  • 양이 재생 환경에서 다양하고 정확한 공간 이미지 형성을 위해서는 다양하고 세분화된 머리 전달 함수가 요구된다. 방대한 양의 머리 전달 함수를 효과적으로 감축하기 위한 방법으로, 모든 방향에 대한 머리 전달 함수를 몇 개의 대표 값들을 이용해 보간을 통해 얻는 방법이 주로 사용되고 있다. 본 논문에서는 머리 전달 함수의 보간 시 중요한 역할을 하는 보간 왜곡의 측정 방법에 대해 연구하였다. 다양한 객관적 왜곡 측정 방법을 이용하여 보간된 머리전달 함수와 본래의 머리전달 함수 간 차이를 표현하였으며 차이 값과 청취 테스트의 결과를 비교, 분석하였다. 분석 결과로부터 음원의 공간 이미지 차이를 가장 잘 반영하는 객관적 왜곡 측정 방법을 선택하였으며 이를 실제 보간 기법에 적용하였다. 3명의 사람으로부터 측정된 머리전달함수와 1개의 마네킹에서 측정된 머리 전달함수에 제안된 방법을 적용한 결과, 3명의 사람에 대한 머리전달 함수에 대해서는 멜-주파수 켑스트럼 왜곡이, 4 종류의 머리전달 함수에 대해서는 시간 영역의 신호 대 왜곡비자 음원의 공간 이미지 차이를 가장 잘 예측하는 왜곡 척도임을 알 수 있었다.