• Title/Summary/Keyword: 자연음

Search Result 228, Processing Time 0.027 seconds

A Study on Pitch-rate and Time-Rate Modifications for Speech Synthesis (합성음 구현을 위한 음의 억양과 장단변화 연구)

  • 하정호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.328-333
    • /
    • 1994
  • 합성의 궁극적 목표는 어휘의 제한 없이 어떠한 말이라도 자연스럽게 다양한 음색과 속도로 합성해 내는 것이다. 따라서 음성합성 시스템의 성능은 전하고자 하는 정보를 얼마나 정확한 발음으로, 자여스럽게 합성음을 만들 수 있는가에 달려있다. 우수한 성능을 갖는 음성합성 시스템을 구현하기 위해서는운율법에서 산출된 음의 억양과 장단변환을 효과적으로 적용시킬 수 있는 음향신호처리 알고리즘이 필요하다. 본 논문은 운율법에 따라 합성음을 적은 계산량을 유지하면서 시간영역에서 음색은 그대로 유지하면서 억양변환하고, 알맞는 속도로 장단변환하는 알고리즘을 개발하였다. 이를 이용하여 음편인 기본음만을 가지고 원하는 음 높이와 길이의 합성음을 산출하였다. 본 논문에서는 음의 억양과 장단변환을 위한 알고리즘을 제안하였으며, 이를 아카펠라음의 합성에 응용하였으며, 이러한 알고리즘은 자동음성서비스나 예약시스템 등을 적은 데이터베이스로 다양하게 합성할 수있음을 보였다.

  • PDF

Investigation of the Soundscapes of Jeju Olle Route via Soundwalking (Soundwalking을 통한 제주도 올레길의 소리풍경 조사)

  • Park, Chan-Jae;Haan, Chan-Hoon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.30 no.8
    • /
    • pp.410-420
    • /
    • 2011
  • The present study aims to investigate the soundscapes of Jeju olle route through the soundwalking. In order to do this, sound measurements and sound recording were undertaken at 10 points along Jeju olle route. Also, loudness of background sound and figure sound were examined. Subjective surveys were carried out using questionnaire and interviews with 32 tourists and 5 acoustical specialists in order to investigate the loudest sound, most pleasant and unpleasant sound, and impressive sound among 17 natural and artificial sounds. Additionally, laboratory experiments were achieved to evaluates sound that have been recorded at the field using same questionnaire and the results were compared with those of field experiments. As a result, the sound heard most in Jeju olle route is the sea wave sound, wind sound, automobile noise, and human voice. It was revealed that the most pleasant sound consisted of nature sound among them, and that unpleasant sounds are artificial sounds. The results of subjective test denote that unpleasant sound is affected by ratio of artificial sound and nature sound. And this also affects the assessment about the loudness of the sound. Also, it was found that the results of both field test and laboratory test are closely correlated in the evaluation of loudness of sound and unpleasant feeling.

Implementation of moving sound effect using grouped HRTF (머리전달함수의 그룹화를 이용한 이동음 효과 구현)

  • Seo, Bo-Kug;Ku, Kyo-Sik;Han, Sang-Il;Cha, Hyung-Tai
    • Proceedings of the IEEK Conference
    • /
    • 2007.07a
    • /
    • pp.417-418
    • /
    • 2007
  • 본 논문에서는 입체음향을 2채널로 재생할 때 이동음이 부드럽게 생성되도록 하는 방법에 대해 연구한다. 일반적으로 이동음 효과 생성을 위해 머리전달함수(Head Related Transfer Function : HRTF)의 주파수 영역에서의 보간을 사용한다. 하지만 특정 점에서 측정된 머리전달함수를 이용하여 이동하는 음을 생성하기 때문에 클릭음 발생, 보간 특성의 변화 등의 문제점이 발생하게 된다. 이 같은 문제점을 해결하기 위해 본 논문에서는 이동음의 궤적 상에 있는 머리전달 함수들을 그룹화하여 이동음의 구현에 사용한다. 위와 같은 방법으로 구현된 이동음의 성능 평가 결과 보다 자연스러운 이동음이 생성되는 것을 확인하였다.

  • PDF

Development of an Scheduling-enabled App for Playing Sound Effects (스케쥴링이 가능한 효과음 재생 앱의 개발)

  • Kim, Sung-Wan;Lee, Han-Kook
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.179-182
    • /
    • 2012
  • 스마트 기기의 보급률 향상에 따라 다양한 분야의 스마트 기기 애플리케이션 혹은 앱이 개발되어 활용되고 있으며, 동물 소리, 자연의 소리 등의 효과음을 선택 및 재생할 수 있는 앱이 개발되고 있다. 이러한 대부분의 앱들은 제공되는 효과음 중 특정 효과음만을 선택하여 1회 단순 재생할 수 있도록 하는 사용자 인터페이스를 채택하고 있다. 본 논문에서는 여러 개의 효과음들을 미리 선택하여 등록하였다가 재생할 수 있는 인터페이스를 채택한 효과음 재생 앱을 설계 및 개발하였다. 개발된 앱은 업무 특성 상 사전에 필요한 효과음들을 특정 시나리오에 따라 순차적으로 미리 선택 및 등록하여 재생이 필요한 환경에서 유용하게 사용될 수 있다.

  • PDF

Improvement of Naturalness for a HMM-based Korean TTS using the prosodic boundary information (운율경계정보를 이용한 HMM기반 한국어 TTS 자연성 향상 연구)

  • Lim, Gi-Jeong;Lee, Jung-Chul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.9
    • /
    • pp.75-84
    • /
    • 2012
  • HMM-based Text-to-Speech systems generally utilize context dependent tri-phone units from a large corpus speech DB to enhance the synthetic speech. To downsize a large corpus speech DB, acoustically similar tri-phone units are clustered based on the decision tree using context dependent information. Context dependent information includes phoneme sequence as well as prosodic information because the naturalness of synthetic speech highly depends on the prosody such as pause, intonation pattern, and segmental duration. However, if the prosodic information was complicated, many context dependent phonemes would have no examples in the training data, and clustering would provide a smoothed feature which will generate unnatural synthetic speech. In this paper, instead of complicate prosodic information we propose a simple three prosodic boundary types and decision tree questions that use rising tone, falling tone, and monotonic tone to improve naturalness. Experimental results show that our proposed method can improve naturalness of a HMM-based Korean TTS and get high MOS in the perception test.

Perception of Japanese word-initial stops by native listeners (모어청자에 의한 일본어 어두 폐쇄음의 지각)

  • Byun, Hi-Gyung
    • Phonetics and Speech Sciences
    • /
    • v.13 no.3
    • /
    • pp.53-64
    • /
    • 2021
  • It is known that the voicing contrast for Japanese word-initial stops is primarily realized as differences in the voice onset time (VOT). However, recent studies have reported that voiced stops are more often produced with a positive VOT than with a negative VOT among the younger generation nationwide. It is also known that post-stop F0 is associated with the stop contrast, but the degree of F0 use differs from region to region. This study explores whether the difference in post-stop F0 functions as a perceptual cue to the stop contrast along with VOT. Fifty-five college students who are native listeners from four different regions participated in two or three perception tests. The results show that VOT is a primary cue to the voiced-voiceless distinction of word-initial stops, but that the effect of post-stop F0 on the stop contrast is marginal. The post-stop F0 is involved in perception only when VOT is ambiguous, such that a sound with high F0 is more often perceived as a voiceless stop, but not vice versa. The results of this study indicate that the acoustic parameters associated with the stop contrast are not the same in production and perception, and suggest that other factors such as context, which is not an acoustic characteristic, may also be involved in the stop contrast.

A Study on the Soundscape Design for the Creation of Sound Amenity in Urban Space -The role and the meaning of sound related sound environment in residential area- (도시공간의 쾌적 음환경 창조를 위한 사운드스케이프 디자인 연구 - 지역의 음환경과의 관계에서 본 음의 의미와 역할 -)

  • Han Myung-Ho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.509-514
    • /
    • 2002
  • 이 연구는 도시공간의 어메니티를 실현하기 위한 수단으로서 사운드스케이프(soundscape)에 관한 연구조사의 결과를 소개한다. 사운드스케이프 및 사운드스케이프 디자인에 관한 개념과 사상을 고찰하고, 남원시의 사운드스케이프 조사를 예로 하여 지역에 있어서 음, 인간 및 환경과의 관계로부터 사운드 어메니티(sound amenity)를 실현하는데 있어서 음이 갖는 의미와 역할을 모색한다. 사운드스케이프 조사방법으로써 문헌조사, 필드조사 및 설문조사를 이용하여 남원지역의 음풍경을 조사${\cdot}$분석하고, 그 시대적, 계절적, 시간적인 음풍경의 변화와 현상, 그리고 지역주민의 음에 관한 인식특성을 파악한다. 조사결과, 지역에 있어서 자연환경을 보존하고 축제등의 전통적인 생활문화를 계승하는 것은 지역의 사운드스케이프와 어메니티 형성에 중요한 역할을 한다는 점을 알 수 있었다. 또한 도시공간의 사운드스케이프 연구는 이러한 일련의 조사연구활동 및 교육활동 등을 포함한 다양한 활동과 여러 영역에서의 유기적인 교류활동이 이루어져야 쾌적한 음환경 창조가 가능하다는 점을 확인할 수 있었다.

  • PDF

A Resonance Characteristic of bronze washbasin (백천사 청동 대야의 울림 특성에 관한 연구)

  • Yi, Eun-Young;Ahn, Ik-Soo;Bae, Myung-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.01a
    • /
    • pp.201-202
    • /
    • 2017
  • 공명은 외부에서 진동계를 진동시킬 수 있는 힘을 가했을 때 그 고유진동수와 외부에서 가해주는 힘의 진동수가 같으면 그 진동은 심해지고 진폭도 커진다. 진동체가 서로 연결되어 있는 경우, 양쪽 진동수가 같으면 공명에 의해 에너지를 서로 교환하는 현상이다. 본 논문에서는 경남 사천에 소재하는 백천사의 사찰 마당에 있는 청동 대야를 사람이 손잡이를 문지를 때 발생하는 파동 현상을 고찰한 연구이다. 청동 대야에서 발생하는 진동수는 3가지 성분이다. 이 음은 복합음의 일종으로 볼 수 있다. 복합음의 기본 특성은 기본음이 배음보다 음압이 크다. 철제에서 생성되는 음압의 형태와 단조로운 순음인 경우가 많다. 청동 대야의 음압은 맥놀이 특성을 나타내고 있어 진폭변조의 포락선을 형성하고 있다.

  • PDF

A Speech Synthesis System based on Cepstral Parameters and Multiband Excitation Signal (켑스트럼 파라미터와 다중대역 여기신호를 사용한 음성 합성 시스팀)

  • 김기순
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.211-215
    • /
    • 1995
  • 명료하고 자연스러운 한국어 음성을 생성하기 위하여 다중대역 여기신호를 이용한 음성 합성 시스팀을 제안한다. 분석계에서는 켑스트럼 파라미터를 사용하여 유성/무성 판별 스펙트럼을 이용한 유/무성 구간 자동판별법을 제안하고, 현재 단순 임펄스와 백색잡음만으로도 구성된 음원과 간단한 유성/무성 판별로 구동되어지는 합성음의 음질상의 한계를 개선하기 위하여 합성계에서는 음질개선 방안으로 유성음 구동시 다중대역 여기신호를 도입하여 합성시 이용한다. 제안된 방법에 대한 청취실험을 한 결과, 유성음 부분 특히 잡음이 많이 섞여 있는 유성음화 마찰음과 모음의 천이부분 등에서 일반적으로 사용되고 있는 간단한 유성/무성 파라미터를 사용한 합성음에 비하여 다중대역 여기신호를 사용한 합성음의 명료도가 매우 우수함을 확인하였다.

  • PDF