• Title/Summary/Keyword: 지속음

Search Result 345, Processing Time 0.029 seconds

On a Duration Control Method of Speech Waveform by an Automatic Pitch Point Detection (자동 피치시점 검출에 의한 음성신호의 지속시간 조절 법에 관한 연구)

  • Park Won;Park HyungBin;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.217-220
    • /
    • 2000
  • 일반적으로 고음질 음성합성을 하기 위해서는 합성음의 지속 시간을 변경하여 줌으로써 운율을 조절하는 기법이 필요하다 이에 먼저 고음질용 음성부호화법을 선정하여야 하고 정확한 피치와 피치시점검출을 통해서 음원분류가 되어야한다. 본 논문에서는 제안한 자동 피치시점 검출을 적용해서 운율조절에 필요한 지속시간 조절 법을 제안하고자 한다. 제안한 방법은 시간영역에서 직접 처리하기 때문에 피치동기분석이 용이하고 다른 영역으로의 변환과정이 불필요하다. 결과적으로 파형부호화법을 적용하고 제안한 자동 피치서점 검출에 의한 지속시간 조절법을 적용하였을 때 비교적 우수한 결과를 얻을 수 있었다.

  • PDF

Mutiple-Speech Synthesis System according to Various Utterance (다양한 발성에 따른 다중음성 합성 시스템)

  • Park, Hyun-Young;Kim, Myoung;Bae, Myoung-Jin
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2003.11a
    • /
    • pp.151-154
    • /
    • 2003
  • 음성 합성이란 기계적인 장치나 전지회로 또는 컴퓨터 모의를 이용하여 자동으로 음성파형을 생성해 내는 것으로 정의한다. 음성 합성에 대한 연구는 다른 음성에 관련된 기술들보다 가장 먼저 연구된 기술이다. 음성 합성기는 PC의 보급이 확대되고 통신 시장이 컴짐에 따라 그 응용 분야가 점차 확대되어 가고 다양한 방식의 음성 합성 기법에 관한 연구가 이루어지고 있다. 일반적으로 자연스러운 대화를 할 때나 글을 읽을 때의 음성에는 퍼지, 지속시간, 에너지 등의 운율 정보가 포함되어 있다. 따라서, 문장을 합성하는 경우 운율정보를 합성음에 반영하면 보다 명확한 의미 전달과 다양한 발성변환이 가능해 진다. 본 논문에서는 시간영역에서 PSOLA 합성방식에 의한 피치 변경과 지속시간 변경을 이용하여 다양한 발성변환에 따른 다중음성 합성기를 구현하였다.

  • PDF

Does the Layman Understand "the Whistling Sounds when Breathing out" as Real Wheezing? (일반인들은 숨쉴 때 "쌕쌕하는 소리"를 천명음으로 이해하는가?)

  • Jang, Seung-Hun;Jung, Seung-Hyun;Eom, Kwang-Seok;Shin, Taerim;Kim, Chul-Hong;Bahn, Joon-Woo;Kim, Dong-Gyu;Park, Myung-Jae;Hyun, In-Gyu;Jung, Ki-Suck
    • Tuberculosis and Respiratory Diseases
    • /
    • v.54 no.4
    • /
    • pp.378-385
    • /
    • 2003
  • Background : Wheezing is an important clue in the diagnosis of asthma. Previously, a Korean National asthma survey used a written questionnaire, containing the question, "Have you ever experienced a breathing sound-like 'sack-sack' or a flute sound (the Korean description for wheezing) during the last 12 months?" The response to this question showed a large discrepancy between the prevalence of wheezing and physician diagnosed asthma. This might have resulted partly from a misunderstanding of the question, due to an inadequate description for wheezing. This study was aimed at finding how well the layman understands the term "wheezing" when described as a breathing sound-like 'sack-sack', a whistle or a flute. Subjects and method : Sixty subjects, without experience of wheezing(group I), and 45 subjects, with chronic cough alleging wheezing(group II), were recruited from the Hallym University's Sacred Heart Hospital, in Anyang, Korea. Four different breathing sounds; vesicular, wheezing, tracheobronchial and crackle, were played for the subjects, without any experience with wheezing, and they were asked "which sound is most like that you would imagine when asked about a breathing sound-like 'sack-sack', a whistle or a flute?" This was followed by replaying the true wheezing sound, and then a global assessment was requested for the concordance between the real wheezing sound and the imagined wheezing sound. The wheezing sound was played for those subjects alleging wheezing, and they were asked, "have you really experienced that sound". Results : Only 46.7% of group I answered correctly, with 13.3% choosing the vesicular sound, 16.7% the tracheobronchial sound, 5.0% the crackle and 18.3% failed to answer. The concordance between their imagined wheezing and the real sound was $69.3{\pm}22.4%(mean{\pm}S.D.)$. 77.8% of group II recognized the correct sound as the one they had experienced. Conclusions : Language is not sufficient to the layman for describing natural sounds, such as wheezing.

Climatological characteristics of area averaged monthly precipitation on Han- and Nakdong-river basins for 1954-2002 (한강 및 낙동강 유역평균 월강수량의 기후 특성 분석)

  • Baek, Hee-Jeong;Kwon, Won-Tae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.1223-1227
    • /
    • 2004
  • 강수량의 대부분이 여름철에 집중적으로 내리는 우리나라의 경우 경제기반에 필요한 용수 확보를 위한 댐 수위 조절 등의 수자원 관리를 위해서는 강수량의 장기예측이 매우 중요하다. 그러나 장기예측에 앞서 강수량의 기후 특성 분석은 예측을 위한 기반 자료로서 필요하다. 따라서 한반도 기상 관측소 자료로부터 1954년부터 2002년 49년동안 한강과 낙동강 유역의 유역평균 월강수량의 기후특성을 분석하였다. 유역평균 월강수량은 Thiessen 가중법을 사용하여 산출되었으며, 4월 유역평균 강수량은 감소 경향이 뚜렷하고, 8월 유역평균 강수량은 증가 경향이 매우 뚜렷하였다. 또한 두 유역에 있어서 1970년 중반에 유역평균 월강수량의 변동에 변화가 나타났다. NINO3 지수와 한강과 낙동강 유역평균 월강수량 편차와의 동시상관관계에서 유역평균 9월 강수량은 NINO3 지수와 지속적인 음의 상관을 보였고, 11월 유역평균 강수량과는 양의 상관이 크게 나타났다. 우기 동안 한강 유역평균 월강수량의 극한 사상의 종관 특성 분석을 위한 합성도에서 다우해(above normal year)인 경우에는 주로 대륙에 1000 hPa 고도의 음의 편차, 해양에 양의 편차의 중심이 놓여 있어 다우 시기는 북태평양 고기압의 강화와 관련됨을 알 수 있었다. 또한 8월 유역평균 강수량은 한반도 상공의 제트 강화와 관련되어 있었으며, 9월 유역평균 강수량의 경우에는 제트 출구의 북쪽에서의 양의 편차, 남쪽에서의 음의 편차 및 하층 바람장의 수렴과 관련되어 나타났다.

  • PDF

HMM with Global Path constraint in Viterbi Decoding for Insolated Word Recognition (전체 경로 제한 조건을 갖는 HMM을 이용한 단독음 인식)

  • Kim, Weon-Goo;Ahn, Dong-Soon;Youn, Dae-Hee
    • The Journal of the Acoustical Society of Korea
    • /
    • v.13 no.1E
    • /
    • pp.11-19
    • /
    • 1994
  • Hidden Markov Models (HMM's) with explicit state duration density (HMM/SD) can represent the time-varying characteristics of speech signals more accurately. However, such an advantage is reduced in relatively smooth state duration densities or ling bounded duration. To solve this problem, we propose HMM's with global path constraint (HMM/GPC) where the transition between states occur only within prescribed time slots. HMM/GPC explicitly limits state durations and accurately describes the temproal structure of speech simply and efficiently. HMM's formed by combining HMM/GPC with HMM/SD are also presented (HMM/SD+GPC) and performances are compared. HMM/GPC can be implemented with slight modifications to the conventional Viterbi algorithm. HMM/GPC and HMM/SD_GPC not only show superior performance than the conventional HMM and HMM/SD but also require much less computation. In the speaket independent isolated word recognition experiments, the minimum recognition eror rate of HMM/GPC(1.6%) is 1.1% lower than the conventional HMM's and the required computation decreased about 57%.

  • PDF

Analysis of Sound Distribution Characteristics and Its Impact on National Park - Mudeungsan National Park - (국립공원 내 소리 분포 특성 분석 연구 - 무등산국립공원 -)

  • Yoo, Ji-su;Ryu, Hun-jae;Moon, Sung-joon;Chang, Seo-Il;Ki, Kyong-Seok
    • Korean Journal of Environment and Ecology
    • /
    • v.36 no.3
    • /
    • pp.350-357
    • /
    • 2022
  • A national park is a place to conserve natural resources and visitors to experience nature, and thus, it is necessary to identify the noise distribution characteristic in the national park and preserve and restore the soundscape. However, most national parks in Korea are exposed to noise, leading to negative perceptions of the national park's soundscape and affecting the ecosystem. Many national parks in other countries have investigated the ecosystem impacts caused by noise and have performed various management to reduce the noise. However, in Korea, there is still a lack of awareness of the effect on the ecosystem, overlooking the need for soundscape management. Therefore, in this study, we developed a noise map of Mudeungsan National Park to investigate the quantitative impact of noise on visitors and the ecosystem. Also, we measured the trail's soundscape to describe a sound grade classification, and the soundscape of main spots in the park was recorded for a year and then analyzed. Finally, the sound resource distribution map was described, which can be used as preliminary data to determine the national park's sound distribution characteristics and manage the soundscape.

Implementation of the Voice Conversion in the Text-to-speech System (Text-to-speech 시스템에서의 화자 변환 기능 구현)

  • Hwang Cholgyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.33-36
    • /
    • 1999
  • 본 논문에서는 기존의 text-to-speech(TTS) 합성방식이 미리 정해진 화자에 의한 단조로운 합성음을 가지는 문제를 극복하기 위하여, 임의의 화자의 음색을 표현할 수 있는 화자 변환(Voice Conversion) 기능을 구현하였다. 구현된 방식은 화자의 음향공간을 Gaussian Mixture Model(GMM)로 모델링하여 연속 확률 분포에 따른 화자 변환을 가능케 했다. 원시화자(source)와 목적화자(target)간의 특징 벡터의 joint density function을 이용하여 목적화자의 음향공간 특징벡터와 변환된 벡터간의 제곱오류를 최소화하는 변환 함수를 구하였으며, 구해진 변환 함수로 벡터 mapping에 의한 스펙트럼 포락선을 변환했다. 운율 변환은 음성 신호를 정현파 모델에 의해서 모델링하고, 분석된 운율 정보(피치, 지속 시간)는 평균값을 고려해서 변환했다. 성능 평가를 위해서 VQ mapping 방법을 함께 구현하여 각각의 정규화된 켑스트럼 거리를 구해서 성능을 비교 평가하였다. 합성시에는 ABS-OLA 기반의 정현파 모델링 방식을 채택함으로써 자연스러운 합성음을 생성할 수 있었다.

  • PDF

An acoustic study on the intonation pattern of Cheju dialects in Korean (제주방언 억양패턴의 실험음성학적 연구)

  • Lee Sook-hyang
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.369-372
    • /
    • 1999
  • 본 연구는 제주방언의 억양 패턴에 대하여 실험음성학적 분석을 하였다. 이전의 제주방언에 대한 음성 음운론적 연구는 거의 분절음 연구에 국한되었다. 억양 패턴 분석은 K-ToBI 레이블링 시스템에서 사용하는 성조기호를 사용하여 수행되었다 제주 방언의 운율구는 서울말, 전남방언과 같이 억양구와, 그 하위 층에 악센트구 두 개로 이루어져 있다. 본 연구는 크게 억양구의 경계성조 유형 연구와 악센트구의 성조 연구를 수행하였다. 억양구 경계성조로는 서울말과 같이 $L\%,\;H\%$를 기본으로 하여 $HL\%,\;LHL\%,\;HLHL\%,\;LHLHL\%,\;LH\%,\;HLH\%,\;LHLH\%,\;HLTLH\%$ 등의 유형과 그 외 제주방언만의 유형 또한 관찰되었다. 악센트구의 성조패턴 연구는 음절수와 억양구내 악센트구의 위치를 변수로 하여 살펴보았다. 제주방언의 악센트구 기본 성조는 'LH'로서 마지막 음절에서 ?'가 실현되는 패턴이다. 음절수가 많아지면 마지막 둘째음절에 아주 완만한 피치상승을 보이긴 하나 'H'로 기술하기에는 부적절하였다 유성음화의 범위는 서울방언에서와 같이 악센트구로 나타났다. 강자음이 악센트구 초에 올 때 ?'성조로 시작이 되었으며 피험자에 따라 'H'성조가 첫째음절에서만 실현되고 바로 하강하던가 또는 둘째음절까지 지속되는 것이 관찰되었다.

  • PDF

A Study on Recognition of Korean Continuous Speech using Discrete Duration CHMM. (이산 시간 제어 CHMM을 이용한 한국어 연속 음성 인식에 관한 연구)

  • 김상범
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.368-372
    • /
    • 1994
  • 확률적 모델을 이용한 HMM 으로 한국어 연속 음성 인식시스템을 구성하였다. 학습 모델로서는 양자화 DCK가 없는 연속출력 확률밀도를 사용한 연속출력 확률분포 HMM과 과도 구간 및 정상 구간의 시간구조를 충분히 BYGUS할 수 없는 것을 계속시간 확률 파라메터를 추가하여 보완한 이산 지속시간 제어 연속출력 확률분포 HMM을 이용하였다. 인식 알고리즘은 시계열 패턴의 시간축상에서의 비선형 신축을 고려한 에 매칭으로서, 음절의 경계를 자동으로 검출하는 O에을 이용하였다. 실험에서 사용된 연속음성데이타는 4연 숫자음과 연속음성 10문장으로 하였다. 인식 실험 결과 4연 숫자음에서 CHMM은 80.7%, DDCHMM은 92.9%의 인식률을 얻었고, 신문 사설에서 발췌한 연속 음성문장의 경우 CHMM 54.2%, DDCHMM에서는 68.9%을 얻어, 시간장 제어를 고려한 DDCHMM이 CHMM보다 SHB은 인식률을 얻었다.

  • PDF

Two-level Approximation of a A-type Three-level Atomic System (람다형 3준위 원자계에 대한 2준위 원자계 근사)

  • Park, Jong-Dae;Cho, Chang-Ho;Park, Sung-Jong;Cho, Hyuk;Kwon, Taek-Yong;Lee, Ho-Sung
    • Proceedings of the Optical Society of Korea Conference
    • /
    • 2002.07a
    • /
    • pp.16-17
    • /
    • 2002
  • 최근 3-준위 원자계에서 원자 결맞음에 관련된 현상에 대해 많은 연구가 이루어지고 있다. 전자기 유도 투과, 전자기 유도 흡수, 밀도 반전 없는 레이저 발진, 선폭이 좁은 공진에 의한 큰 굴절률의 실현, 저광속, 초광속, 초저온 원자 냉각 현상들은 원자 결맞음과 관련된 현상들이다. 3준위 원자계는 계단형, V 형, ∧ 형으로 분류할 수 있는데, ∧ 형의 3준위 원자계는 바닥상태간의 간섭성이 오래 지속될 수 있으므로 ∧ 형의 3준위 원자계가 실질적으로 많이 연구되고 있다. (중략)

  • PDF