• Title/Summary/Keyword: 음성적 요소

Search Result 402, Processing Time 0.027 seconds

Design and Implementation of Korean Voice Web Browser (한국어 음성 웹브라우저 설계 및 구현)

  • Jang, Young-Gun;Jo, Kyoung-Hwan
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.5
    • /
    • pp.458-466
    • /
    • 2001
  • This paper is addressed to a design and implementation of Korean voice web browser using voice technologies for controling web browser and selecting contents in the web document, and converting them to voice after HTML analysis. Main feature of this web browser is universal design which considers both of normal person and visual disabled, allows multi-modal interface. As voice interface for visual disabled, it supports tree structure which allows to recognize web document structure easily by only voice guidance regardless of frame usage, can handle all elements described as tag in the web document, identify them as predefined different voice property according to element property. This method gets rid of additional guidance voice for element property without audio style sheet or additional programming effort.

  • PDF

Simulation of Vocal Fold Vibation with Artificial Larynx (인공성대를 이용한 성대 진동의 모의 실험)

  • 황병길
    • Proceedings of the KSLP Conference
    • /
    • 1994.06b
    • /
    • pp.82-82
    • /
    • 1994
  • 다양한 성대의 진동 형태와 조절 작용을 연구하기 위해서 실시간에서 움직이는 인공성대를 만들어 모델의 타당성을 검토하고 이를 이용하여 생리적 음성과 병적인 음성의 기전을 밝히는 것이 본 연구의 목적이다. 지금까지 연구되어온 정적 모델이나 후두절개 표본의 단점과 한계를 극복할 수 있는 모델을 제작하기 위해 고려해야 할 점은 모델을 이용한 성대 진동 파형의 수평적 수직적 요소의 관찰이 용이해야 하고 성대진동의 기본 요소들 즉 성대의 긴장도, 성문간격, 성문하압 등의 변화에 따른 음성 발현 양상의 차이를 쉽게 보여줄 수 있는 지에 관한 것이다. (중략)

  • PDF

Comparison and Analysis of Speech Signals for Emotion Recognition (감정 인식을 위한 음성신호 비교 분석)

  • Cho Dong-Uk;Kim Bong-Hyun;Lee Se-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.533-536
    • /
    • 2006
  • 본 논문에서는 음성 신호로부터 감정의 특징을 나타내는 요소를 찾아내는 것을 목표로 하고 있다. 일반적으로 감정을 인식할 수 있는 요소는 단어, 톤, 음성신호의 피치, 포만트, 그리고 발음 속도 및 음질 등이 있다. 음성을 기반으로 감정을 익히는 방법 중에서 현재 가장 많이 접근하고 있는 방법은 피치에 의한 방법이 있다. 사람의 경우는 주파수 같은 분석 요소보다는 톤과 단어, 빠르기, 음질로 감정을 받아들이게 되는 것이 자연스러운 방법이므로 이러한 요소들이 감정을 분류하는데 중요한 요소로 쓰일 수 있다. 따라서, 본 논문에서는 감정에 따른 음성의 특징을 추출하기 위해 사람의 감정 중에서 비교적 자주 쓰이는 평상, 기쁨, 화남, 슬픔에 관련된 4가지 감정을 비교 분석하였으며, 인간의 감정에 대한 음성의 특성을 분석한 결과, 강도와 스펙트럼에서 각각의 일관된 결과를 추출할 수 있었고, 이러한 결과에 대한 실험 과정과 최종 결과 및 근거를 제시하였다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

  • PDF

Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems (담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용)

  • Lee, Ho-Joon;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

The action of laryngeal and strap muscle on pitch control (후두근 및 경부근이 pitch 조절에 미치는 영향)

  • 홍기환;김영중;전동석
    • Proceedings of the KSLP Conference
    • /
    • 1993.12a
    • /
    • pp.10-10
    • /
    • 1993
  • 발성시 피치의 조절기전에는 많은 영향들이 있겠으나 대표적으로 성대의 긴장도, 용량 및 길이의 변화가 대표적인 요소라 하겠으며 그중 대표적인 요소가 긴장도의 변화라 하겠다. 성대의 긴장에 미치는 영향으로는 먼저 후두내의 요소로는 잘 알려진 대로 성대근에 의한 내적인 긴장도의 증대와 윤상갑상근에 의한 길이의 증대에 의한 외적인 긴장도의 중대등이 피치의 변화를 일으키는 요소이며 또한 후두외적인 요소로서 설골상부근과 설골하부근이 피치에 영향을 준다는 사실은 잘 알려진 사실이다.(중략)

  • PDF

Discriminative Feature Selection for G.723-based Speech Recognition (G.723기반의 음성인식을 위한 변별적인 음성 특징 벡터 선정)

  • 이규환;정민화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.387-389
    • /
    • 2000
  • 정보 통신 분야의 발달로 사람들의 전화 사용이 늘어나고 또한 전화기에 여러 가지 멀티미디어 기능들이 추가되면서 음성 인식의 필요성이 점차 증가하고 있다. 그러나 현재의 기술로는 음성 인식의 성능이 사람들의 기대치를 만족시키지 못하고 있다. 본 연구에서는 G.723을 이용한 네트워크 상에서 음성 인식 시간을 줄이고 같은 차수에서 더 좋은 음성 인식 성능을 얻을 수 있는 방법에 대해 연구하였다. 일반적인 보코더는 채널을 통과시킬 때 왜곡을 최소화 하기 위해 양지화할 때 안정적이라고 알려져 있는 LSP 파라메터를 양자화하여 전송한다. 전송된 양자화된 LSP 파라메터는 복호화기를 통과하게 되는데 본 연구에서는 양자화된 LSP 파라메터를 음성인식에 직접 이용하여 음성 합성한 후 음성 특징 파라메터를 추출하는 시간을 줄일 수 있고 음성 합성시 왜곡을 미연에 방지할 수 있다. 본 연구에서는 변별적인 기준에 의해 특징 벡터 요소들을 순서화를 이용하여 음성 특징 벡터의 차수를 동적으로 조절할 수 있는 방법을 G.723에 적용시켜 보았다. 순서화 된 음성 특징 요소들 중에서 인식 목적에 적절한 차수를 선정하며 차수를 줄이면서도 음성인식 성능은 유지 또는 향상시킬 수 있음을 확인하였다. 특히 네트워크 통신망에서도 음성인식 성능을 향상시킬 수 있음을 확인하였고, 기존의 합성음에서 음성인식을 하는 방법보다 시간도 크게 단축할 수 있었다.

  • PDF

Voice Features Extraction of Lung Diseases Based on the Analysis of Speech Rates and Intensity (발화속도 및 강도 분석에 기반한 폐질환의 음성적 특징 추출)

  • Kim, Bong-Hyun;Cho, Dong-Uk
    • The KIPS Transactions:PartB
    • /
    • v.16B no.6
    • /
    • pp.471-478
    • /
    • 2009
  • The lung diseases classifying as one of the six incurable diseases in modern days are caused mostly by smoking and air pollution. Such causes the lung function damages, and results in malfunction of the exchange of carbon dioxide and oxygen in an alveolus, which the interest is augment with risk diseases of life prolongation. With this in the paper, we proposed a diagnosis method of lung diseases by applying parameters of voice analysis aiming at the getting the voice feature extraction. Firstly, we sampled the voice data from patients and normal persons in the same age and sex, and made two sample groups from them. Also, we conducted an analysis by applying the various parameters of voice analysis through the collected voice data. The relational significance between the patient and normal groups can be evaluated in terms of speech rates and intensity as a part of analized parameters. In conclusion, the patient group has shown slower speech rates and bigger intensity than the normal group. With this, we propose the method of voice feature extraction for lung diseases.

A Study on the Acoustic Modeling of the Emotional Speech (감정 음성의 음향학적 모델링에 관한 연구)

  • 천희진;이양희
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.815-818
    • /
    • 2000
  • 본 논문에서는 감정 표현 음성 합성 시스템을 구현하기 위해서, 감정 음성 데이터베이스의 음향학적 특징인 피치, 에너지, 지속시간, 스펙트럼 포락에 대해 분석한 결과와 문법적 요소인 품사에 따른 감정 음성 데이터의 피치 변화를 분석하였다. 분석 결과, 기본 주파수, 에너지, 지속시간, 스펙트럼 포락은 감정 표현에 중요한 영향을 미치는 것으로 나타났으며, 전반적으로 화남과 기쁨의 감정이 평상과 슬픔의 감정 보다 피치 및 에너지의 변화가 크게 나타났으며, 특히 기쁜 감정의 경우 부사, 관형사, 연결어미, 조사, 접미사에서 피치 변화가 많았으며, 화난 감정의 경우, 관형사, 명사, 용언, 접미사에서 피치 변화가 높게 나타났다. 이러한 분석 결과를 적용해 감정 음성을 합성하기 위하여, 평상 음성에 각 감정 음성의 운율 요소를 적용하여 감정 음성을 합성하여 평가한 결과, 기쁜 감정은 기본 주파수의 변화에 의해 86.7%, 화난 감정은 에너지의 변화에 의해 91%, 슬픈 감정은 음절지속시간의 변화에 의해 76.7%가 각각 올바른 감정으로 인지되었다.

  • PDF

Correlativity Analysis of Voice Waveform and Feature Parameter According to a Favorable Impression Research Result (호감도 조사 결과에 따른 음성 파형 및 특징 요소와의 상관성 분석)

  • Kim, Bong-Hyun;Lee, Se-Hwan;Ka, Min-Kyoung;Cho, Dong-Uk;J.Bae, Young-Lae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.365-366
    • /
    • 2009
  • 목소리는 사람의 정서, 인격, 성격 및 기타 많은 개인적인 요소를 나타내고 있다. 즉, 사람의 목소리를 통해 자신이 보유하고 있는 모든 내면적, 외면적 정보를 알 수 있는 중요한 부분이다. 따라서 본 논문에서는 매력적이면서 좋은 목소리가 보유하고 있는 음성 분석학적 특징 요소를 추출하여 호감도 좋은 목소리와의 상관성을 분석하고자 한다. 이를 위해 청각적으로 다른 특징을 보유하고 있는 5가지 타입의 남성 및 여성의 목소리를 수집하고 임의의 대상자들을 통해 호감도 좋은 목소리를 선정하였다. 또한 피치, 강도 및 스펙트로그램 분석 요소를 적용하여 호감도 좋은 목소리가 보유하고 있는 음성 정보값을 추출하고 상호간의 연관성을 분석하였다.

Design and Implementation of Phonetic System for Sasang Constitution (사상 의학을 위한 음성 분석 시스템 설계 및 구현)

  • Heo Byung-Do;Sohn Ki-Rak;Jeon Jong-won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.879-882
    • /
    • 2004
  • 우리나라에는 의사학에서 그 유래를 찾아보기 어려운 독특한 체질의학이론인 '사상의학'이 있다. 이 이론을 제시한 학자는 이조말엽의 함경도 지방의 이제마라는 의학자에 의하여 창안된 이론이다. 본 논문의 연구는 음성을 이용하여 음성이 담고 있는 언어적 특징이나 음성요소들을 이용하여 사상 의학과의 연관성을 찾는데 목적을 두고 시작되었으며, 기존의 음성분석기의 요소들과 본 연구에서 개발된 요소를 병합하여 음성분석 모듈을 완성하였다.

  • PDF