• 제목/요약/키워드: 음성적 요소

검색결과 402건 처리시간 0.021초

한국어 음성 웹브라우저 설계 및 구현 (Design and Implementation of Korean Voice Web Browser)

  • 장영건;조경환
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.458-466
    • /
    • 2001
  • 본 논문은 HTML을 분석하여 추출된 내용을 음성으로 변환시키고, 웹 브라우저 제어 및 웹문서의 내용 지정을 위하여 음성인식을 사용하는 음성 웹 부라우저의 설계와 구현에 관한 것이다. 이 시스템의 특징은 보편적 설계기법을 사용하여 정상인과 시각장애인을 모두 고려하여 설계되었으며, 특히 시각장애인 인터페이스를 위하여 웹 문서의 구조를 쉽게 인식할 수 있는 트리 구조를 도입하였고, 웹 브라우저 상에 태그로 표현된 모든 요소를 추출하고, 각 요소에 따라 출력음성의 속성을 다르게 하여 별도의 요소 안내음성 출력이 없이 요소 특성을 인지할 수 있게 하였다. 이 방식은 음성 특징을 세부적으로 표현할 수 있는 청각 스타일 시트의 사용을 배제한 것으로써 웹 문서 작성자가 특별한 추가적 노력 없이, 사용자가 문서내의 구조와 요소들의 특징을 쉽게 인식할 수 있는 장점이 있다.

  • PDF

인공성대를 이용한 성대 진동의 모의 실험 (Simulation of Vocal Fold Vibation with Artificial Larynx)

  • 황병길
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1994년도 제2회 학술대회 연제순서 및 초록집
    • /
    • pp.82-82
    • /
    • 1994
  • 다양한 성대의 진동 형태와 조절 작용을 연구하기 위해서 실시간에서 움직이는 인공성대를 만들어 모델의 타당성을 검토하고 이를 이용하여 생리적 음성과 병적인 음성의 기전을 밝히는 것이 본 연구의 목적이다. 지금까지 연구되어온 정적 모델이나 후두절개 표본의 단점과 한계를 극복할 수 있는 모델을 제작하기 위해 고려해야 할 점은 모델을 이용한 성대 진동 파형의 수평적 수직적 요소의 관찰이 용이해야 하고 성대진동의 기본 요소들 즉 성대의 긴장도, 성문간격, 성문하압 등의 변화에 따른 음성 발현 양상의 차이를 쉽게 보여줄 수 있는 지에 관한 것이다. (중략)

  • PDF

감정 인식을 위한 음성신호 비교 분석 (Comparison and Analysis of Speech Signals for Emotion Recognition)

  • 조동욱;김봉현;이세환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.533-536
    • /
    • 2006
  • 본 논문에서는 음성 신호로부터 감정의 특징을 나타내는 요소를 찾아내는 것을 목표로 하고 있다. 일반적으로 감정을 인식할 수 있는 요소는 단어, 톤, 음성신호의 피치, 포만트, 그리고 발음 속도 및 음질 등이 있다. 음성을 기반으로 감정을 익히는 방법 중에서 현재 가장 많이 접근하고 있는 방법은 피치에 의한 방법이 있다. 사람의 경우는 주파수 같은 분석 요소보다는 톤과 단어, 빠르기, 음질로 감정을 받아들이게 되는 것이 자연스러운 방법이므로 이러한 요소들이 감정을 분류하는데 중요한 요소로 쓰일 수 있다. 따라서, 본 논문에서는 감정에 따른 음성의 특징을 추출하기 위해 사람의 감정 중에서 비교적 자주 쓰이는 평상, 기쁨, 화남, 슬픔에 관련된 4가지 감정을 비교 분석하였으며, 인간의 감정에 대한 음성의 특성을 분석한 결과, 강도와 스펙트럼에서 각각의 일관된 결과를 추출할 수 있었고, 이러한 결과에 대한 실험 과정과 최종 결과 및 근거를 제시하였다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

  • PDF

담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용 (Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems)

  • 이호준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

후두근 및 경부근이 pitch 조절에 미치는 영향 (The action of laryngeal and strap muscle on pitch control)

  • 홍기환;김영중;전동석
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1993년도 제1회 학술대회 연제순서 및 초록집
    • /
    • pp.10-10
    • /
    • 1993
  • 발성시 피치의 조절기전에는 많은 영향들이 있겠으나 대표적으로 성대의 긴장도, 용량 및 길이의 변화가 대표적인 요소라 하겠으며 그중 대표적인 요소가 긴장도의 변화라 하겠다. 성대의 긴장에 미치는 영향으로는 먼저 후두내의 요소로는 잘 알려진 대로 성대근에 의한 내적인 긴장도의 증대와 윤상갑상근에 의한 길이의 증대에 의한 외적인 긴장도의 중대등이 피치의 변화를 일으키는 요소이며 또한 후두외적인 요소로서 설골상부근과 설골하부근이 피치에 영향을 준다는 사실은 잘 알려진 사실이다.(중략)

  • PDF

G.723기반의 음성인식을 위한 변별적인 음성 특징 벡터 선정 (Discriminative Feature Selection for G.723-based Speech Recognition)

  • 이규환;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.387-389
    • /
    • 2000
  • 정보 통신 분야의 발달로 사람들의 전화 사용이 늘어나고 또한 전화기에 여러 가지 멀티미디어 기능들이 추가되면서 음성 인식의 필요성이 점차 증가하고 있다. 그러나 현재의 기술로는 음성 인식의 성능이 사람들의 기대치를 만족시키지 못하고 있다. 본 연구에서는 G.723을 이용한 네트워크 상에서 음성 인식 시간을 줄이고 같은 차수에서 더 좋은 음성 인식 성능을 얻을 수 있는 방법에 대해 연구하였다. 일반적인 보코더는 채널을 통과시킬 때 왜곡을 최소화 하기 위해 양지화할 때 안정적이라고 알려져 있는 LSP 파라메터를 양자화하여 전송한다. 전송된 양자화된 LSP 파라메터는 복호화기를 통과하게 되는데 본 연구에서는 양자화된 LSP 파라메터를 음성인식에 직접 이용하여 음성 합성한 후 음성 특징 파라메터를 추출하는 시간을 줄일 수 있고 음성 합성시 왜곡을 미연에 방지할 수 있다. 본 연구에서는 변별적인 기준에 의해 특징 벡터 요소들을 순서화를 이용하여 음성 특징 벡터의 차수를 동적으로 조절할 수 있는 방법을 G.723에 적용시켜 보았다. 순서화 된 음성 특징 요소들 중에서 인식 목적에 적절한 차수를 선정하며 차수를 줄이면서도 음성인식 성능은 유지 또는 향상시킬 수 있음을 확인하였다. 특히 네트워크 통신망에서도 음성인식 성능을 향상시킬 수 있음을 확인하였고, 기존의 합성음에서 음성인식을 하는 방법보다 시간도 크게 단축할 수 있었다.

  • PDF

발화속도 및 강도 분석에 기반한 폐질환의 음성적 특징 추출 (Voice Features Extraction of Lung Diseases Based on the Analysis of Speech Rates and Intensity)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.471-478
    • /
    • 2009
  • 현대인의 6대 난치병으로 분류되고 있는 폐질환은 대부분 흡연과 대기 오염으로 발병한다. 이와 같은 이유로 폐기능이 손상되어 폐포내에서 이산화탄소와 산소의 교환이 정상적으로 이루어지지 않아 생명 연장의 위험 질환으로 관심이 증대되고 있다. 이를 위해 본 논문에서는 폐질환 에 대한 음성적 특징 추출을 목적으로 음성 분석 요소를 적용한 폐질환 진단 방법을 제안하였다. 우선 폐질환을 앓고 있는 환자들과 동일한 연령, 성별대의 정상인들로 피실험자 집단을 구성하고 이들의 음성을 수집하였다. 또한 수집된 음성을 통해 다양한 음성 분석 요소를 적용하여 분석을 수행하였으며 발화속도 및 강도 분석 요소 부분에서 폐질환자 집단과 정상인 집단간의 유의성이 있음을 알아 낼 수 있었다. 결론적으로 폐질환자 집단이 정상인 집단보다 발화속도가 느리며 강도가 크게 나타나는 결과를 도출해 내었으며 이를 통해 폐질환의 음성적 특징 추출 방법을 제시하였다.

감정 음성의 음향학적 모델링에 관한 연구 (A Study on the Acoustic Modeling of the Emotional Speech)

  • 천희진;이양희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.815-818
    • /
    • 2000
  • 본 논문에서는 감정 표현 음성 합성 시스템을 구현하기 위해서, 감정 음성 데이터베이스의 음향학적 특징인 피치, 에너지, 지속시간, 스펙트럼 포락에 대해 분석한 결과와 문법적 요소인 품사에 따른 감정 음성 데이터의 피치 변화를 분석하였다. 분석 결과, 기본 주파수, 에너지, 지속시간, 스펙트럼 포락은 감정 표현에 중요한 영향을 미치는 것으로 나타났으며, 전반적으로 화남과 기쁨의 감정이 평상과 슬픔의 감정 보다 피치 및 에너지의 변화가 크게 나타났으며, 특히 기쁜 감정의 경우 부사, 관형사, 연결어미, 조사, 접미사에서 피치 변화가 많았으며, 화난 감정의 경우, 관형사, 명사, 용언, 접미사에서 피치 변화가 높게 나타났다. 이러한 분석 결과를 적용해 감정 음성을 합성하기 위하여, 평상 음성에 각 감정 음성의 운율 요소를 적용하여 감정 음성을 합성하여 평가한 결과, 기쁜 감정은 기본 주파수의 변화에 의해 86.7%, 화난 감정은 에너지의 변화에 의해 91%, 슬픈 감정은 음절지속시간의 변화에 의해 76.7%가 각각 올바른 감정으로 인지되었다.

  • PDF

호감도 조사 결과에 따른 음성 파형 및 특징 요소와의 상관성 분석 (Correlativity Analysis of Voice Waveform and Feature Parameter According to a Favorable Impression Research Result)

  • 김봉현;이세환;가민경;조동욱;배영래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.365-366
    • /
    • 2009
  • 목소리는 사람의 정서, 인격, 성격 및 기타 많은 개인적인 요소를 나타내고 있다. 즉, 사람의 목소리를 통해 자신이 보유하고 있는 모든 내면적, 외면적 정보를 알 수 있는 중요한 부분이다. 따라서 본 논문에서는 매력적이면서 좋은 목소리가 보유하고 있는 음성 분석학적 특징 요소를 추출하여 호감도 좋은 목소리와의 상관성을 분석하고자 한다. 이를 위해 청각적으로 다른 특징을 보유하고 있는 5가지 타입의 남성 및 여성의 목소리를 수집하고 임의의 대상자들을 통해 호감도 좋은 목소리를 선정하였다. 또한 피치, 강도 및 스펙트로그램 분석 요소를 적용하여 호감도 좋은 목소리가 보유하고 있는 음성 정보값을 추출하고 상호간의 연관성을 분석하였다.

사상 의학을 위한 음성 분석 시스템 설계 및 구현 (Design and Implementation of Phonetic System for Sasang Constitution)

  • 허병도;손기락;전종원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.879-882
    • /
    • 2004
  • 우리나라에는 의사학에서 그 유래를 찾아보기 어려운 독특한 체질의학이론인 '사상의학'이 있다. 이 이론을 제시한 학자는 이조말엽의 함경도 지방의 이제마라는 의학자에 의하여 창안된 이론이다. 본 논문의 연구는 음성을 이용하여 음성이 담고 있는 언어적 특징이나 음성요소들을 이용하여 사상 의학과의 연관성을 찾는데 목적을 두고 시작되었으며, 기존의 음성분석기의 요소들과 본 연구에서 개발된 요소를 병합하여 음성분석 모듈을 완성하였다.

  • PDF