• 제목/요약/키워드: 자연음

검색결과 228건 처리시간 0.018초

인공신경망의 운률 발생에 관한 연구 (A Study on the prosody generation of artificial neural networks)

  • 신동엽;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.87-90
    • /
    • 2000
  • 문-음성 합성기의 자연감을 높이기 위해 주로 자연음에 존재하는 운률 법칙을 정확히 구현해 주어야 한다. 일반적으로 언어학적 정보를 이용하거나 자연음으로부터 추출한 운률 정보를 추출한 운률 법칙을 합성에 이용하고 있다. 이와 같이 구한 운률 법칙이 자연음에 존재하는 모든 운률 법칙을 포함할 수 있으면, 자연스러운 합성음을 들을 수 있겠으나, 실질적으로는 모든 법칙을 구현한다는 것은 어려운 실정이고, 자연음으로부터 추출한 운률 법칙이 잘못 구현되는 경우 합성음의 자연성이 떨어지는 것을 피할 수 없을 것이다. 이런 점을 고려하여 우리는 자연음에 내재하는 운율 법칙을 훈련을 통해 학습할 수 있는 인공 신경망을 제안하였다 운률의 세 가지 요소는 피치, 지속시간, 크기 변화가 있는데, 인공 신경망은 문장이 입력되면, 각 해당 음소의 지속시간에 따른 피치 변화와 크기 변화를 학습할 수 있도록 설계하였다. 신경망을 훈련시키기 위해 고립 단어군과 음소균형 문장군을 화자로 하여금 발성하게 하여, 녹음하고, 분석하여 운률 데이터베이스를 구축하였다. 자연음의 각 음소에 대해 지속시간과 피치변화 그리고 크기 변화를 구하여 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 계수를 구해 데이터베이스를 구축한다. 이렇게 구축한 데이터베이스를 이용해 인공 신경망을 훈련시켜 평가한 결과 훈련용 데이터를 계속 확장하면 좀 더 자연스러운 운률을 발생시킬 수 있음을 관찰하였다.

  • PDF

인공 신경망의 한국어 운율 학습 (Learning of Artificial Neural Networks about the Prosody of Korean Sentences.)

  • 신동엽;민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.121-124
    • /
    • 2001
  • 음성 합성기의 합성음의 자연감을 높이기 위해 자연음에 내재하는 정확한 운율 법칙을 구하여 음성합성 시스템에서 이를 구현해 주어야 한다 무제한 어휘 음성합성 시스템의 문-음성 합성기에서 필요한 운율 법칙은 언어학적 정보를 이용해 구하거나, 자연음에서 추출하고 있다 그러나 추출한 운율 법칙이 자연음에 내재하는 모든 운율 법칙을 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 본 논문에서는 한국어 자연음을 분석하여 추출한 운율 정보를 인공 신경망이 학습하도록 하고 훈련을 마친 인공 신경망에 문장을 입력하고, 출력으로 나오는 운율 정보와 자연음의 운율 정보를 비교한 결과 제안한 인공 신경망이 자연음에 내재하고 있는 운율을 학습할 수 있음을 알 수 있었다. 운율의 3대 요소는 피치 , 지속시간, 크기의 변화이다. 제안한 인공 신경망이 한국어 문장의 음소 열을 입력으로 받아들이고, 각 음소의 지속시간에 따른 피치변화와 크기 변화를 출력으로 내보내면 자연음을 분석해 구한 각 음소의 운율 정보인 목표 패턴과 출력 패턴 의 오차를 최소화하도록 인공 신경망의 가중치를 조절할 수 있도록 설계하였다. 지속시간에 따른 각 음소의 피치와 크기 변화를 학습시키기 위해 피치 및 크기 인공 신경망을 구성하였다. 이들 인공 신경망을 훈련시키기 위해 먼저 음소 균형 문장 군을 구축하여야 하고, 이들 언어 자료를 특정 화자가 일정 환경에서 읽고 이를 녹음하여 , 분석하여 구한운율 정보를 운율 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속 시간과 피치 변화 그리고 크기 변화를 구하고, 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기 값을 구해 운율 데이터베이스를 구축한다. 이 운율 데이터베이스의 일부는 인공 신경망을 훈련시키는데 이용하고, 나머지로 인공 신경망의 성능을 평가하여 인공 신경망이 운율 법칙을 학습할 수 있었다. 언어 자료의 문장 수를 늘리고 발음 횟수를 늘려 운율 데이터베이스를 확장하면 인공 신경망의 성능을 높일 수 있고, 문장 내의 음소의 수를 감안하여 인공 신경망의 입력 단자의 수는 계산량과 초분절 요인을 감안하여 결정해야 할 것이다

  • PDF

문장단위 운율발생용 인공신경망에 관한 연구 (A Study on the Artificial Neural Networks for the Sentence-level Prosody Generation)

  • 신동엽;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.53-56
    • /
    • 2000
  • 무제한 어휘 음성합성 시스템의 문-음성 합성기는 합성음의 자연감을 높이기 위해 여러 가지 방법을 사용하게되는데 그중 하나가 자연음에 내재하는 운을 법칙을 정확히 구현하는 것이다. 합성에 필요한 운율법칙은 언어학적 정보를 이용해 구현하거나, 자연음을 분석해 구한 운을 정보로부터 운율 법칙을 추출하여 합성에 이용하고 있다. 이와 같이 구한 운을 법칙이 자연음에 존재하는 운율 법칙을 전부 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 우리는 자연음의 운율 정보를 이용해 인공 신경망을 훈련시켜, 문장단위 운율을 발생시킬 수 있는 방식을 제안하였다. 운율의 세 가지 요소는 피치, 지속시간, 크기 변화가 있는데, 인공 신경망은 문장이 입력되면, 각 해당 음소의 지속시간에 따른 피치 변화와 크기 변화를 학습할 수 있도록 설계하였다. 신경망을 훈련시키기 위해 고립 단어 군과 음소균형 문장 군을 화자로 하여금 발성하게 하여, 녹음하고, 분석하여 구한 운을 정보를 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속시간과 피치 변화 그리고 크기 변화를 구하고, 곡선적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기치를 구해 운을 데이터베이스를 구축한다. 이 운을 데이터베이스의 일부를 인공 신경망을 훈련시키는데 이용하고, 나머지를 이용해 인공 신경망의 성능을 평가한 결과 운을 데이터베이스를 계속 확장하면 좀더 자연스러운 운율을 발생시킬 수 있음을 관찰하였다.

  • PDF

한국어 운율 발생용 인공신경망의 구조 및 학습에 관한 연구 (A Study on the Architecture and Learning of the Artificial Neural Networks for Prosody Generation of Korean Sentence)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.135-138
    • /
    • 2004
  • 음성처리기술은 정보화 시대를 위한 주요 기술의 하나이다. 이 중에서도 음성합성의 연구는 디지털 신호처리 기술과 컴퓨터의 발달로 활발히 진행되고 있다. 그러나 음성 합성기에 의해 발생된 합성음의 음질은 이해도 면에서는 상당한 진전이 있었지만, 자연감 면에서는 만족한 수준에 도달할 수 없었는데, 이러한 합성시스템의 문제점을 해결하는 방법은 다양하게 적용되는 언어정보와 합성음의 자연감을 결정하는 정확한 운율정보가 필요하다. 그러나 구한 운율 정보가 자연음에 존재하는 모든 운율 법칙을 포함할 수 없고, 또한 추출한 운율 법칙이 틀린 것이면 자연감이나 이해도가 떨어지는 합성음이 만들어지고 이것은 음성 합성 시스템의 실용화에 장애로 작용할 것이다. 본 논문은 한국어 음성 합성 시 문제가 되는 자연감을 높이기 위한 한 방법으로 자연음에 내재하는 운율 변화를 효율적으로 학습할 수 있는 인공 신경망을 제안하였다.

  • PDF

스펙트럼 기울기를 이용한 자연지진음과 인공지진음 특성 분석 (Analyzing characteristics of Natural Seismic Sounds and Artificial Seismic Sounds by using Spectrum Gradient)

  • 윤상훈;배명진
    • 대한전자공학회논문지SP
    • /
    • 제46권1호
    • /
    • pp.79-86
    • /
    • 2009
  • 본 논문에서는 자연지진음과 인공지진음 특성 분석을 위해 스펙트럼 기울기 파라미터 추출을 위한 알고리즘을 제안하였다. 신뢰성을 높이기 위해 다양한 지역에서 실험을 실시하였고 제안한 알고리즘을 이용하여 실험 데이터로부터 자연지진음과 인공지진음의 기울기 지수를 추출함으로써 특성을 분석하였다. 실험 및 분석결과 자연지진음이 인공지진음보다 스펙트럼에서 고주파 감쇠가 크고 저주파대역에 집중되어 있어 자연지진음의 기울기 지수가 인공지진음의 기울기 지수보다 높은 것으로 나타났다.

도심 교통음과 자연의 소리에 대한 음향심리 분석 (Analysis of Acoustic Psychology of City Traffic and Nature Sounds)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.356-362
    • /
    • 2009
  • 현대 사회에서는 세계 인구의 대부분이 도시에 몰려 있기 때문에, 도심의 소리는 중요한 의미를 가진다. 그 중 교통음은 가장 대표적인 도심소리 중에 하나이다. 일반적으로 도심 교통음은 환경소음으로, 대표적인 자연의 소리인 숲, 폭포소리등은 사람에게 긍정적인 효과를 주는 소리로 분류한다. 본 연구에서는 자연의 소리가 포함하는 백색잡음에 다양한 형태의 FFT보정 필터를 적용시켜, 사람이 가장 선호하는 형태의 백색잡음 주파수 특성을 발견하고 자연 소리와의 상관관계를 확인하였다. 그리고 여러 형태의 도심 교통음과 숲소리의 파형, 스펙트럼 비교를 통한 분석을 진행하였다. 분석 결과 도심 교통음이 숲소리에 비해 특정 주파수대역과 시점에 집중된 소리 에너지 특징이 있음을 발견하였으며, 이러한 특징이 사람에게 미칠 수 있는 부정적인 요소들을 확인하였다. 마지막으로 전극법 뇌파 실험을 통하여, 도심 교통음과 자연의 숲, 폭포소리를 직접 피실험자들에게 들려주어, 알파파와 베타파의 에너지 분포를 측정하였다. 측정결과 도심 교통음은 자연의 소리보다 현저하게 많은 양의 베타파를 발생 시켰으며, 반대로 자연의 소리는 많은 양의 알파파를 발생 시켰다. 이러한 결과를 통해 도심 교통음이 사람에게 미치는 부정적인 영향과 자연 소리의 긍정적인 영향을 직접적으로 확인하였다.

사운드워킹을 통한 청주시 도심지역 음풍경 조사 (Survey on the soundscape of urban districts in Cheong-ju using soundwalking)

  • 조아현;박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제40권6호
    • /
    • pp.593-606
    • /
    • 2021
  • 본 연구는 청주시의 음풍경을 파악하기 위하여 도심 지역을 특징에 따라 상업지역, 역사지역, 도심보행지역, 대학캠퍼스지역의 4가지로 구분한 뒤 총 13개 장소에서 발생되는 소리를 사운드워킹을 통하여 조사하였다. 이를 위하여 음향전문가 5인과 일반시민 65명을 대상으로 설문조사를 수행하여 지역별 소리의 크기와 불쾌감에 대해서 주관적으로 평가하도록 하였다. 또한 자연음, 인공음 및 기계음으로 구성된 35개의 신호음 보기 중 3가지를 선택하여 큰 소리, 불쾌한 소리, 듣기 좋은 소리, 대표 소리에 대한 정보를 취득하였다. 현장평가 결과, 소리의 크기와 불쾌감 사이에 매우 큰 상관관계가 있음을 알 수 있었다. 또한 지역별 신호음을 분석한 결과 상업지역은 기계음, 역사지역은 인공음과 자연음이 그 장소를 대표하는 소리로 나타났으며 도심보행지역과 대학캠퍼스의 대표 소리는 인공음인 것으로 나타났다. 한편 현장평가시 각 측정점의 상황을 녹음 및 녹화한 뒤 이를 이용해 실험실에서 20인을 대상으로 청감평가를 수행하였다. 실험실평가 결과 가장 크게 들리는 소리는 기계음과 인공음, 가장 불쾌하게 들리는 소리는 기계음, 가장 듣기 좋은 소리는 자연음과 인공음으로 나타나 현장평가와 유사한 경향성을 보여주고 있었다.

인공 신경망의 한국어 운율 발생에 관한 연구 (The Study on Korean Prosody Generation using Artificial Neural Networks)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.337-340
    • /
    • 2004
  • 한국어 문-음성 합성 시스템(TTS: Text-To-Speech)은 합성음의 자연스러움을 증가시키기 위해 운율 발생 알고리듬을 만들어 시스템에 적용하고 있다. 운율 법칙은 각국의 언어에 대한 언어학적 정보나 자연음에서 구한 운율에 대한 지식을 기반으로 음성 합성 시스템에 적용하고 있다. 그러나 이렇게 구한 운율 법칙이 자연음에 존재하는 모든 운율 법칙을 포함할 수도 없고, 또 추출한 운율 법칙이 틀린 법칙이라면, 합성음의 자연감이나 이해도는 떨어질 것이므로, TTS의 실용화에 장애가 될 수 있다. 이러한 점을 감안하여 본 논문에서는 자연음에 내재하는 운율을 학습할 수 있는 인공 신경망을 이용한 운율발생 신경망을 제안하였다. 훈련단계에서 인공 신경망의 입력 단에 한국어 문장의 음소 열을 차례로 이동시켜 인가하면 입력 단의 중앙에 해당하는 음소의 운율 정보가 출력되도록 훈련시킬 때, 목표 패턴을 이용한 감독학습을 통해, 자연음에 내재하는 운율을 학습하도록 하였다. 평가 단계에서 문장의 음소 열을 입력하고, 추정율을 측정하여 인공 신경망이 한국어 문장에 내재하는 운율을 학습하여 발생시킬 수 있음을 살펴보았다.

  • PDF

켑스트럼 분석합성형 음성합성 시스템에서의 피치변경에 따른 스펙트럼 포락 왜곡 현상에 관한 연구 (Distortion of Spectrum Envelope with Change of Pitch Period in the Cepstrum Analysis-synthesis System)

  • 김연준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1992년도 학술논문발표회 논문집 제11권 1호
    • /
    • pp.54-57
    • /
    • 1992
  • 음성합성에 있어서 음의 자연성을 합성시키는 문제는 크게 두가지로 나누어진다. 첫째는 합성음을 원음에 가깝게 구현하려는 합성방법 자체의 문제로, 언어 합성이 가지고 있는 일반적인 문제이다. 또 다른 문제는 운율에 관한 것으로 낱말 또는 문장 내에서의 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율에 따라 합성음의 자연성이 좌우된다. 이러한 운율의 조절에는 지속시간, 피치, 그리고 음의 세기 등이 이용된다. 켑스트럼을 이용하여 분석합성을 하는 경우, pole-zero 모델로 스펙트럼 포락을 근사하므로 원음에 충실하고, 필터계수와 구동정보를 분리하여 분석, 합성하므로 인위적인 운율의 조절이 용이하여 음성합성이 가지는 위의 두가지 문제를 해결하는데 적합하다고 판단된다. 본 연구에서는 켑스트럼을 이용하여 분석합성 시스템을 구성하였다. 음성 합성 과정에서, 운율 조절 파라미터중의 하나인 피치 주기의 변경에 따라 스펙트럼 포락의 왜곡에 대해 살펴보고, 왜곡을 최소화하는 방안을 제안한다.

  • PDF

한국어 문장 단위운율 발생에 관한 연구 (A Study on the Prosody Generation of Korean Sentences)

  • 민경중
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.419-423
    • /
    • 1998
  • 법칙합성 시스템은 합성단위 합성기, 합성방식 등에 따라 여러 가지 다양한 음성합성시스템이 있으나 순수한 법칙합성 시스템이 아니고 기본 합성단위를 연결하여 합성음을 발생시키는 연결합성 시스템은 연결단위사이 그리고 문장단위에서의 매끄러운 합성계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연감을 높이기 위해 보다 자연음에 가까운 운율을 발생시키기 위해 먼저 운율에 영향을 주는 요소들을 고려하여 신경망 입력 패턴을 구성한다. 분절요인에 의한 영향을 고려해주기 위해 전후 3음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다. 신경망을 훈련시키기 위한 언어자료로는 고립단어군과 음소균형 문장군 그리고 삽입음절연결어 등으로 구성한다. 특정화자로 하여금 신경망을 훈련시켜 자연음의 운율과 유사한 합성운을 발생시켰다.

  • PDF