• 제목/요약/키워드: 음성자료분석

검색결과 263건 처리시간 0.034초

연속 숫자음의 음절 수 검출

  • 김득수
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1998년도 공동추계학술대회 경제위기 극복을 위한 정보기술의 효율적 활용
    • /
    • pp.785-790
    • /
    • 1998
  • 본 논문은 한국어 숫자를 연속적으로 발음한 음성의 음절 개수 검출에 관한 내용이며 음절의 최소구간 및 스펙트럼 에너지에 대한 확률밀도함수를 이용하여 연속 음성에서 음절갯수검출 알고리듬을 제안, 실험을 통하여 그 유효성을 확인하고자한다. 이를 위하여 음성자료로서는 국어 공학센터(KLE)에서 채록한 4연속 숫자음을 사용하며 음향학적 특징을 분석하기 위하여 확률밀도함수 및 음절의 최소구간 및 단위시간의 확률밀도 함수의 값을 이용하였다. 그 결과 KLE 데이터에서 스펙트럼에너지만 이용한 경우 고립음절을 3.7%이며 본 논문의 알고리듬을 적용한 경우 4음절은 약 60%의 결과가 되며 제안한 방법의 유효성을 확인하였다.

음성합성 플랫폼을 위한 언어처리부의 설계 및 구현 (Design and Implementation of the Language Processor for Educational TTS Platform)

  • 이상호
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.219-222
    • /
    • 2005
  • 본 논문에서는 한국어 TSS 시스템을 위한 언어처리부의 설계 및 구현 과정을 설명한다. 구현된 언어처리부는 형태소 분석, 품사 태깅, 발음 변환 과정을 거쳐, 주어진 문장의 가장 적절한 발음열과 각 음소의 해당 품사를 출력한다. 프로그램은 표준 C언어로 구현되어 있고, Windows와 Linux에서 모두 동작되는 것을 확인하였다. 수동으로 품사가 할당된 4.5만 어절의 코퍼스로부터 형태소 사전을 구축하였으며, 모든 단어가 사전에 등록되어 있다고 가정할 경우, 488문장의 실험 자료에 대해 어절 단위 오류율이 3.25%이었다.

  • PDF

A SPECTROGRAPHICAL STUDY OF KOREAN VOWELS

  • 이현복;지민제
    • 대한음성학회지:말소리
    • /
    • 제6호
    • /
    • pp.4-12
    • /
    • 1983
  • 이 논문은 음향 분석기를 이용하여 한국어의 단순모음 8개를 음향 음성학적으로 분석하고 그 결과를, 이 현복의 1971년 논문 "현대 서울말의 모음 음가"에서 기분 모음을 기준으로 하여 기술한 단순 모음의 소리값과 비교하는 데어 목적이 있다. 특히, 한국어의 모음 1)길고 세게 날 때, 2)짧고 세게 날 때, 그리고 3) 여리게 날 때의 세가지 환경에 따라 변이음의 음가가 달리 나타난다는 이 현복의 이론을 음향 음성학적으로 확인해 보는 것이 연구를 하는 주요 관심사이다. 이 실험에 사용된 자료는 위에 말한 이 현복의 논문과 "한국어 음성학"(김선기, 1937, 1971; 영문)에 제시된 낱말로 이루어져 있으며, 이를 스웨덴에 유학중인 지 민제가 자신의 목소리로 직접 녹음하여 위메오 대한 음성학과의 음향 음성학 실험실에서 음향분석기로 분석한 다음, 각 모음의 제1 및 제2포인트를 측정하여 리를 토대로 음향도를 만들었다. 이 실험 결과는 다음과 같이 요약할 수 있다. : 1)그림 2,3과 포먼트 표에서 보인 바와 같이, 모음 /이, 에, 오, 으/는 각각 이 현복의 주장대로 환경에 따라 세 개의 분명히 다른 음가를 나타내고 있다. 2) 한편 모음 /애, 아, 우, 어/는 모음의 길이에 따라 다만 두 종류의 음가 변동이 나타날 뿐이며 강세의 유무에 따른 음가 차이는 드러나지 않았다. 3) 이 현복의 주장대로 모음 /에/와 /애/mss 음가의 차이가 크지 않으므로 음운 대립이 무디어질 수 있음을 이번 실험 결과로 확인 하였다. 특히 강세가 없는 /에/는 강세가 있는 /애/와 소리값이 거의 같았다. 4) 이 현복은 표준말에서 /어/의 음가가 세대에 따라 다르며, 안정된 세대의 말씨에서는 /어:/가 /어/에 비해 높고 중앙화한 소리값을 지닌다는 주장을 하였다. 그러나 이 실험 연구에서는 녹음한 이가 젊은 세대이어서 인지 그러한 현상이 나타나지 않았고, 다만 /어:/는 /어/보다 높이만이 높은 것으로 나타났다. 5) 이번 실험 연구에서 모음의 소리값이 장단과 강세에 따라 달라진다는 이 현복의 주장이 대체로 증명된 셈이나, 종합적이고 확고한 결론을 내리려면 좀 더 광범한 실험 연구가 필요하다고 본다. 특히 안정된 세대의 말씨를 직접 녹음하여 음향 음성학적으로 분석함이 필요하다.

  • PDF

신경망을 이용한 한국어 운율 발생에 관한 연구 (A Study on the Prosody Generation of Korean Sentences using Neural Networks)

  • 이일구;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.65-69
    • /
    • 1999
  • 합성단위, 합성기, 합성방식 등에 따라 여러 가지 다양한 음성합성시스템이 있으나 순수한 법칙합성 시스템이 아니고 기본 합성단위를 연결하여 합성음을 발생시키는 연결합성 시스템은 연결단위사이의 매끄러운 합성계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연음에 존재하는 운율법칙을 정확히 구현하면 합성음의 자연감을 높일 수 있으나 존재하는 모든 운율법칙을 추출하기 위해서는 방대한 분량의 언어자료 구축이 필요하다. 일반 의미 문장으로부터 운율법칙을 추출하는 것이 바람직하겠으나, 모든 운율 현상이 포함된 언어자료는 그 문장 수가 극히 방대하여 처리하기 힘들기 때문에 가능하면 문장 수를 줄이면서 다양한 운율 현상을 포함하는 문장 군을 구축하는 것이 중요하다. 본 논문에서는 음성학적으로 균형 잡힌 고립단어 412 단어를 기반으로 의미문장들을 만들었다. 이들 단어를 각 그룹으로 구분하여 각 그룹에서 추출한 단어들을 조합시켜 의미 문장을 만들도록 하였다. 의미 문장을 만들기 위해 단어 목록에 없는 단어를 첨가하였다. 단어의 문장 내에서의 상대위치에 따른 운율 변화를 살펴보기위해 각 문장의 변형을 만들어 언어자료에 포함시켰다. 자연감을 높이기 위해 구축된 언어자료를 바탕으로 음성데이타베이스를 작성하여 운율분석을 통해 신경망을 훈련시키기 위한 목표패턴을 작성하였다 문장의 음소열을 입력으로 하고 특정음소의 운율정보를 발생시키는 신경망을 구성하여 언어자료를 기반으로 작성한 목표패턴을 이용해 신경망을 훈련시켰다. 신경망의 입력패턴은 문장의 음소열 중 11개 음소열로 구성된다. 이 중 가운데 음소의 운율정보가 출력으로 나타난다. 분절요인에 의한 영향을 고려해주기 위해 전후 5음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다. 특정화자로 하여금 언어자료를 발성하게 한 음성시료의 운율정보를 추출하여 신경망을 훈련시킨 결과 자연음의 운율과 유사한 합성음의 운율을 발생시켰다.

  • PDF

딥러닝 기반의 반려견 감정 판단 기법에 관한 연구 (A Study on Dog-emotion judgment method Based on Deep Learning)

  • 김민구;김세하;고유정;이현서;박준호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.449-450
    • /
    • 2022
  • 반려견의 행동인식기술은 다양한 센서들에서 입력되는 반려견의 동작과 관련된 정보를 분석하고 해석하여 반려견이 어떤 행동을 취하고 있는지를 인식하는 기술이다. 음성인식기술은 컴퓨터가 청각 자료를 수집, 분석하여 훈련된 데이터와 비교를 통해 소리를 분류하는 기술이다. 본 논문에서는 딥러닝을 기반으로 행동인식기술과 음성인식기술을 적용하여 반려견의 감정을 판단하는 기법을 제안한다. 이러한 기법은 반려견의 감정을 쉽게 파악하여 반려견 보호자가 반려견의 행동과 감정에 대한 이해를 쉽고 빠르게 할 수 있으므로, 보호자에게 즐거운 반려 생활이 가능하도록 도움을 줄 수 있다.

  • PDF

청각장애학생의 영어 발성 주파수별 특징 분석 (Feature analysis of deaf students' English language by frequency)

  • 이근민;박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.819-828
    • /
    • 2014
  • 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하여 그 특징들을 반영할 수 있는 맞춤형 영어 학습 보조 도구를 개발하기 위한 기초자료를 제시하고자 한다. 본 논문에서는 청각장애학생들의 영어 발성의 특징을 분석하기 위해서 서울과 대구에 있는 청각특수학교의 학생들을 대상으로 직접 방문하여 녹음하였으며, 음성파일을 분석하기 위해 음성분석 전문 프로그램인 플라트 프로그램을 활용하였다. 청각장애학생들의 영어 발성의 특징은 플라트 프로그램을 통해 음성학에서 사용하는 음성의 특징 값들을 추출하여, 그 특징 값들을 이용하여 비장애학생의 영어 발성의 특징과 비교분석하였다.

CSL을 통한 음향특성과 사상체질간의 상관성 연구 (An Study on the Correlation between Sound Characteristics and Sasang Constitution by CSL)

  • 신미란;김달래
    • 사상체질의학회지
    • /
    • 제11권1호
    • /
    • pp.137-157
    • /
    • 1999
  • 1. 연구배경 사상인은 생리 및 병리 현상에 차이를 나타낼 뿐만 아니라 섭생법 및 치료법에서도 각기 다른 방법을 적용하고 있다. 그러므로 사상의학에 있어서 체질변증분야가 매우 중요한 과제라 하겠다. 동무는 사상인변증의 진단지표를 외형 심성 병증 등을 제시하였고, 많은 의가들에 의해 여러 가지 새로운 체질변증의 방법이 모색되어 임상에 시도 활용되고 있는 추세이나 체질변증의 객관성유지에 어려운 점이 많아서 학문의 발전에 적지 않은 난관이 따랐다. 최근에는 음성과학의 발달에 힘입어 음성의 특성을 가시적 수치적으로 객관화 할 수 있는 가능성이 높아졌다. 본 연구는 이러한 음성과학을 바탕으로 여러 의가들에 의해 제시되어 온 사상인의 음성적 특정을 각 개인의 사상체질과 직접적으로 연관성이 있다고 판단되는 공명주파수와 기본주파수 등 여러 음성학적인 pattern자료들을 모집단으로부터 획득하여 체질별로 객관적인 수치로 비교 분석함으로써 음성과 체질과의 관계에 대하여 살펴보고 개인의 성문에 의한 사상체질 판단의 기본자료로 활용하고자 하였다. 2. 연구방법 상지대한의과대학 남학생 132명과 기타8명을 대상으로 하였다. 음향특성과 체질과의 상관성에 관하여 문헌조사를 하였다. 설문지와 체질전문가에 의하여 연구대상자를 체질 판별하였다. 연구대상자의 음성특성에 대한 설문조사를 하였고 CSL로 Pitch. Formant Frequency. Energy, Time of reading composition 등을 분석하고 통계 처리하여 체질 판별을 시도하였다. 3. 연구결과 1) 설문조사결과 소음인은 음성이 낮고 완만하며 조용한 편으로, 소양인은 음성이 높고 밝으며 급하고 함부로 말을 하는 것으로, 태음인은 음성이 낮고 무거우며 완만하고 굵고 성량이 풍부한 것으로 나타났다. 2) 문장의 평균 발음 시간에서 태양인은 다른 체질에 비하여 유의성 있게 길었다. 몸무게에서 태음인은 다른 체질에 비하여 유의성 있게 높았다. Formant frequency 1에서는 태양인이, Bandwidth 1에서는 소음인과 태양인이 다른 체질에 비하여 유의성 있게 낮았으며, Bandwidth 2와 Formant frequency 5에서는 태양인이 유의성 있게 높았다. Pitch Maximum과 Pitch Maximum-Pitch Minimum에서는 소음인과 태양인이 유의성 있는 차이를 나타내었다. Energy Mean에서는 태양인과 태음인에서 유의성 있는 차이를 나타내었다. 3) Multi-dimensional 4-class minimum-distance classifier 분석결과 모든 항목으로 분석한 것 보다 체질별로 특정 항목을 갖고 분석한 것이 높은 일치를 나타내었다. SPSS/PC+프로그램에서 일원분산분석과 판별분석결과 네 체질사이에서의 정판별력보다 소양인을 제외한 3체질 사이에서의 정판별력이 높았다. CART모형에서 앞에서 제시된 다른 방법들보다 높은 예측율을 보이고 있다. 연구수행과정 중에 표준화, 녹음기술, 적적한 문장의 선택, 음성분석 항목선택, 통계기법, 적절한 알고리즘의 개발 등의 많은 문제점이 나타나고 있으며 관련분야의 보완과 연구진행이 지속적으로 있어야 할 것으로 사려 된다. 다각도로 진행되고 있는 사상의학에서의 객관화 노력과 통계적인 방법론들이 적용되고 체질진단에 있어 가장 최적의 알고리즘을 찾아낼 수 있다면, 정확한 체질 진단과 더불어 그에 따른 환자들의 치료와 약물처방에 있어서도 많은 도움을 줄 수 있으리라 생각된다. 성문과 음성특성의 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다.

  • PDF

추체외로 증상에 따른 항정신병 약물 복용량과 음성 특성의 상관관계 분석 (Correlation analysis of antipsychotic dose and speech characteristics according to extrapyramidal symptoms)

  • 이수빈;김서영;김혜윤;김의태;유경상;이호영;이교구
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.367-374
    • /
    • 2022
  • 본 논문은 항정신병 약물의 복용량에 따른 음성 특징의 상관관계 분석을 수행하였다. 항정신병 약물의 대표적 부작용 중 하나인 추체외로 증상(ExtraPyramidal Symptoms, EPS) 발생에 따른 음성 특징의 패턴을 알아보기 위하여, 문장 개발을 통해 한국어 기반 추체외로 증상 음성 코퍼스를 구축하였다. 수집된 자료는 추체외로 증상 군과 비 추체외로 증상 군으로 나누어 음성 특징 패턴을 조사하였으며, 특히 추체외로 증상 군의 높은 음성 특징 상관관계를 보였다. 또한, 발화 문장의 종류가 음성 특징 패턴에 영향을 미친다는 것을 확인할 수 있었으며, 이를 통해 음성 특징을 기반한 추체외로 증상의 조기 발견 가능성을 기대해볼 수 있었다.

장애음성의 음향학적 분석에서 유성음 문장의 임상적 유용성에 관한 연구 (A study on the clinical utility of voiced sentences in acoustic analysis for pathological voice evaluation)

  • 김지성
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.298-303
    • /
    • 2023
  • 본 연구는 장애음성의 평가에 사용되는 연속발화과제로서 유성음 문장의 임상적 유용성을 알아보기 위한 것이다. 이를 위해, 모음연장발성과제의 음향학적 측정치인 주파수 변동률(jitter percent, jitter), 진폭 변동률(shimmer percent, shimmer), 소음대배음비(Noise to Harmonic Ratio, NHR)와 유성음으로만 이루어진 연속발화과제의 음향학적 측정치로 캡스트럼 분석 측정치인 켑스트럼 피크 현저성(Cepstral Peak Prominence, CPP), 저주파수대고주파수 스펙트럼비(Low/High spectral ratio, L/H ratio)의 상관을 분석하였다. 음성장애 환자 65명을 대상으로 수집된 자료를 분석한 결과, 유성음 문장의 음향학적 측정치인 CPP와 모음연장발성의 측정치인 jitter(r = -.624, p = .000), shimmer (r = -.530, p = .000), NHR(r = -.469, p = .000) 간에 유의한 상관이 나타났다. 이는 유성음 문장의 캡스트럼 측정치가 '연속발화 과제의 변동률 기반 분석 불가능', '분석구간과 길이에 따른 결과차이' 등 언어재활 임상현장이 가지고 있는 장애음성의 음향학적 분석의 제한에 대한 대안으로 유용하게 사용될 수 있음을 시사한다.

인공 신경망의 한국어 운율 학습 (Learning of Artificial Neural Networks about the Prosody of Korean Sentences.)

  • 신동엽;민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.121-124
    • /
    • 2001
  • 음성 합성기의 합성음의 자연감을 높이기 위해 자연음에 내재하는 정확한 운율 법칙을 구하여 음성합성 시스템에서 이를 구현해 주어야 한다 무제한 어휘 음성합성 시스템의 문-음성 합성기에서 필요한 운율 법칙은 언어학적 정보를 이용해 구하거나, 자연음에서 추출하고 있다 그러나 추출한 운율 법칙이 자연음에 내재하는 모든 운율 법칙을 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 본 논문에서는 한국어 자연음을 분석하여 추출한 운율 정보를 인공 신경망이 학습하도록 하고 훈련을 마친 인공 신경망에 문장을 입력하고, 출력으로 나오는 운율 정보와 자연음의 운율 정보를 비교한 결과 제안한 인공 신경망이 자연음에 내재하고 있는 운율을 학습할 수 있음을 알 수 있었다. 운율의 3대 요소는 피치 , 지속시간, 크기의 변화이다. 제안한 인공 신경망이 한국어 문장의 음소 열을 입력으로 받아들이고, 각 음소의 지속시간에 따른 피치변화와 크기 변화를 출력으로 내보내면 자연음을 분석해 구한 각 음소의 운율 정보인 목표 패턴과 출력 패턴 의 오차를 최소화하도록 인공 신경망의 가중치를 조절할 수 있도록 설계하였다. 지속시간에 따른 각 음소의 피치와 크기 변화를 학습시키기 위해 피치 및 크기 인공 신경망을 구성하였다. 이들 인공 신경망을 훈련시키기 위해 먼저 음소 균형 문장 군을 구축하여야 하고, 이들 언어 자료를 특정 화자가 일정 환경에서 읽고 이를 녹음하여 , 분석하여 구한운율 정보를 운율 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속 시간과 피치 변화 그리고 크기 변화를 구하고, 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기 값을 구해 운율 데이터베이스를 구축한다. 이 운율 데이터베이스의 일부는 인공 신경망을 훈련시키는데 이용하고, 나머지로 인공 신경망의 성능을 평가하여 인공 신경망이 운율 법칙을 학습할 수 있었다. 언어 자료의 문장 수를 늘리고 발음 횟수를 늘려 운율 데이터베이스를 확장하면 인공 신경망의 성능을 높일 수 있고, 문장 내의 음소의 수를 감안하여 인공 신경망의 입력 단자의 수는 계산량과 초분절 요인을 감안하여 결정해야 할 것이다

  • PDF