• 제목/요약/키워드: 음성자료분석

검색결과 263건 처리시간 0.027초

뇌성마비 성인과 일반 성인의 음악적 발화과제 시 음성 특성 비교 (Comparison of the Vocal Characteristics of Adults with and without Cerebral Palsy on Musical Speech Tasks)

  • 박한나
    • 인간행동과 음악연구
    • /
    • 제12권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 본 연구의 목적은 뇌성마비 성인과 일반 성인에게 각각 동일한 발화과제(일반, 리듬, 선율 발화)를 제공한 뒤 집단(일반 및 뇌성마비 성인)과 발화과제에 따라 어떠한 음성 특성이 나타나는지 알아보는 것이다. 연구대상은 뇌성마비 성인 20명과 일반 성인 20명이며 프라트(Praat) 프로그램을 사용하여 발화과제에 따른 기본주파수, 음성강도, 주파수 변동률, 진폭 변동률수치를 구하였다. 각 집단의 발화 과제에 따른 음성 특성 분석 결과, 기본주파수와 음성강도의 경우 두 집단 모두 유의한 차이는 없었으나 주파수 변동률 및 진폭 변동률의 경우 일반성인집단과 뇌성마비성인집단 모두 선율 발화 시 유의하게 가장 낮은 수치를 보였다. 집단에 따른 차이를 분석한 결과, 뇌성마비성인집단의 주파수 변동률 및 진폭 변동률이 일반성인집단에 비해 유의하게 높은 수치를 보였다. 또한 일반성인집단과는 달리 뇌성마비성인집단의 경우 리듬 발화 시 주파수 변동률 및 진폭 변동률 수치가 가장 높게 나타났으며 주파수변동률의 경우 집단과 발화과제 종류에 따른 상호작용 효과가 유의해 두 집단 사이에 상이한 양상이 발견되었다. 본 연구는 발화 시 적용된 음악요소에 따라 나타나는 즉각적 음성 특성에 대한 정보를 제공해주는 기초자료로 사용될 수 있다.

한국어 마찰음 /ㅅ,ㅆ/의 지속시간에 영향을 미치는 요인에 관한 연구 (A study on the duration of Korean fricatives /s, s'/ and factors that Influence their duration)

  • 송윤경
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.333-336
    • /
    • 1999
  • 본 연구의 목적은 한국어 마찰음 /ㅅ, ㅆ/가 지속시간에 있어서 유의미한 차이를 가지고 있는가를 관찰하고, 나아가 지속시간에 영향을 미치는 요인에 어떠한 것이 있는가를 기술하는 데에 있다. 이러한 결과는 음성합성을 위한 기초자료로 이용될 수 있을 것이다. 분석 결과, /ㅅ/보다 /ㅆ/가 더 긴 지속시간을 가졌으며 마찰음을 선행하는 음소의 성질, 단어에서 마찰음이 가지는 음절 위치, 그리고 마찰음 앞에서 끊어읽기가 이루어졌는가의 여부가 지속시간에 영향을 미치는 요인으로 작용하였다.

  • PDF

근거 이론을 적용한 가상 비서의 사용자 경험 분석 - SKT 가상 비서 'NUGU'를 중심으로 - (An User Experience Analysis of Virtual Assistant Using Grounded Theory - Focused on SKT Virtual Personal Assistant 'NUGU' -)

  • 황승희;윤재영
    • 한국HCI학회논문지
    • /
    • 제12권2호
    • /
    • pp.31-40
    • /
    • 2017
  • 본 연구는 2016년 9월 1일 국내에 처음 출시된 가상 비서 음성인식 디바이스 SKT 'NUGU'의 행태를 분석하기 위한 질적 연구이다. 연구를 위해, 해당 기기를 한 달 이상 사용한 사용자 9명을 대상으로 각 1시간 이상의 심층인터뷰를 진행하였다. 인터뷰 자료는 전사하여 개방코딩, 축 코딩, 선택코딩을 통한 근거 이론을 적용하여 분석하였다. 그 결과 심층인터뷰 내용에 대한 362개의 개념을 도출하였으며 16개의 하위 범주와 10개의 상위 범주로 추상화하였다. 개방 코딩이 진행된 이후에는 축 코딩을 통해 전반적인 사용 행태를 파악하고자 패러다임 모형을 제시하였다. 선택코딩을 진행하여 이야기 윤곽의 전개를 통한 핵심범주를 도출하였으며, 코딩의 결과로 사용 행태를 유형화하였다. 유형화 결과, 크게 의존형과 탐구형의 사용 행태를 보임을 확인할 수 있었으며, 각 유형이 해당 기기에 관하여 어떠한 콘텐츠를 선호하며, 어떤 불편사항이 있는지 분석하였다. 그 결과, 의존형 사용자는 음성인식 기술을 활용한 스피커 제어 기능 때문에 구매하였고, 기기의 제어 방식에서는 대체로 만족하였으나 가상 비서 서비스를 다각도로 활용하기보다는 음성제어가 가능한 블루투스 스피커로 이용하는 한계를 보였다. 탐구형 사용자는 스마트홈과 관련된 사물인터넷 관련 제어를 활용하거나 양방향 소통을 시도 하였으나, 현재 해당기기와 연결되는 서비스가 부족하고, 원활한 양방향 소통이 불가능하다는 한계를 느껴 지속적인 사용에 어려움을 느끼고 있었다. 본 연구는 이러한 분석 결과를 기반으로 향후에 국내 가상 비서 서비스를 제안하고자 할 때에 활용할 수 있는 가상 비서의 사용자 경험에 관한 기초 자료를 제시하였다.

언어재활을 위한 한국어의 음향적 분석과 선율화 (Acoustic Analysis and Melodization of Korean Intonation for Language Rehabilitation)

  • 최진희;박정미
    • 인간행동과 음악연구
    • /
    • 제21권1호
    • /
    • pp.49-68
    • /
    • 2024
  • 본 연구의 목적은 한국어의 특성을 음향학적으로 분석하고, 해당 분석 결과를 음악적 요소로 변환하여 생성된 선율의 예시를 제시함으로써, 근거 기반 음악-언어재활 프로그램 개발을 위한 기초 자료를 마련하는 데 있다. 이를 위해 19-25세의 남성과 여성 각각 30명으로부터 3음절의 두 강세구로 이루어진 6음절 한국어의 음성자료를 수집하였으며, 평서문과 의문문을 포함하였다. 이를 Praat 프로그램으로 분석하여 음절별로 음향적 속성을 추출하고, 각 음향적 속성, 문장 유형, 성별, 조사의 유무에 대한 통계분석을 실시하였다. 분석 결과 강세구, 억양구에 따라 각 음절의 주파수와 지속시간에 유의미한 차이가 발견되었고(p < .001), 의문문이 평서문보다 주파수가 유의미하게 높았으며(p < .001), 평서문이 유의미하게 긴 경향을 보였다(p < .001). 여성 집단이 남성 집단보다 주파수가 유의미하게 높았으며(p < .001), 지속시간도 유의미하게 긴 경향을 보였다(p < .001). 또한 조사인 음절의 강도가 유의미하게 세게 나타났다(p < .001). 마지막으로 본 연구에서는 문장 유형, 성별, 조사의 유무에 따라 나타난 음향적 속성을 음악적 요소인 음고, 음가, 악센트로 변환한 선율들을 악보로 제시하였다. 본 연구에서는 6음절 한국어문장을 대상으로 한 분석을 제시하였으며, 이 연구를 통해 얻은 통찰을 바탕으로 후속 연구에서는 대규모 한국어 음성 데이터의 선율화 시스템 개발 연구를 진행하려 하며, 이는 음악을 활용한 언어재활 분야의 기초 자료로서 중요한 역할을 할 수 있을 것으로 기대한다.

토양수분량 측정 현황 및 분석 (Study on the Characteristic Analysis of Soil Moisture)

  • 이정훈;장은세;이연길;김상현;정성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.223-223
    • /
    • 2016
  • 수문 순환과 물 수지에 관한 연구는 강수량, 지표유출량, 지하수, 토양수분 및 증발산량 등에 대한 관측이 이루어질 때 실제로 규명될 수 있다. 특히 국내 지형의 대부분을 차지하고 있는 산림 사면에서 토양수분량 측정은 물순환을 이해하는데 중요한 것으로 판단된다. 본 연구는 국토교통부의 기초수문자료 구축사업의 일환으로 수행되고 있으며, 수문자료의 다양화 목적을 가지고 TDR(Time Domain Reflectometry, TDR) 장비를 이용하여 2시간 간격으로 2015년 3월부터 12월까지 측정을 수행하였다. 관측지점은 경기도 파주시 적성면 설마리의 설마천 유역 내에 위치한 감악산내 범륜사 주변 사면과, 충청북도 음성군의 청미천 유역내의 수레의산 산지 사면에서 수행하였다. 관측소에서 측정된 토양수분량 자료는 토양수분량의 시공간적 분포 특성을 파악하기 위해 토양수분량의 통계분석(평균, 표준편차, 변동계수)를 수행하였다. 설마천유역의 설마천 관측소에서는 2015년 강수량이 적어 2014년의 토양수분량 평균값보다 낮게 측정되었다(평균 12.96%, 표준편차 2.2%). 청미천유역의 청미천 관측소에서도 설마천관측소와 마찬가지로 과거보다 적은 강수량이 발생하였지만, 설마천 관측소와는 다르게 안정적인 토양수분 평균값을 유지하는 것은 설마천 관측소 보다 토양층이 발달하고 토성의 점토 함량이 상대적으로 높기 때문으로 보인다. 청미천 관측소의 토양수분량은 평균 24.3%, 표준 편차 1.7%로 나타났다.

  • PDF

발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석 (Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System)

  • 이경님;정민화
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.656-664
    • /
    • 2002
  • 본 논문에서는 한국어 발음열 자동 생성기를 이용하여 한국어의 음운 규칙에 대한 통계적 분석을 수행하였다. 실험에 사용한 발음열 자동 생성기는 한국어 음운 변화 현상에 대해 형태음운론에 기반 한 언어학적 분석과 문교부 표준어 규정의 표준 발음법에서 유도된 필수 및 수의적 음소 변동 규칙과 변이음 규칙의 단계적 적용 모델을 사용해서 구현되었으며, 특히 연속음성 인식을 위한 학습용 발음열과 인식용 발음사전 생성의 최적화를 목표로 하였다. 본 논문에서는 대어휘 연속음성 인식기의 음향 모델을 구축하기 위해 만들어진 삼성 PBS(Phonetically Balanced Sentence) 음성 데이터 베이스의 60,000문장에 적용된 발음열 생성기의 음소 변동규칙들의 분포 및 그 통계를 사용해서 한국어 음운 변화 양상을 분석하였다. 적용된 빈도수를 기준으로 분석한 결과, 필수음소 변동규칙의 경우는 연음법칙, 경음화, 격음화, 장애음의 비음화순으로, 수의적 음소 변동규칙의 경우는 초성 ㅎ 탈락, 중복 자음화, 동일 조음위치 자음탈락 순으로 음운 변화가 발생하였다. 이러한 적용 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 양상을 파악할 수 있었으며, 나아가 본 논문의 연구 결과는 음성 인식 시스템을 개발하는데 유용하게 사용할 수 있을 것이다.

성문(聲紋)과 사상체질(四象體質)과의 상관성(相關性)에 관(關)한 연구(硏究) (A Study on the Correlation between Sound Spectrogram and Sasang Constitution)

  • 양승현;김달래
    • 사상체질의학회지
    • /
    • 제8권2호
    • /
    • pp.191-202
    • /
    • 1996
  • 사상의학(四象醫學)에 있어서 체질변증(體質辨證)은 매우 중요한 과제로서 많은 의가(醫家)들에 의해 연구되고 있으나 지금까지 객관적으로 인정된 방법은 없다고 하겠다. 본 연구는 성문(聲紋)과의 상관성(相關性)을 통하여 사상체질(四象體質) 변증(辨證)에 도움이 되고자 하였다. 태음인(太陰人) 26명, 소음인(少陰人) 25명, 소양인(少陽人) 15명의 음성(音聲)울 녹음하여 시간 측정을 하였고, 성문분석기로 음성의 기본주파수(基木周波數)를 분석하여 비교하였으며 결과는 다음과 같다. 1. 태음인, 소음인, 소양인의 측정된 문장 발음 속도는 유사한 경향을 보였다. 2. 기본주파수 빈도분포그래프와 정규분포 그래프에서 태음인의 중심값이 소음인과 소양인에 비해 낮게 나타났으며, 소음인과 소양인 사이의 중심값은 유사한 경향을 보였다. 3. 기본주파수 빈도분포 그래프와 정규분포 그래프에서 폭의 경우는 체질 간에 유사한 경향을 보였다. 4. 세 체질의 기본주파수 평균값의 경우 태음인은 소음인에 비해 낮게 나타나서 태음인과 소음인은 통계학적으로 유의적인 차이점이 인정되었으며, 이는 태음인의 저음 사용이 소음인에 비하여 많음을 의미 한다고 볼 수 있다. 따라서 성문의 기본주파수 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다. 제언 및 문제점 1. 문장뿐만 아니라 실제 대화음성의 분석이 필요할 것으로 생각된다. 2. 좀 더 많은 자료의 수집 분석이 필요하며, 남성뿐만 아니라 여성과 연령별로의 분석도 연구되어야 한다고 생각된다. 3. 녹음시의 여러 변수, 예를 들연 녹음시의 잡음, 조사대상자의 긴장, 또는 감기나 기타 질병으로 인한 음성변화 등에 대한 문제점도 주의해야 할 것으로 생각된다. 4. 기본주파수이외의 다른 변수, 예를 들어 공명주파수나 음의 강도등을 이용한 체질과의 상관성에 관한 연구가 필요하다고 생각된다.

  • PDF

과학영재학교 재학생 영어발화 주파수 대역별 음향 에너지 분포의 영어 성취도 예측성 연구 (A study on the predictability of acoustic power distribution of English speech for English academic achievement in a Science Academy)

  • 박순;안현기
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.41-49
    • /
    • 2022
  • 본 연구는 미국영어 화자의 평균적 음향 스펙트럼 분포를 확보한 후 과학영재학교 재학생의 영어발화 양상을 비교하여 상대적으로 우수한 지적 역량을 갖춘 우리나라 과학영재들의 초분절적 영어 유창성 양상을 규명하고, 그 근접성 정도가 영재학교 학생의 영어 과목 정기고사 성취도와 어떤 관계성을 갖는지 탐구하고자 진행되었다. 불과 수 초에서 수십 초에 불과한 음성녹음 데이터 위주로 분석을 시행했던 종래의 연구와 달리 총 4시간에 달하는 미국영어 원어민 화자(남성 15명, 여성 15명)의 음성녹음 자료를 MATLAB(R2022a; The Math Works) 코드로 분석하여 20 -20,000 Hz 주파수 범위 내의 대역별로 장기 스펙트럼 음향에너지 분포값을 확보했으며, 이를 기준으로 과학영재학교 1학년 신입생 80명의 녹음데이터 LTASS(long-term average speech spectrum) 분석 수치와 비교한 결과, 영어 과목 학기말고사의 학업성취도 수준이 상위 30% 이내인 학생들의 표본을 제외하고는 미국영어 음향에너지 분포와의 근접성이 통계적으로 유미하지 않다고 밝혀졌다. 영재학교 입학 후 영어 성취도를 예측하기 위한 지표를 발견하기 위해 수용성 어휘크기검사(receptive vocabulary size test), 학기 중 복수 회 실시한 영어 어휘 형성평가 퀴즈 누적 점수, 공인 영어말하기시험(English Speaking Proficiency Test, ESPT) 성취도를 추가 변량으로 하여 정기고사 성취도와의 상관관계 분석 및 각 변량 간 선형 회귀분석을 시행하였는데, 대개 유년시절 완성되는 영어 유창성을 측정하는 ESPT보다는, 1학기 및 2학기 초 실시한 수용성 어휘크기검사 및 수과학 분야 저빈도 어휘 위주 형성평가 점수와의 통계적 유의성이 월등히 높다는 사실이 관찰되었다. 따라서, 본 연구로부터 확보된 이론적 기반을 토대로 국내 영재학교에서는 발음교육보다 과학영재를 주요 대상으로 한 전문적 수준의 저빈도어휘 교육이 보다 효과적인 교수 요목이라 추정할 수 있다.

발화행태 특징을 활용한 응급상황 신고자 연령분류 (Age classification of emergency callers based on behavioral speech utterance characteristics)

  • 손귀영;권순일;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권6호
    • /
    • pp.96-105
    • /
    • 2017
  • 본 논문에서는 실제 응급상황센터에 접수된 신고전화의 음성분석을 통하여 발화자의 연령을 분류하고자 한다. 2가지 발화행태적 특징요소인 무성휴지(Silent Pause), 대화반응시간(Turn-taking latency)를 활용하여 성인과 노인을 분류할 수 있는 특징에 대한 분류기준을 선정하고, 이를 기계학습 분류기인 SVM(Support Vector Machine)을 활용하여 분류정확도를 확인하였다. 먼저, 응급상황센터의 실제 신고전화에 대하여 발화행태적 특징 요소를 기반으로 청취분석을 통하여 발생길이에 대하여 성인과 노인사이에 통계적으로 유의하다는 것을 확인하였다(p<0.05). 또한, 성인과 노인 각 100개, 총 200개의 음성데이터를 5차 교차검증방법을 사용하여 기계학습을 실행한 결과, 2가지의 발화행태를 모두 사용한 복합기준(무성휴지+대화반응시간)일 경우, 70%의 가장 높은 분류정확도를 확인할 수 있었다. 본 연구의 결과는 음성에 기반한 연령을 분류하는 연구에 있어서, 기존의 음성정보와 더불어, 새로운 발화행태적 특징요소와의 결합을 통하여 연령구분을 가능하게 하는 새로운 방법으로 제안할 수 있을 것이다. 또한, 향후 음성기반 상황판단 시스템 기술 개발에 있어서 기초자료로 적용이 가능하며, 이를 통하여 신속한 연령분류를 판단을 통한 상황대처가 가능하도록 하는 데에 기여할 수 있을 것이다.

수술실 간호오류 예방을 위한 사례중심 멀티미디어 학습콘텐츠 개발 (Development of Case-based Multimedia Learning Contents for Preventing Malpractice in Operating Room)

  • 박지명;황선영
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.522-532
    • /
    • 2016
  • 본 연구에서는 수술실에서의 간호오류 예방을 위한 간호사 대상의 교육을 목적으로 문헌고찰과 실제 경험한 오류사례와 요구도 조사 및 수술실 사건보고서 자료 분석을 통하여 사진, 음성녹음, 플래시 애니메이션, 동영상 자료를 활용한 사례중심 멀티미디어 학습콘텐츠를 개발하였다. 1시간 분량의 학습콘텐츠는 4가지 학습영역으로 구성되었으며, 학습영역별로 성우의 음성과 함께 플래시애니메이션을 활용한 실제 간호오류 사례를 이야기 형식으로 제공함으로써 학습자로부터 흥미와 현장감을 높였다. 또한 각 영역별 사례를 통해 학습자에게 비판적 사고를 유도하였고 표준화된 수술실 간호업무프로토콜을 대처방안으로 제시함으로써 교육의 효과성을 높이고자 하였다. 본 연구에서 개발된 학습콘텐츠는 신규간호사 뿐만 아니라 경력 간호사의 수술실 간호오류 예방을 위한 교육용 자료로써 실무에서 활용될 수 있기를 바라며, 콘텐츠의 지속적인 수정 보완을 위한 시스템 마련과 지원이 필요할 것으로 본다.