• 제목/요약/키워드: Formant Frequent

검색결과 4건 처리시간 0.015초

음향적 요소분석과 DRNN을 이용한 음성신호의 감성 인식 (Analyzing the Acoustic Elements and Emotion Recognition from Speech Signal Based on DRNN)

  • 심귀보;박창현;주영훈
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.45-50
    • /
    • 2003
  • 최근 인간형 로봇에 대한 개발이 괄목할 만한 성장을 이루고 있고, 친근한 로봇의 개발에 중요한 역할을 담당하는 것으로써 감성/감정의 인식이 필수적이라는 인식이 확산되고 있나. 본 논문은 음성의 감정인식에 있어 가장 큰 부분을 차지하는 피치의 패턴을 인식하여 감정을 분류/인식하는 시뮬레이터의 개발과 시뮬레이션 결과를 나타낸다. 또한, 피치뿐 아니라 음향학적으로 날카로움, 낮음 등의 요소를 분류의 기준으로 포함시켜서 좀더 신뢰성 있는 인식을 할 수 있음을 보인다. 주파수와 음성의 다양한 분석을 통하여, 음향적 요소와 감성의 상관관계에 대한 분석이 선행되어야 하므로, 본 논문은 사람들의 음성을 녹취하여 분석하였다 시뮬레이터의 내부 구조로는 음성으로부터 피치를 추출하는 부분과 피치의 패턴을 학습시키는 DRNN 부분으로 이루어져 있다.

비주얼파닉스를 활용한 조음중재가 청각장애아동의 말 명료도와 모음공간에 미치는 영향 (The effect of articulation therapy using visual phonics to improve the speech intelligibility and vowel space of children with impaired hearing)

  • 심희정;이효주;서창원
    • 말소리와 음성과학
    • /
    • 제10권2호
    • /
    • pp.85-96
    • /
    • 2018
  • The purpose of this study was to investigate the effect of articulatory intervention using visual phonics to improve the speech intelligibility of children with impaired hearing. The subjects of the study were five hearing impaired children. As per the results of the UTAP articulation tests, five phonemes with the most frequent errors were selected for each child and a total of 10 sessions were provided. The methodology involved analyzing vowel space and related measures (vowel space area, vowel articulatory index, formant centralization ratio, and F2i/F2u ratio) before and after the visual phonics intervention. After the articulation intervention, every child's speech intelligibility improved, their vowel space area was widened, the FCR value decreased, and the F2ratio value increased. These results show that the use of visual phonics through symbolic images and hand clues has a positive effect in terms of improving the speech intelligibility of children with impaired hearing.

양성 부분 간질 환아에서 간질 발생 위치에 따른 음성언어 분석 (Acoustic differences according to the epileptic focus in benign partial epilepsy with centrotemporal spikes patients)

  • 김정태;최상훈;김선준
    • Clinical and Experimental Pediatrics
    • /
    • 제50권9호
    • /
    • pp.896-900
    • /
    • 2007
  • 목 적 : 정량적인 분석으로 양성 로란딕 간질환자의 간질파 발생위치에 따른 음성 언어적 특성을 알아보고자 하였다. 방 법 : 항경련제를 사용한 적이 없고, 임상 증상과 검사 소견으로 양성 로란딕 간질 증후군에 합당한 초진 환자 23명을 대상으로 음성 언어 분석을 하였다. 음성언어평가는 Computerized Speech Lab을 사용하여 분석하였다. 결 과 : 간질파 위치가 좌뇌인 환자군에서 치환에 의한 조음 오류가 빈번하게 관찰되었다. 환자군의 VOT는 정상아동($46.7{\pm}10.2ms$)과 비교해 훨씬 길게 나타났으며 특히 간질파 발생위치가 좌뇌인 환자군에서($74.3{\pm}36.6ms$) 더욱 길게 나타났다. 억양형태를 비교분석한 결과, 간질파 발생위치가 우뇌인 환자군에서 간질파 발생위치가 좌뇌인 환자군 보다 억양변화가 적어 운율 변동 폭이 낮은 것으로 평가되었다. 숫자세기의 자발화 길이측정에서 간질파 발생위치가 좌뇌인 환자군이 간질파 발생위치가 우뇌인 환자군 보다 길게 측정되었다. 결 론 : 양성 경과를 보이는 양성 로란딕 간질 환자에서도 조음오류 및 유창성 등 음성 언어적 문제점을 정량적으로 확인하였다. 따라서 양성 로란딕 간질환자의 진단과 치료 과정 중 언어음성학적인 평가를 포함시킬 것을 추천하고자 한다.

하악골 전돌증 수술 후 하악골 이동량에 따른 발음 양상에 관한 비교 연구 (COMPARISON OF SPEECH PATTERNS ACCORDING TO THE DEGREE OF SURGICAL SETBACK IN MANDIBULAR PROGNATHIC PATIENTS)

  • 신기영;이동근;오승환;성헌모;이숙향
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제23권1호
    • /
    • pp.48-58
    • /
    • 2001
  • After performing mandibular setback surgery, we found some changes in patterns and organs of speech. This investigation was undertaken to investigate the aspect and degree of speech patterns according to the amount of surgical setback in mandibular prognathic patients. Thirteen patients with skeletal Class III malocclusion were studied preoperative and postoperative over 6 months. They had undergone the mandible setback operation via bilateral sagittal split ramus osteotomy(BSSRO). We split the patients into two groups. Group 1 included patients whose degree of mandibular setback was 6mm or less, and Group 2 above 6mm. Control group was two adults wish normal speech patterns. A phonetician performed narrow phonetic transcriptions of tape-recorded words and sentences produced by each of the patients and the acoustic characteristics of the plosives, fricatives, and flaps were analyzed with a phonetic computer program (Computerized Speech Lab(CSL) Model 4300B(USA)). The results are as follows: 1. Generally, Patients showed longer closure duration of plosives, shorter VOT(voice onset time) and higher ratio of closure duration against VOT. 2. Patients showed more frequent diffuse distribution than the control group in frication noise energy of fricatives. 3. In fricatives, frequency of compact from were higher in group 1 than in group 2. 4. Generally, a short duration of closure for /ㄹ/ was not realized in the patient's flaps. Instead, it was realized as fricatives, sonorant with a vowel-like formant structure, or trill type consonant. 5. Abnormality of the patient's articulation was reduced, but adaptation of their articulation after surgery was not perfect and the degree of adaptation was different according to the degree of surgical setback.

  • PDF