• 제목/요약/키워드: 포먼트 주파수

검색결과 30건 처리시간 0.023초

평양 지역어와 서울 지역어의 자음에 대한 음성신호 파라미터들의 비교 연구 - "ㅅ/ ㅆ"을 중심으로 (A Comparative Study of the Speech Signal Parameters for the Consonants of Pyongyang and Seoul Dialects - Focused on "ㅅ/ㅆ")

  • 소신애;이강희;유광복;임하영
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권6호
    • /
    • pp.927-937
    • /
    • 2018
  • 본 논문은 공학적 응용의 기초가 되는 신호 처리의 관점에서 한국어의 평양 지역어의 자음과 서울 지역어의 자음에 대한 비교 연구를 수행하였다. 지금까지 대다수의 음성학적 연구는 언어의 진화에서 중요한 역할을 하는 모음을 중심으로 이루어져 왔다. 그러나 어떤 언어든 거의 모든 경우 자음의 수가 모음의 수보다 많다. 따라서 자음에 대한 음성학적 연구 또한 언어 연구에서 중요한 것이다. 본 논문은 음운론적 또는 실험음성학적 방법들로 진행된 평양 지역어의 모음 연구에 더하여 공학적인 방법으로 자음 연구를 수행하였다. 평양 지역어와 서울 지역어에서 음가상 많은 차이를 보이는 치경 자음을 데이터로 하였고 음성신호의 주요한 파라미터들 - 포먼트 주파수, 피치, 스펙트로그램 등 - 을 측정하였다. 한국어 /시/와 /씨/에 대한 두 지역어의 음가를 비교하였다. 이러한 연구는 앞으로 음성 인식과 음성 합성을 위한 기초 자료로 활용될 수 있을 것이다.

청각 주파수 응답에 기반한 자동 모음 개시 지점 탐지 (Automatic Vowel Onset Point Detection Based on Auditory Frequency Response)

  • 장한;김학태;정길도
    • 한국산학기술학회논문지
    • /
    • 제13권1호
    • /
    • pp.333-342
    • /
    • 2012
  • 이 논문에서는 인간 청각 시스템에 기반한 모음 개시 지점 (VOP) 탐지 방법을 제시하였다. 이 방법을 통해 '지각의' 주파수 범위, 즉 선형 음향 주파수에서의 Mel Scale을 보여준 후 일련의 삼각 Mel-weighted Filter Bank를 만들어 인간의 청각 시스템에서 대역 필터링 기능을 시뮬레이션하였다. 이러한 비선형 임계 대역 Filter Bank는 데이터 차원수를 크게 감소시키고 비선형적으로 간격을 둔 Mel 스펙트럼에서 더욱 효과적으로 포먼트를 생성하기 위해 조파들의 영향을 제거해준다. Mel 스펙트럼의 첨두 에너지 합은 각 프레임의 특징으로 추출하고 에너지 진폭이 급격히 상승하기 시작할 때의 특성은 Gabor 윈도우를 사용하여 VOP로 탐지한다. 실험 결과를 통해서 다른 종류의 자음들과 연결된 12개의 모음들을 포함하는 한 단어 데이터베이스에 대한 제안된 방법의 평균 정확도는 단시간 에너지와 zero-crossing 비율에 기반을 둔 다른 모음 탐지 방법들보다 높은 72.73% 이상임을 확인하였다.

실이에서 여자 음성 /ㅏ/, /ㅣ/, /ㅜ/의 포먼트 주파수 변화 (Formant frequency changes of female voice /a/, /i/, /u/ in real ear)

  • 허승덕;강희라
    • 말소리와 음성과학
    • /
    • 제9권1호
    • /
    • pp.49-53
    • /
    • 2017
  • Formant frequencies depend on the position of tongue, the shape of lips, and larynx. In the auditory system, the external ear canal is an open-end resonator, which can modify the voice characteristics. This study investigates the effect of the real ear on formant frequencies. Fifteen subjects ranging from 22 to 30 years of age participated in the study. This study employed three corner vowels: the low central vowel /a/, the high front vowel /i/, and the high back vowel /u/. For this study, the voice of a well-educated undergraduate who majored in speech-language pathology, was recorded with a high performance condenser microphone placed in the upper pinna and in the ear canal. Paired t-test showed that there were significant difference in the formant frequencies of F1, F2, F3, and F4 between the free field and the real ear. For /a/, all formant frequencies decreased significantly in the real ear. For /i/, F2 increased and F3 and F4 decreased. For /u/, F1 and F2 increased, but F3 and F4 decreased. It seems that these voice modifications in the real ear contribute to interpreting voice quality and understanding speech, timbre, and individual characteristics, which are influenced by the shape of the outer ear and external ear canal in such a way that formant frequencies become centralized in the vowel space.

간 질환이 공명강과 발성에 미치는 음성분석학적 특징 요소 연구 (A Study on the Acoustic Characteristics Parameter of Resonance Cavity and Phonation in Liver Diseases)

  • 임순용;임성수;연용흠;민지선;송한솔;김봉현;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1093-1096
    • /
    • 2011
  • 현대 의료 분야는 질병의 진단과 치료뿐만 아니라 질병의 예방 및 건강증진을 위한 관리, 유지의 역할도 중요하게 대두되고 있다. 즉, 질병의 조기 발견과 진단으로 예방 및 관리를 생활화하고 건강수준을 높이는 방향을 제시하는 등 건강증진을 유도하는 계기를 증대시키고 있다. 따라서 본 논문에서는 간질환이 음성에 미치는 영향을 연구하기 위해 간 질환자를 대상으로 공명강과 발성의 변화를 측정하는 실험을 수행하였다. 이를 위해 간 질환자를 피실험자 집단으로 구성하여 간질환으로 인해 입원했을 때와 치료 후에 퇴원했을 때의 음성을 각각 수집하여 음성 분석 요소 중 제3포먼트 주파수 대역폭과 무성음 추출 패턴수를 측정하여 간 질환으로 인해 공명강과 발성에 미치는 영향을 분석하는 연구를 수행하였다.

심장(心臟) 질환(疾患) 진단(診斷)을 위한 한의학적 청진(聽診) 기반의 설음(舌音) 분석 (A Lingual Sound Analysis based on Oriental Medicine Auscultation for Heart Diseases Diagnosis)

  • 김봉현;조동욱;허성호
    • 한국통신학회논문지
    • /
    • 제34권8B호
    • /
    • pp.830-838
    • /
    • 2009
  • 다양한 진단 기기들의 개발로 인해 발전을 거듭하고 있는 서양의학에 비해, 한의학은 임상의의 직관에 의존하여 환자들에게 시각적이며 객관적으로 질환 상태를 표현해줄 수 있는 정량화된 진단 데이터들이 부족한 실정이다. 이를 위해 본 논문에서는 한의학적 진단 방법의 시각화를 통한 객관화를 구현하기 위해 먼저, 한의학에서 몸을 다스리는 중심기관이며 생명과 정신의 근원처로 간주하고 있는 심장과 음성 신호와의 관계를 한방에 기초하여 규명하고 분석하였다. 따라서 심장은 오관 중 혀와 관련이 되어 있어 음성과 연계하여 생각하면 심장 질환자는 설음(舌音), 즉 혓소리의 발음이 불명확하다는 것에 초점을 맞추어 심장 질환의 유무를 판단하는 방법을 설계하였다. 이를 위해 심장 질환자와 정상인으로 피실험자 집단을 구성하고 이들의 음성에서 헛소리에 해당하는 부분에 대한 제2포먼트 주파수의 통계적 대역폭 분석과 형태적 모델링 분석을 수행하여 상호간의 비교, 분석을 수행하였다. 최종적으로 설계한 방법에 대해 실험 결과를 통한 상관성을 분석하였다.

진동 데이터 기반 설비고장예지를 위한 신호처리기법 (A Signal Processing Technique for Predictive Fault Detection based on Vibration Data)

  • 송예원;이홍성;박훈석;김영진;정재윤
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.111-121
    • /
    • 2018
  • 항공기 엔진, 풍력발전기, 모터 등 회전기기에서 발생하는 많은 문제들은 진동이나 소음과 같은 신호 데이터를 측정하여 이상감지를 할 수 있으며, 주파수 분석 등 여러 가지 신호처리가 데이터 전처리 단계에서 필요하다. 본 논문에서는 진동 데이터를 분석하여 설비 이상상태를 감지하는 기법을 소개한다. 정상상태 데이터를 기반으로 마할라노비스 거리를 측정하여 이상상태 유무를 모니터링 하는 방식을 사용한다. 특히 신호 데이터의 전처리 기법들을 도입하여 이상상태 감지의 성능을 개선할 수 있음을 보여준다. 전처리 단계에서 신호 데이터 수집 과정에서 발생한 누설오차(leakage)를 없애기 위해 해밍 윈도우(Hamming window)를 적용하고, 신호 데이터의 원신호인 포먼트(formant)를 분리하기 위하여 켑스트럼(cepstrum) 분석을 실시한다. IMS 베어링 진동 공개데이터를 대상으로 시간 구간별로 6가지 통계지표를 추출한 후 마할라노비스 거리 분류기를 적용하여 성능을 검증하였다. 제시된 신호처리 전처리 기법을 적용함으로써 성능이 획기적으로 향상되는 것을 실험에서 보여주었다.

성대신호 기반의 명령어인식기를 위한 특징벡터 연구 (Effective Feature Vector for Isolated-Word Recognizer using Vocal Cord Signal)

  • 정영규;한문성;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.226-234
    • /
    • 2007
  • 본 논문은 환경 노이즈를 원천적으로 차단하는 성대 마이크를 이용한 명령어 인식기를 개발한다. 성대마이크는 환경 노이즈의 효과를 최소화하는 장점이 있다. 그러나 고주파의 부재와 부분적인 포먼트 정보 손실 때문에, 성대마이크를 이용해서 개발된 ASR시스템은 표준마이크를 이용한 시스템에 비해 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로부터 입력되는 정보 보안하는데 주로 사용된다. 본 논문은 한국어의 음운적 특정과 신호 분석을 통해 성대마이크만을 사용한 높은 성능의 ASR 시스템을 개발 할 수 있음을 보인다. 주파수 대역내 에너지 합을 이용하는 MFCC 알고리즘이 갖는 성대신호 분석의 문제점을 제시하고, 성대신호를 대상으로 보다 높은 성능을 갖는 특정추출 알고리즘의 조건을 제시한다. 이러한 조건은 (1) 민감한 band-pass filter와 (2) 유/무성음 분리를 위해 사용하는 특정벡터의 사용이다 실험 결과 제안된 조건을 만족하는 ZCPA 알고리즘을 적용한 경우가 MFCC를 적용한 경우보다 약 16%정도의 높은 성능을 보인다. 그러고 CMS와 RASTA와 같은 channel normalization 알고리즘을 적용한 경우 약 2%의 성능 향상이 있다.

경직형과 불수의운동형 뇌성마비아동의 /아/ 모음 음향학적 비교 (A comparative study of the acoustic characteristics of the vowel /a/ between children with spastic and dyskinetic cerebral palsy)

  • 정필연;심현섭
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.65-74
    • /
    • 2020
  • 본 연구의 목적은 경직형과 불수의운동형 뇌성마비 아동의 음향학적 특성에서 차이가 있는지 알아보는 것이다. 연구대상은 만 4~12세의 뇌성마비 아동 34명이 참여하였다(경직형 26명, 불수의운동형 8명). 연구과제는 모음 '아' 연장발성하기이고, Praat을 사용하여 MPT, F0, Jitter, Shimmer, NHR과 F1, F2를 측정하였다. 두 유형 간 음향학적 차이를 알아보기 위해 두 독립표본 t-검정과 등분산가정이 충족되지 않는 경우 Welch-Aspin 검정을 사용하여 통계분석을 실시하였다. 연구결과, 첫째, 경직형 뇌성마비아동에 비해 불수의운동형에서 유의하게 낮은 MPT를 나타내었다. 둘째, Shimmer에서 불수의운동형의 측정치가 유의하게 높았다. 셋째, F1과 F2에서는 두 유형 간에 유의한 차이를 보이지 않았다. 이러한 결과는 경직형에 비해 불수의운동형의 호흡능력과 호흡조절능력이 더 제한적이고, 음성의 불안정성과 불규칙성도 더 많이 나타난다는 것을 시사한다. 본 연구의 결과는 뇌성마비 유형 간 말운동통제능력의 차이를 확인하고, 유형에 따른 중재계획을 수립하는데 필요한 정보를 제공해 줄 수 있을 것이다.

음란물 시청으로 야기된 성욕이 인체에 미치는 영향 (Influence of Sexual Desire Caused by Watching Phonography on Human Body)

  • 김봉현;조동욱;김희대;이범주;박영;정연만
    • 한국통신학회논문지
    • /
    • 제42권4호
    • /
    • pp.831-837
    • /
    • 2017
  • 인터넷, 스마트 폰 등과 같은 각 종 전자매체의 발전은 여러 형태의 다양한 미디어 정보가 하나의 매체에서 제공된다는 순기능과 더불어 또 다른 한 편으로는 스마트 폰 중독 등을 비롯한 여러 역기능 또한 대단히 큰 사회적 문제로 야기되고 있는 실정이다. 특히 가장 큰 대표적 역기능 중 하나가 음란물(야한 동영상, 이하 '야동') 시청에 따라 증가된 성욕으로 말미암은 성 범죄 야기 등과 같은 사회 범죄 문제이며, 사회적 범죄는 아니더라도 야동 시청이 정신적, 육체적으로 인체에 나쁜 폐해를 끼치는 부분이다. 이를 위해 본 논문에서는 야동을 시청 한 후 이것이 인체에 어떤 나쁜 영향을 미치는가를 규명하기 위해, 음성에 어떤 변화가 발생하는 가에 대한 분석을 행하고자 한다. 즉, 인체에 있어 음성은 인체의 생체신호가 얼굴과 더불어 가장 많이 발현되는 곳이다. 따라서 야동 시청 전과 후의 음성 변화를 비교, 분석하여 야동의 시청이 인체 장기에 어떤 영향을 미칠 수 있는지에 대한 규명 연구를 수행하고자 한다. 실험 결과, 야동 시청 후 성욕을 해소치 못 함으로 스트레스 호르몬 증가하고 이것이 3 포먼트 주파수 대역폭이 증가하는 결과로 나타났다.

성별에 따른 빗소리의 힐링 효과 규명 및 개인 맞춤형 빗소리 제작 (An Identification of the Healing Effect of Rain Sound According to the Gender and Personal - Adjusted Rain Sound Making)

  • 이범주;조동욱;조상현;송영빈;정연만
    • 한국통신학회논문지
    • /
    • 제41권10호
    • /
    • pp.1263-1269
    • /
    • 2016
  • 스트레스는 건강 수명을 단축시키는 가장 큰 위험 요소 중 하나가 되고 있다. 따라서 건강 수명 연장을 위한 스트레스 해소는 대단히 중요한 사항이 아닐 수 없다. 이를 위해 많은 사회적 경비가 투입되고 있으나 경제성 대비 그 효용성은 그다지 높지 않은 것이 현 실정이다. 이 같은 문제점을 개선하기 위해 본 논문에서는 스트레스 해소를 위해 많은 비용과 시간을 소모하는 방법 대신 비교적 일상생활에서 쉽게 접할 수 있는 자연의 소리 중에서 사람의 심신을 안정시켜주는 화이트 노이즈와 유사한 빗소리가 스트레스 해소에 효능이 있는지에 대한 규명 작업을 3 포먼트 주파수 대역폭의 변화를 통해 행하였다. 아울러 20대 남녀를 대상으로 스트레스 경감 효과에 대한 규명 뿐 아니라 남녀 간에 선호하는 빗소리의 차이가 존재하고 있는지에 대한 연구도 수행하였다. 최종적으로 스트레스 경감 효과의 극대화를 위해 개인맞춤형 빗소리 제작에 대해 논하였다.