• 제목/요약/키워드: Non-speech

검색결과 468건 처리시간 0.028초

전기성문파형검사를 이용한 모음과 공명 자음의 발성특성 (Phonatory Caracteristics of Vwels and Resonant Consonants using the Electroglottography)

  • 최성희;남도현;임재열;임성은;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권2호
    • /
    • pp.133-140
    • /
    • 2004
  • Background and Objectives : Vowels and resonant including nasals and liquid are produced with vocal folds vibration have been used for voice therapy of hyperadduction patients. This study was conducted to investigate phonatory characteristics of vowels and resonant consonants through the EGG measures from Lx. Speech studio (Laryngograph Ltd, UK). Materials and Method : 7 male adults produced sustained vowel /a/, /i/, /u/, nasals /m/, /n/, /${\eta}$/and liquid /I/ and read the sentences (1nasals-liquid sentence, 1 non-nasals-liquid sentence) and tongue-tip trill and humming. Fx(Hz), Ox(%) were obtained of vowels, nasals, liquid and each of the posterior vowel /a/ of /ma/, /na/, /la/, /ha/ with same F0(around F#165Hz) and amplitude (75${\pm}$5db). And also DFx(Hz), DQx(%), CFx(%) and CAx(%) were obtained from reading two kinds of sentences. Results : Qx(%) was the highest in /u/ of vowels, and nasal/n/ of the resonant consonants and nasals-liquid sentence was higher Qx than non-nasals-liquid sentence but significant differences were not found. Qx(%) of the posterior vowel /a/ of nasal consonants/n/ was higher than in the isolated vowel/a/ and other posterior vowel of resonant consonants and fricatives /h/. Regularity or periodicity and higher Qx were observed in the nasals-liquid sentence than non-nasals-liquid sentence in graphs of QxFx & CFx produced by Quantiative analysis. In the nasalance score, /u/vowel was significant higher among the vowels and /I/ liquid was significant lower among the resonant consonants and nasals-liquid sentence is higher than non-nasals -liquid sentence. CQ(%) was not significantly correlated with nasalance(%). Conclusion : These findings might signify resonant phonation was not correlated with nasalance.

  • PDF

Asymmetric VR 콘텐츠 제작의 핵심 요인과 활용에 관한 연구 (A Study on Core Factors and Application of Asymmetric VR Content)

  • 김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권5호
    • /
    • pp.39-49
    • /
    • 2017
  • 본 연구는 HMD 사용자와 Non-HMD 사용자가 같은 공간에서 함께 행동하면서 다양한 경험과 높은 현존감을 이끌어낼 수 있는 비대칭 가상현실(asymmetric VR) 콘텐츠의 핵심 요인과 활용 방안을 제안한다. 제안하는 asymmetric VR 콘텐츠의 핵심은 사용자들이 HMD 착용 유무에 상관없이 사용자가 콘텐츠에 참여하는 범위, 환경을 폭넓게 반영하여 모두가 가상현실에 몰입하고, 새로운 경험을 이끌어내는 것이다. 이를 위해 본 연구는 asymmetric VR 콘텐츠 제작에 필요한 핵심 요인으로 HMD 사용자와 Non-HMD 사용자의 역할관계, 사용자들에게 제시되는 시점 그리고 사용자들 간의 대화를 통한 의사소통 구조를 정의하였다. 이를 기반으로 보조형 asymmetric VR 콘텐츠와 협력형 asymmetric VR 콘텐츠를 직접 제작하는 과정을 통해 핵심 요인을 검증하였다. 마지막으로 제안한 asymmetric VR 콘텐츠에서의 현존감, 경험을 검증하고 활용 방안을 분석하기 위하여 참가자들을 대상으로 한 설문 실험을 진행하였다. 설문 결과 asymmetric VR 콘텐츠의 목적과 이를 체험하는 사용자들간의 핵심 요인들을 명확히 구분하고, 정의한다면 모든 사용자가 만족하는 현존감과 함께 콘텐츠가 제시하는 독립적인 경험을 제공받을 수 있음을 확인하였다.

입술 애니메이션을 위한 한글 발음의 동시조음 모델 (Coarticulation Model of Hangul Visual speedh for Lip Animation)

  • 공광식;김창헌
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권9호
    • /
    • pp.1031-1041
    • /
    • 1999
  • 기존의 한글에 대한 입술 애니메이션 방법은 음소의 입모양을 몇 개의 입모양으로 정의하고 이들을 보간하여 입술을 애니메이션하였다. 하지만 발음하는 동안의 실제 입술 움직임은 선형함수나 단순한 비선형함수가 아니기 때문에 보간방법에 의해 중간 움직임을 생성하는 방법으로는 음소의 입술 움직임을 효과적으로 생성할 수 없다. 또 이 방법은 동시조음도 고려하지 않아 음소들간에 변화하는 입술 움직임도 표현할 수 없었다. 본 논문에서는 동시조음을 고려하여 한글을 자연스럽게 발음하는 입술 애니메이션 방법을 제안한다. 비디오 카메라로 발음하는 동안의 음소의 움직임들을 측정하고 입술 움직임 제어 파라미터들을 추출한다. 각각의 제어 파라미터들은 L fqvist의 스피치 생성 제스처 이론(speech production gesture theory)을 이용하여 실제 음소의 입술 움직임에 근사한 움직임인 지배함수(dominance function)들로 정의되고 입술 움직임을 애니메이션할 때 사용된다. 또, 각 지배함수들은 혼합함수(blending function)와 반음절에 의한 한글 합성 규칙을 사용하여 결합하고 동시조음이 적용된 한글을 발음하게 된다. 따라서 스피치 생성 제스처 이론을 이용하여 입술 움직임 모델을 구현한 방법은 기존의 보간에 의해 중간 움직임을 생성한 방법보다 실제 움직임에 근사한 움직임을 생성하고 동시조음도 고려한 움직임을 보여준다.Abstract The existing lip animation method of Hangul classifies the shape of lips with a few shapes and implements the lip animation with interpolating them. However it doesn't represent natural lip animation because the function of the real motion of lips, during articulation, isn't linear or simple non-linear function. It doesn't also represent the motion of lips varying among phonemes because it doesn't consider coarticulation. In this paper we present a new coarticulation model for the natural lip animation of Hangul. Using two video cameras, we film the speaker's lips and extract the lip control parameters. Each lip control parameter is defined as dominance function by using L fqvist's speech production gesture theory. This dominance function approximates to the real lip animation of a phoneme during articulation of one and is used when lip animation is implemented. Each dominance function combines into blending function by using Hangul composition rule based on demi-syllable. Then the lip animation of our coarticulation model represents natural motion of lips. Therefore our coarticulation model approximates to real lip motion rather than the existing model and represents the natural lip motion considered coarticulation.

피치변경을 이용한 화자인식 시스템 (The Speaker Recognition System using the Pitch Alteration)

  • 정종순;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.115-118
    • /
    • 2002
  • 화자인식에 사용하는 파라미터는 화자의 특징을 충분히 표현함과 더불어 발성 시마다 변동이 작은 것이 바람직하다. 즉, 파라미터의 화자내의 변이보다 화자간의 변이가 큰 특성을 가져야 화자간의 구분이 용이하다. 또한, 화자간 오류를 최소화하기 위해 화자간 구별이 뚜렷한 특징 파라미터뿐만 아니라 분별력이 뛰어난 인식방법도 필요하다. 최근의 실험결과들을 살펴보면 발성기관에 의한 정적인 특징뿐 아니라, 발성습관에 의한 동적인 특징을 같이 이용함으로써 보다 정확한 인식결과를 얻고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 다음과 같이 제안한다. 음성의 특징벡터로 운율정보 사용을 제안한다 현재 화자인식 시스템에서 일반적으로 많이 사용되고 있는 특징벡터는 스펙트럼 정보를 모델링하고 있는 것으로 비잡음 환경에서 종은 성능을 보이고 있다. 그러나 잡음 환경변화에 크게 왜곡되며 인식율이 현저하게 저하되는 문제점이 나타난다. 그러므로 본 논문에서는 음성의 동적 변화를 측정할 수 있는 세그먼트로 분할한 피치열을 변경하여 인식의 특징패턴으로 사용한다. 이는 문장의 운율정보를 보여주는 것으로 소음환경에서 강인한 특성을 보였다.

  • PDF

Personal Credit Evaluation System through Telephone Voice Analysis: By Support Vector Machine

  • 박형우
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.63-72
    • /
    • 2018
  • 인간의 목소리는 사람간의 정보 전달을 위한 가장 쉬운 방법 중 하나이다. 음성의 특징은 사람마다 다를 수 있으며 발성 속도, 발성기관의 형태와 기능, 피치 톤, 언어 습관 및 성별에 따라 다르게 나타난다. 목소리는 사람의 의사소통 핵심 요소이다. 제 4 차 산업 혁명의 시대에 목소리는 사람과 사람, 사람과 기계, 기계 와 기계 사이의 주요한 의사소통 수단이 된다. 그 이유 때문에 사람들은 자신의 의도를 다른 사람들에게 명확하게 전달하려고 노력한다. 그리고 이 과정에서 목소리는 언어 정보와 함께 다양한 추가 정보가 포함되게 된다. 예를 들어 감정 상태, 건강 상태, 신뢰도와 관련되거나, 거짓말의 여부, 음주로 인한 목소리의 변화 등 다양한 언어 및 비언어 정보를 포함하며, 다양한 분석 파라미터로 나타나게 된다. 이를 활용하면 개인의 신용도를 평가하는 척도로 사용할 수 있다. 특히 성대의 기본 주파수의 특성과 성도의 공진 주파수 특성의 관계를 분석함으로써 얻을 수 있다. 이전의 연구에서 다양한 신용 상태의 변화에 따른 목소리 분석 및 특성 변화를 연구 하였다. 본 연구에서는 음성을 통해 추출 된 매개 변수를 통해 기계 학습을 통한 개인 신용 판별 기를 제안한다.

영화 속 클래식 음악의 기능분석:영화 <체실비치에서>를 중심으로 (Functional Analysis of Classical Music in Film: Focused on )

  • 강은수;안수환
    • 한국콘텐츠학회논문지
    • /
    • 제22권3호
    • /
    • pp.152-164
    • /
    • 2022
  • 이 논문은 도미니크 쿠크(Dominic Cooke)감독의 영화 <체실비치에서>(On Chesil Beach, 2017)의 줄거리와 클래식 음악과 영화의 의미연합 관계를 탐구하는 것으로, 내러티브에 의한 정보가 클래식 음악이 지닌 정보와 어떻게 연합하는지를 분석하고 있다, 이를 위하여 베쉬위너(David Bashwiner)가 분석한 영화 <킹스 스피치>(King's Speech, 2010)의 마지막 장면과 베토벤 심포니의 음량 및 기악법 변화와의 관계, 그리고 안수환이 분석한 <그린 북>(Green Book, 2018)의 호텔 대화 장면과 드뷔시의 아라베스크에서 나타나는 변화에 의한 의미 연합 연구를 방법론으로 활용하였다. 또한 악곡이 지닌 음악 외적인 정보를 통하여 어떻게 청각적 의미를 생성하는 지를 슈만의 '트로이메라이'를 활용한 분석을 선행연구로 삼아 방법론으로 활용하였다. 영화 <체실비치에서>에는 모차르트의 K.593과 하이든의 Op.77 No.1, 그리고 슈베르트의 D. 810이 활용되었다. 본 연구는 <체실비치에서>에 나타난 모차르트, 하이든, 슈베르트의 곡이 어떤 기능을 하고 있는지를 분석하였다. 이 영화는 등장인물들의 관계와 내면적 의도를 표현하기 위하여 악기 간의 관계, 음악적 정보와 음악외적 정보 등을 활용하였다. 이러한 클래식 음악의 정보들과 영화의 줄거리적 핵심 정보는 감상의 이해를 향상시키는 기능이 있음을 본 연구를 통하여 알 수 있다.

경상 방언 내포문 의문사의 작용역 범주 지각 양상과 반응 속도 연구 (Patterns of categorical perception and response times in the matrix scope interpretation of embedded wh-phrases in Gyeongsang Korean)

  • 윤원희
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.1-11
    • /
    • 2023
  • 경상 방언 내포문 의문사의 작용역 지각 반응 시간과 범주 지각의 양상을 분석하였다. 지각 실험을 위한 자극은 내포문 의문사가 모문 작용역을 갖는 문맥이 주어진 하나의 문장을 40명의 화자가 발화한 것으로, 지각 실험은 24명이 참가하였다. 피험자는 40개의 자극에 대해 모문 작용역(설명 의문문)인지 또는 내포문 작용역(판정 의문문)인지를 선택하게 하는 강제 선택 실험을 3회 진행하고 그 반응 시간을 기록하였다. 모문 작용역 응답 수를 기준으로 자극을 정렬한 후 작용역 응답에 따른 반응 시간을 정렬 순서에 따라 시각화한 결과 모문과 내포문 작용역 응답이 범주적 지각의 결과임이 분명히 나타났으나, 이에 따른 반응 시간의 차이는 크게 나타나지 않았다. 화자에 따른 범주 지각 양상으로 볼 때, 작용역 해석에 영향을 주는 요인은 형태/통사적 제약과 운율 구조적 완결성으로 보이며, 한 요인의 가중치는 다른 요인의 가중치와 반비례 관계에 있는 것으로 해석할 수 있다.

과학수업에서 나타나는 학생들의 행동적 참여 분석을 위한 영상 분석 도구의 개발 (Developing an Instrument for Analysing Students' Behavioral Engagement in School Science Classroom)

  • 최준영;나지연;송진웅
    • 한국과학교육학회지
    • /
    • 제35권2호
    • /
    • pp.247-258
    • /
    • 2015
  • 학생은 대화뿐만 아니라 비언어적인 행동을 통해서도 수업에 참여한다. 특히 과학교실에서는 다른 교과수업과 다르게 과학기구의 사용, 관찰, 측정 등의 비언어적인 행동들이 나타난다. 그런데 학생의 행동적 참여를 분석하는 기존의 도구들은 과학교과에서 나타나는 이러한 특징적인 활동을 반영하지 못하고 있다. 본 연구는 과학교과의 학습 활동을 고려한 행동적 참여 영상 분석 도구를 개발하였다. 분석 도구를 개발하기 위하여, 첫째, 문헌연구와 초등학교 과학수업 관찰을 바탕으로 수업 중에 나타나는 학생의 행동을 14가지로 범주화하였다(자유발화, 음독, 경청하기, 묵독, 쓰기, 주의 집중하기, 손들기, 이동하기, 비참여적 움직임, 과제 움직임, 관찰하기, 측정하기, 분류하기, 실험도구 다루기). 둘째, 이를 바탕으로 '과학수업 중 행동적 참여 상태 분석틀'을 개발하였다. 셋째, Microsoft Excel Visual Basic을 이용하여 분석틀에 따라 학생들의 발화 여부, 시선, 몸의 움직임 등을 기록하고 분석할 수 있는 분석 도구를 개발하였다. 개발된 도구를 이용하면 수업 중학생의 각 행동이 수행된 시간과 학생의 네 가지 수업참여 상태(즉, 참여적 발화, 참여적 침묵, 비참여적 발화, 비참여적 침묵)를 파악할 수 있다. 개발된 분석 도구를 실제 과학시간의 초등학생 두 명을 대상으로 예시적으로 적용해 본 결과, 교사는 수업활동(일반, 시범실험, 실험활동)에 따라 발화의 양을 달리하였으며, 분석대상인 두 학생은 전체 수업시간 동안 참여적 침묵 상태에 있는 시간이 가장 길었다(학생 A: 63%, 학생 B: 72%). 참여적 침묵 상태에 있는 두 학생은 '경청하기'를 하는 시간이 가장 길었는데(학생 A: 51%, 학생 B: 42%), 교사의 발화가 상대적으로 적었던 실험활동 시간에는 오히려 '경청하기'를 거의 하지 않은 대신에 '관찰하기'를 가장 많이 하였다(학생 A: 47%, 학생 B: 53%). 개발된 분석 도구가 비언어적인 행동을 통하여 과학수업에 참여하고 있는 학생의 행동을 이해하는 데 도움을 줄 수 있을 것이라 기대한다.

Analysis of Structural Relationships of Pragmatic Language Ability in Children's Language Development

  • Moon, Kyung-Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.237-245
    • /
    • 2021
  • 본 연구는 한국아동패널 11차 년도에 조사가 완료된 자료를 활용하여 인지 및 언어발달 분야의 아동 화용언어 체크리스트 도구에 의해 조사된 담화관리, 상황에 따른 조절 및 적용 능력, 의사소통 의도, 비언어적 의사소통의 잠재변수에 대한 관측변수 요인 간의 관계를 분석하여 유의미한 영향력을 찾아내는 것이다. 본 연구의 대상은 한국아동패널 11차 년도(2018년) 자료 2150가구 중 조사 미 참여 722가구를 제외한 1428가구에서 언어발달 질문의 무응답자 36가구를 제외한 1392가구의 초등학교 4학년 학생들 이다. 연구 결과 연구모델의 효과분석에서 의사소통 의도를 제외한 3개의 잠재변수 간의 총 효과와 직접효과, 간접효과에서 모두 유의한 것으로 나타났다. 구체적으로 비언어적 의사소통이 담화 관리 능력에 직접적인 영향을 미칠 뿐만 아니라, 비언어적 의사소통과 담화 관리 능력 관계에서 상황에 따른 조절 및 적용 능력을 매개로 한 간접적인 영향이 유의미하게 나타났다. 결과적으로 비언어적 의사소통과 상황에 따른 조절 및 적응 능력이 높을수록 담화 관리 능력도 높아진다는 것을 알게 되었다.

지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 (Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality)

  • 최석재;이중원;권오병
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.119-138
    • /
    • 2017
  • 최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다.