• 제목/요약/키워드: Emotional voice

검색결과 114건 처리시간 0.02초

차내 경험의 디지털 트랜스포메이션과 오디오 기반 인터페이스의 동향 및 시사점 (Trends and Implications of Digital Transformation in Vehicle Experience and Audio User Interface)

  • 김기현;권성근
    • 한국멀티미디어학회논문지
    • /
    • 제25권2호
    • /
    • pp.166-175
    • /
    • 2022
  • Digital transformation is driving so many changes in daily life and industry. The automobile industry is in a similar situation. In some cases, element techniques in areas called metabuses are also being adopted, such as 3D animated digital cockpit, around view, and voice AI, etc. Through the growth of the mobile market, the norm of human-computer interaction (HCI) has been evolving from keyboard-mouse interaction to touch screen. The core area was the graphical user interface (GUI), and recently, the audio user interface (AUI) has partially replaced the GUI. Since it is easy to access and intuitive to the user, it is quickly becoming a common area of the in-vehicle experience (IVE), especially. The benefits of a AUI are freeing the driver's eyes and hands, using fewer screens, lower interaction costs, more emotional and personal, effective for people with low vision. Nevertheless, when and where to apply a GUI or AUI are actually different approaches because some information is easier to process as we see it. In other cases, there is potential that AUI is more suitable. This is a study on a proposal to actively apply a AUI in the near future based on the context of various scenes occurring to improve IVE.

Speech Emotion Recognition in People at High Risk of Dementia

  • Dongseon Kim;Bongwon Yi;Yugwon Won
    • 대한치매학회지
    • /
    • 제23권3호
    • /
    • pp.146-160
    • /
    • 2024
  • Background and Purpose: The emotions of people at various stages of dementia need to be effectively utilized for prevention, early intervention, and care planning. With technology available for understanding and addressing the emotional needs of people, this study aims to develop speech emotion recognition (SER) technology to classify emotions for people at high risk of dementia. Methods: Speech samples from people at high risk of dementia were categorized into distinct emotions via human auditory assessment, the outcomes of which were annotated for guided deep-learning method. The architecture incorporated convolutional neural network, long short-term memory, attention layers, and Wav2Vec2, a novel feature extractor to develop automated speech-emotion recognition. Results: Twenty-seven kinds of Emotions were found in the speech of the participants. These emotions were grouped into 6 detailed emotions: happiness, interest, sadness, frustration, anger, and neutrality, and further into 3 basic emotions: positive, negative, and neutral. To improve algorithmic performance, multiple learning approaches were applied using different data sources-voice and text-and varying the number of emotions. Ultimately, a 2-stage algorithm-initial text-based classification followed by voice-based analysis-achieved the highest accuracy, reaching 70%. Conclusions: The diverse emotions identified in this study were attributed to the characteristics of the participants and the method of data collection. The speech of people at high risk of dementia to companion robots also explains the relatively low performance of the SER algorithm. Accordingly, this study suggests the systematic and comprehensive construction of a dataset from people with dementia.

에이전트의 표정과 목소리 정서의 교차양상지각 (Crossmodal Perception of Mismatched Emotional Expressions by Embodied Agents)

  • 조유숙;석지혜;한광희
    • 감성과학
    • /
    • 제12권3호
    • /
    • pp.267-278
    • /
    • 2009
  • 오늘날 가상 세계에서 인간과 인간, 컴퓨터와 인간의 상호작용을 좀 더 효율적으로 도와줄 수 있는 매개체로서 에이전트에 대한 관심이 증대되고 있다. 특히 에이전트의 정서표현도 인간의 정서 표현처럼 해석할 수 있고 그에 대해 인간의 정서표현에 반응하는 것과 마찬가지의 방식으로 반응한다는 연구들이 있어왔다. 그렇다면 에이전트의 정서표현이 표정과 목소리에서 서로 불일치한다면 어떤 쪽에 더 치중해서 에이전트의 정서를 해석할지 또는 어느 한 쪽에 치중하는 것이 아니라 두 정서 모두 조합해서 받아들일지 알아보고자 했다. 또한 만약 표정과 목소리의 두 가지 정서를 조합해서 인지한다면 표정이나 목소리에서는 표현되지 않은 제 3의 정서를 느끼지는 않는 것인지 알아보았다. 실험은 표정(4) $\times$ 목소리(4)로 이루어졌다. 실험 결과 사람들은 에이전트의 한 가지 채널에 지배받아서 정서를 인지하는 것이 아니라 표정(시각)과 목소리(청각) 두 채널 모두를 조합해서 정서를 인지하는 것으로 나타났다. 또한 두 채널의 정서가 불일치할 때에는 혼란에 빠져 무슨 정서인지 모르게 되는 것이 아니라 또 다른 실망, 지루함, 지친, 반가운 등의 제 3의 정서를 느끼는 것으로 나타났다.

  • PDF

음성으로부터 감성인식 요소분석 (Analyzing the element of emotion recognition from speech)

  • 심귀보;박창현
    • 한국지능시스템학회논문지
    • /
    • 제11권6호
    • /
    • pp.510-515
    • /
    • 2001
  • 일반적으로 음성신호로부터 사람의 감정을 인식할 수 있는 요소는(1)대화의 내용에 사용한 단어, (2)톤 (tore), (3)음성신호의 피치(Pitch), (4)포만트 주파수(Formant Frequencey)그리고 (5)말의 빠르기(Speech Speed)(6)음질(Voice Quality)등이다. 사람의 경우는주파수 같은 분석요소 보다 톤과 단어 빠르기, 음질로 감정을 받아들이게 되는것이 자연스러운 방법이므로 당연히 후자의 요소들이 감정을 분류하는데 중요한 인자로쓰일 수있다. 그리고, 종래는 주로 후자의 효소들을 이용하였는데, 기계로써 구현하기 위해서는 포만트 주파수를 사용할 수있게 되는것이 도움이 된다. 그러므로, 본 연구는 음성 신호로부터 피치와 포만트, 그리고 말의 빠르기 등을 이용하여 감성인식시스템을 구현하는것을 목표로 연구를 진행하고 있으며, 그 1단계 연구로서 본 논문에서는 화가 나서 내뱉는 말을 기반으로 하여 화난 감정의 독특한 특성을 찾아내었다.

  • PDF

프로이트와 데리다의 애도이론 -"나는 애도한다 따라서 나는 존재한다." (Freud's and Derrida's Theories of Mourning: "I Mourn Therefore I Am")

  • 왕철
    • 영어영문학
    • /
    • 제58권4호
    • /
    • pp.783-807
    • /
    • 2012
  • This study compares and contrasts Freud's "work of mourning" which mostly appears in his memorable essay "Mourning and Melancholia" and Derrida's theory of mourning which appears in various works such as MEMOIRES for Paul de Man, The Work of Mourning, and others. Freud maintains that the mourner begins to sever emotional ties to the lost object through a labor of memory and eventually completes the work of mourning. It is a "testing of reality" that motivates the mourner to begin to relinquish emotional attachment to the lost object. Derrida, however, challenges Freudian work of mourning by saying that true mourning lies in "respecting the Otherness of the Other." Derrida suggests that Freud's "normal work of mourning" is "unjust betrayal" of the lost object because it "kills" and "devours" the other and thereby makes it part of the self. So he proposes that work of mourning has "to fail in order to succeed": "success fails" and "failure succeeds." There is an enormous, even epistemological, chasm between Freud who states that mourning, "however painful it may be, comes to a spontaneous end" and Derrida who states that "mourning is interminable. Inconsolable. Irreconcilable." and "I mourn Therefore I am." The former is the voice of "testing of reality" and common sense whereas the latter is that of utopian ethical vision. Yet neither seems to get the upper hand and they are kind of forced to maintain an ongoing dialogue with each other, for true mourning seems to lie somewhere in between.

감성분석을 통한 소프트 파워의 수치화 분석 (Quantification Analysis of Soft Power through Sentiment Analysis)

  • 안민;김봉현
    • 산업과 과학
    • /
    • 제3권2호
    • /
    • pp.1-7
    • /
    • 2024
  • 본 논문은 감성분석을 통한 소프트 파워의 수치화를 주제로 다루고 있다. 감성분석은 텍스트, 음성, 이미지 등 다양한 데이터에서 감정이나 감성을 탐지하고 분석하는 과정을 의미한다. 따라서, 본 논문에서는 감성분석을 통해 소프트 파워를 어떻게 수치화할 수 있는지에 대한 방법론과 그 의의를 탐구하였다. 소프트 파워는 국가나 단체가 다른 국가나 단체의 행동을 원하는 방향으로 영향을 주는 능력을 의미한다. 이는 군사적 또는 경제적 수단보다는 문화, 가치관, 정치체제 등의 부드러운 요소에 의해 구축되며, 감성분석은 이러한 부드러운 영역을 측정하고 이해하는 데 유용한 도구로 활용되고 있다.

인공지능 에이전트 대화형 인터랙션에서의 감탄사 효과: 자율주행 맥락에서 (The Effect of Interjection in Conversational Interaction with the AI Agent: In the Context of Self-Driving Car)

  • 이수지;서지윤;최준호
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.551-563
    • /
    • 2022
  • 이 연구의 목적은 자율 주행 차량의 체화된 에이전트가 '감탄사'를 사용하여 감정 표현을 드러낸 대화 상호작용을 할 경우 사용자 경험에 어떠한 효과를 나타내는지 확인하는 것이다. 감탄사 포함 유무와 대화 유형(과제 중심적 대화 vs. 관계 중심적 대화)의 조건에 따라 실험을 설계하였다. 온라인 실험으로 각 조건별로 4가지 대화 시나리오영상을 시청한 후, 해당 에이전트에 대한 친밀도, 호감도, 신뢰도, 사회적 실재감, 지각된 의인화, 향후 이용 의도를 측정하였다. 분석 결과, 에이전트가 감탄사를 사용할 경우 두 대화 유형 모두에서 사회적 실재감의 주 효과가 나타났다. 에이전트가 감탄사를 사용하지 않을 경우 과제 중심적 대화 유형에서 신뢰와 향후 이용 의도가 높았다. 에이전트가 감탄사를 사용하여 감정적 표현을 더하는 것은 사회적 실재감을 높이는 효과는 발견했지만, 다른 사용자 경험 요인에 대한 영향은 나타나지 않았다.

지능형 표정로봇, 휴머노이드 ICHR (Intelligent Countenance Robot, Humanoid ICHR)

  • 변상준
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.175-180
    • /
    • 2006
  • In this paper, we develope a type of humanoid robot which can express its emotion against human actions. To interact with human, the developed robot has several abilities to express its emotion, which are verbal communication with human through voice/image recognition, motion tracking, and facial expression using fourteen Servo Motors. The proposed humanoid robot system consists of a control board designed with AVR90S8535 to control servor motors, a framework equipped with fourteen server motors and two CCD cameras, a personal computer to monitor its operations. The results of this research illustrate that our intelligent emotional humanoid robot is very intuitive and friendly so human can interact with the robot very easily.

  • PDF

A misfortune genius of Korean music is revive on YouTube; Jeongseon Arirang sung by Ok-sim Kim (https://www.youtube.com/watch?v=4XjgpKI5IOE)

  • Ko, Kyung-Ja
    • 셀메드
    • /
    • 제6권2호
    • /
    • pp.10.1-10.3
    • /
    • 2016
  • Arirang has quite a long history in Korean music. Arirang means the heart is tingling. Jeongseon Arirang is well-known Arirang from the Gangwon province, so it shares certain features of Dongbu minyo (folksong), including the Menaritori. Jeongseon Arirang of Ok-sim Kim is pure and innocent. She has an ingenuous country voice. It is a kind of hope that provides our mental strength. Mental power is as important to our health as a eating right. Jeongseon Arirang sung by Ok-sim Kim is Seoul style of rhythmic pattern and melody. Jeongseon Arirang is designated as the Intangible Cultural Property No. 1 by the Gangwon province in 1971. This article outlines the emotional biography of Jeongseon Arirang of Ok-sim Kim relationship.

뮤지컬 노래의 극과 음악 분석을 통한 조 에스틸 보컬 기법(EVT)의 적용과 실제 (Application and Practice of Estill Vocal Training (EVT) Through Theatrical and Musical Analysis of Musical Songs)

  • 이은혜;김유정
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권8호
    • /
    • pp.91-102
    • /
    • 2020
  • 본 연구는 뮤지컬 노래를 입체적이고 심도 있게 표현할 수 있는 발성기법을 적용하여 학술적 관점으로 분석하기 위함이다. 뮤지컬 노래를 부른다는 것은 단순히 음악적인 부분만으로 완성될 수 없으며, 장면과 인물의 정서 상태 등 다양한 부분의 분석이 수반되어야 한다. 이를 위해 연구의 기준을 극 구조, 가사 분석, 음악 형식 및 다이내믹의 영역까지 다각적으로 분석하였다. 이후 최종적으로 배우가 극과 음악의 정서를 담아 노래를 가장 잘 표현 할 수 있는 에스틸 보이스 트레이닝 시스템발성기법을 탐색하고 적용하였다. 분석에 적용하고자 하는 EVT는 목소리의 여섯 가지의 음색을 <스피치, 쏩/크라이, 팔세토, 트웽, 오페라, 벨팅>으로 구분하였다. 본 연구에서는 6가지 소리 이외에 성대와 후두의 위치까지 적용하여 효과적으로 노래를 표현할 수 있는 방법을 모색하였다. 연구대상은 뮤지컬 <엘리자벳>의 '아무것도'이다. '아무것도'는 주인공 엘리자벳이 부르는 노래로, 고통의 정점에 있는 자신의 모습과 갈등을 표출한다. 이 노래는 음악적으로도 'G#3-Gb5'의 음역대를 소화해야 하므로 다양한 소리 기법과 성구전환 테크닉을 다양하게 적용할 수 있다. 결과적으로 인물의 정서와 노래를 깊이 있게 구현하기 위해서는, 장면과 인물 분석 및 다양한 노래 테크닉이 조화롭게 적용 되어야 완성될 수 있음을 확인하였다.