• 제목/요약/키워드: Elderly voice

검색결과 71건 처리시간 0.028초

A Multi-Modal Complex Motion Authoring Tool for Creating Robot Contents

  • Seok, Kwang-Ho;Kim, Yoon-Sang
    • 한국멀티미디어학회논문지
    • /
    • 제13권6호
    • /
    • pp.924-932
    • /
    • 2010
  • This paper proposes a multi-modal complex motion authoring tool for creating robot contents. The proposed tool is user-friendly and allows general users without much knowledge about robots, including children, women and the elderly, to easily edit and modify robot contents. Furthermore, the tool uses multi-modal data including graphic motion, voice and music to simulate user-created robot contents in the 3D virtual environment. This allows the user to not only view the authoring process in real time but also transmit the final authored contents to control the robot. The validity of the proposed tool was examined based on simulations using the authored multi-modal complex motion robot contents as well as experiments of actual robot motions.

노년층 파열음 발음의 재해석 (Reinterpretation of Stop Production in Korean Elderly Speakers)

  • 김지은
    • 말소리와 음성과학
    • /
    • 제7권2호
    • /
    • pp.139-145
    • /
    • 2015
  • Researchers have claimed that Korean younger speakers tend to less clearly differentiate aspirated and lax stops with VOT values while older speakers clearly differentiate these two stops with VOT values. To explain this phenomena, the current study consider both an aging effect and a general sound shift. For this study, VOT values and F0 of Korean stops produced by eight male speakers(years of birth were 1942 ~ 1952) analyzed using Praat. Their productions were compared with the values of participants whose year of birth were 1943 ~ 1952) in Silva(2006)'s research. Silva's research was conducted in 2004 using the same methods. The result shows that 2014's VOT gap between aspirated and lax stops and less F0 gap between aspirated and lax stops than those of 2004. When the F0 values related to physical conditions of the larynx is considered, it could be analyzed as the following: to distinguish the three-way phonation type clearly, older speakers depend on the VOT value more instead of F0 which they have difficulty to control.

Development of technology to improve information accessibility of information vulnerable class using crawling & clipping

  • Jeong, Seong-Bae;Kim, Kyung-Shin
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.99-107
    • /
    • 2018
  • This study started from the public interest purpose to help accessibility for the information acquisition of the vulnerable groups due to visual difficulties such as the elderly and the visually impaired. In this study, the server resources are minimized and implemented in most of the user smart phones. In addition, we implement a method to gather necessary information by collecting only pattern information by utilizing crawl & clipping without having to visit the site of the information of the various sites having the data necessary for the user, and to have it in the server. Especially, we applied the TTS(Text-To-Speech) service composed of smart phone apps and tried to develop a unified customized information collection service based on voice-based information collection method.

크로스 링크 기구를 적용한 소형 식사지원 로봇 (Compact Robotic Arm to Assist with Eating using a Closed Link Mechanism)

  • 강철웅;임종환
    • 한국정밀공학회지
    • /
    • 제20권3호
    • /
    • pp.202-209
    • /
    • 2003
  • We succeeded to build a cost effective assistance robotic arm with a compact and lightweight body. The robotic arm has three joints, and the tip of robotic arm to install tools consists of a closed link mechanism, which consisted of two actuators and several links. The robotic arm has been made possible by the use of actuators typically used in radio control devices. The controller of the robotic arm consists of a single chip PIC only. The robotic arm has a friendly user interface, as the operators are aged and disabled in most cases. The operator can manipulate the robotic arm by voice commands or by pressing a push button. The robotic arm has been successfully prototyped and tested on an elderly patient to assist with eating. The results of field test were satisfactory.

모음 연장 발성이 보이는 연령대별 음향음성학적 특성 연구 (Acoustic characteristics of the sustained vowel phonation according to age groups)

  • 서윤정;신지영
    • 말소리와 음성과학
    • /
    • 제10권4호
    • /
    • pp.67-76
    • /
    • 2018
  • This study was performed to investigate acoustic characteristics of sustained vowels produced by Seoul Korean speakers. For this study, three hundred nine healthy adults were chosen as participants from Korean Standard Speech Database. These subjects were divided into five chronological age groups (20s, 30s, 40s, 50s, 60-70s) and two gender groups (male and female). Fundamental frequency (f0), jitter, shimmer, and NHR (noise-to-harmonics ratio) was measured with 8 Korean vowels (/ɑ/, /æ/, /ʌ/, /e/, /o/, /u/, /ɯ/, /i/) by using Praat. The results showed that the vowel type significantly affected all acoustic parameters. Gender affected f0, jitter, and NHR significantly. The mean female speakers' f0 was greater than the males', and the mean jitter and NHR of male speakers was greater than the females'. Moreover, age affected shimmer and NHR significantly; in particular, the shimmer and NHR of elderly speakers was greater than the young speakers.

노인음성인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Elderly Voice Recognition)

  • 박지웅;이승준;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1646-1648
    • /
    • 2013
  • 고령화 되어 가는 현대 사회에서 노인들이 일반 성인과 동등한 수준에서 정보를 접근 가능하도록 스마트기기의 손쉬운 인터페이스 방법이 요구된다. 음성 인터페이스는 노인들의 스마트기기 활용도를 높여 줄 수 있지만, 성능이 평균적 성인연령 대의 발성행태에 최적화되어 있어, 노인들이 사용할 경우 음성인식률 저하를 초래한다. 그래서 노인 친화형 음성 인터페이스를 개발하기 위한 일환으로 노인음성에 대한 인식률을 향상시켜 줄 수 있는 전처리 알고리즘을 개발하고자 한다. 이를 위해 노인층과 청년층을 대상으로 음성샘플을 수집하여 분석하였고, 그 결과 노인이 청년에 비해 발성속도가 느리며 이는 스마트기기의 음성인식 기능저하로 이어진다는 것을 확인할 수 있었다.

동질도 평가를 통한 실버세대 세분군 분류 및 평가 (Mature Market Sub-segmentation and Its Evaluation by the Degree of Homogeneity)

  • 배재호
    • 유통과학연구
    • /
    • 제8권3호
    • /
    • pp.27-35
    • /
    • 2010
  • 실버세대의 중요성은 인구 증가뿐만 아니라 구매력의 향상 및 의사 표현의 강도가 증가하면서 더욱 커지고 있다. 이에 따라 과거 실버세대 전체를 대상으로 접근하던 마케팅 전략은 실버세대의 특성에 따라 적절히 분류하여 접근하는 방식으로 수정되는 것이 적절하다. 또한 세분군 분류 결과에 따라 고객 접근 전략이 결정되므로, 세분군이 얼마나 동일한 특성을 보유하고 있는 지는 마케팅 계획 수립에 매우 중요한 요소가 된다. 따라서 이론적으로 동일 세분군에 속해 있는 고객의 니즈는 대체로 일치해야 한다. 본 연구에서는 실버세대의 생활 행태와 생애 단계를 감안하여, 실버 세대 대상의 마케팅을 위한 세분군 (細分群) 분류를 수행하였으며, 분류된 세분군의 니즈가 얼마나 일치하고 있는지를 측정하기 위하여 동질도 (DoH: Degrees of Homogeneity)를 측정하였다. 동질도는 각 세분군을 대상으로 수행된 설문조사의 객관식 문항 별로 최다 응답자가 선택한 보기 문항이 다른 문항에 비하여 유의미하게 많다고 판단되는 문항의 수를 전체 문항의 수로 나눈 것으로 정의하였다. 본 연구는 동질도를 활용한 세분군 분류 결과의 적절성 평가 방법을 제시하였다는데 의의가 있으며, 다양한 분야에서 응용될 수 있을 것으로 판단된다. 또한 본 연구에서 제시한 실버세대 세분군 분류 결과는 점차 증가하고 있는 실버세대를 위한 마케팅 방안 수립의 기본 자료로 활용될 수 있을 것으로 판단된다.

  • PDF

음성·영상 신호 처리 알고리즘 사례를 통해 본 젠더혁신의 필요성 (Gendered innovation for algorithm through case studies)

  • 이지연;이혜숙
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.459-466
    • /
    • 2018
  • 젠더혁신은 연구개발의 전 과정에서 남녀의 생물학적, 인지적, 사회적 특성 및 행동방식의 차이에 의한 성 젠더 요소를 고려하여 남녀 모두를 위한 보다 나은 연구개발과 지식을 창출하는 과정을 의미한다. 본 논문의 연구목적은 ICT산업, 자동차 산업, 빅데이터, 로봇 산업 등에 활용할 수 있는 영상 음성신호처리에서 문헌연구 및 기존 자료를 분석하고 사례 조사를 통하여 젠더혁신의 중요성을 고찰하는 것이다. 본 연구에서는 젠더 연구를 기반으로 영상 음성신호처리의 관련된 최신 국내외 문헌을 검색하고 총 8편의 논문을 선정한다. 그리고 젠더분석 측면에서, 연구대상, 연구 환경, 연구 설계로 구분하여 살펴본다. 연구결과로써, 노인음성 신호처리, 기계학습과 젠더, 기계번역 기술, 안면 젠더인식 기술의 음성 영상신호 처리 알고리즘 논문 사례 분석을 통하여 기존의 알고리즘에 젠더편향성이 있음을 밝히고 이들 알고리즘 개발에서 상황에 맞는 성 젠더 분석이 필요함을 보인다. 또한 알고리즘 개발에 다양한 성 젠더 요소를 반영하는 젠더혁신 방법과 정책을 제안한다. 추후 ICT에서의 젠더혁신은 남녀 모두의 요구를 반영한 제품과 서비스를 개발로 새로운 시장 창출에 기여할 수 있다.

발화행태 특징을 활용한 응급상황 신고자 연령분류 (Age classification of emergency callers based on behavioral speech utterance characteristics)

  • 손귀영;권순일;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권6호
    • /
    • pp.96-105
    • /
    • 2017
  • 본 논문에서는 실제 응급상황센터에 접수된 신고전화의 음성분석을 통하여 발화자의 연령을 분류하고자 한다. 2가지 발화행태적 특징요소인 무성휴지(Silent Pause), 대화반응시간(Turn-taking latency)를 활용하여 성인과 노인을 분류할 수 있는 특징에 대한 분류기준을 선정하고, 이를 기계학습 분류기인 SVM(Support Vector Machine)을 활용하여 분류정확도를 확인하였다. 먼저, 응급상황센터의 실제 신고전화에 대하여 발화행태적 특징 요소를 기반으로 청취분석을 통하여 발생길이에 대하여 성인과 노인사이에 통계적으로 유의하다는 것을 확인하였다(p<0.05). 또한, 성인과 노인 각 100개, 총 200개의 음성데이터를 5차 교차검증방법을 사용하여 기계학습을 실행한 결과, 2가지의 발화행태를 모두 사용한 복합기준(무성휴지+대화반응시간)일 경우, 70%의 가장 높은 분류정확도를 확인할 수 있었다. 본 연구의 결과는 음성에 기반한 연령을 분류하는 연구에 있어서, 기존의 음성정보와 더불어, 새로운 발화행태적 특징요소와의 결합을 통하여 연령구분을 가능하게 하는 새로운 방법으로 제안할 수 있을 것이다. 또한, 향후 음성기반 상황판단 시스템 기술 개발에 있어서 기초자료로 적용이 가능하며, 이를 통하여 신속한 연령분류를 판단을 통한 상황대처가 가능하도록 하는 데에 기여할 수 있을 것이다.

Research on Developing a Conversational AI Callbot Solution for Medical Counselling

  • Won Ro LEE;Jeong Hyon CHOI;Min Soo KANG
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.9-13
    • /
    • 2023
  • In this study, we explored the potential of integrating interactive AI callbot technology into the medical consultation domain as part of a broader service development initiative. Aimed at enhancing patient satisfaction, the AI callbot was designed to efficiently address queries from hospitals' primary users, especially the elderly and those using phone services. By incorporating an AI-driven callbot into the hospital's customer service center, routine tasks such as appointment modifications and cancellations were efficiently managed by the AI Callbot Agent. On the other hand, tasks requiring more detailed attention or specialization were addressed by Human Agents, ensuring a balanced and collaborative approach. The deep learning model for voice recognition for this study was based on the Transformer model and fine-tuned to fit the medical field using a pre-trained model. Existing recording files were converted into learning data to perform SSL(self-supervised learning) Model was implemented. The ANN (Artificial neural network) neural network model was used to analyze voice signals and interpret them as text, and after actual application, the intent was enriched through reinforcement learning to continuously improve accuracy. In the case of TTS(Text To Speech), the Transformer model was applied to Text Analysis, Acoustic model, and Vocoder, and Google's Natural Language API was applied to recognize intent. As the research progresses, there are challenges to solve, such as interconnection issues between various EMR providers, problems with doctor's time slots, problems with two or more hospital appointments, and problems with patient use. However, there are specialized problems that are easy to make reservations. Implementation of the callbot service in hospitals appears to be applicable immediately.