• Title/Summary/Keyword: AI음성

Search Result 189, Processing Time 0.021 seconds

고령친화 AI음성 O2O 서비스의 서비스가치가 태도와 이용의도에 미치는 영향에 관한 연구

  • Lee, Myeong-Suk;Go, In-Gon
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2021.11a
    • /
    • pp.125-128
    • /
    • 2021
  • 한국은 2025년 전체 인구 중 65세 이상 인구가 20%을 상회하는 초고령 사회 진입이 전망되면서 노화수준에 맞는 고령친화적인 제품서비스 공급이 요구된다. 특히 시니어 소비자가 사용하기 편리한 인터페이스를 갖춘 서비스가 필요하다. 이에 시니어들은 노화(aging)에 대한 문제의식에 비용을 지불하며 젊은 소비자들과 유사한 소비행태를 보이고, 노화 수준별 건강 유지 및 건강 불안, 돌봄 공백, 사회적 고립 증가 등 사회문제가 복합적으로 심화되면서 고령친화적인 스마트한 Aging Service 공급이 요구된다. 이러한 시기와 맞물려 with코로나시대 시니어 소비자가 사용하기 편리한 인터페이스를 갖는 제품·서비스로 4차 산업혁명의 중심인 AI(Artificial Intelligence)와 정보통신 기술의 노력이 가시화되고 있다. 따라서 IT 기술에 덧입혀 시니어들의 욕구에 부합하는 AI 음성인식 기능을 탑재한 제품 및 서비스가 향후 고령친화산업 성장을 주도할 것으로 전망된다. 이에 본 연구는 '고령친화 AI 음성 O2O 서비스'의 서비스 가치가 태도와 이용의도에 영향을 미치는가를 분석하기 위해 선행이론을 토대로 전문가 델파이 방법을 통해 고령친화 AI 음성 O2O 서비스의 정의를 도출하고 실증분석으로 '고령친화 AI 음성 O2O 서비스'의 서비스가치(상황기반 제공성, 즉시연결성, 위치정확성)와 태도 및 이용의도간의 인과관계를 조사하기 위해 본 연구를 진행하였다.

  • PDF

Research on Emotional Factors and Voice Trend by Country to be considered in Designing AI's Voice - An analysis of interview with experts in Finland and Norway (AI의 음성 디자인에서 고려해야 할 감성적 요소 및 국가별 음성 트랜드에 관한 연구 - 핀란드와 노르웨이의 전문가 인뎁스 인터뷰를 중심으로)

  • Namkung, Kiechan
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.9
    • /
    • pp.91-97
    • /
    • 2020
  • Use of voice-based interfaces that can interact with users is increasing as AI technology develops. To date, however, most of the research on voice-based interfaces has been technical in nature, focused on areas such as improving the accuracy of speech recognition. Thus, the voice of most voice-based interfaces is uniform and does not provide users with differentiated sensibilities. The purpose of this study is to add a emotional factor suitable for the AI interface. To this end, we have derived emotional factors that should be considered in designing voice interface. In addition, we looked at voice trends that differed from country to country. For this study, we conducted interviews with voice industry experts from Finland and Norway, countries that use their own independent languages.

Implementation of Scenario-based AI Voice Chatbot System for Museum Guidance (박물관 안내를 위한 시나리오 기반의 AI 음성 챗봇 시스템 구현)

  • Sun-Woo Jung;Eun-Sung Choi;Seon-Gyu An;Young-Jin Kang;Seok-Chan Jeong
    • The Journal of Bigdata
    • /
    • v.7 no.2
    • /
    • pp.91-102
    • /
    • 2022
  • As artificial intelligence develops, AI chatbot systems are actively taking place. For example, in public institutions, the use of chatbots is expanding to work assistance and professional knowledge services in civil complaints and administration, and private companies are using chatbots for interactive customer response services. In this study, we propose a scenario-based AI voice chatbot system to reduce museum operating costs and provide interactive guidance services to visitors. The implemented voice chatbot system consists of a watcher object that detects the user's voice by monitoring a specific directory in real-time, and an event handler object that outputs AI's response voice by performing inference by model sequentially when a voice file is created. And Including a function to prevent duplication using thread and a deque, GPU operations are not duplicated during inference in a single GPU environment.

지자체 오리산업 전격해부 [충북도 AI 방역정책] - 오리농가 방역친화형 시설지원 시범사업 추진

  • 한국오리협회
    • Monthly Duck's Village
    • /
    • s.238
    • /
    • pp.8-13
    • /
    • 2023
  • 충북도에서는 2021년 11월 8일부터 지난해 2월 12일까지 총 10건의 AI가 발생했다. 충북 진천에서 5건, 괴산에서 1건, 음성에서 4건으로 오리집산지인 진천과 음성에서 AI가 발생하면서 그 피해규모는 더욱 커졌다. 실제로 총 10건의 AI 중 오리 7건, 닭 2건, 메추리 1건으로 오리농가에서 AI가 대부분 발생했으며 이 AI로 14호의 농가 가금류 123만3,000수가 살처분 당했다. 충북도는 한반도 중앙에 위치, 내륙의 교통 요지로 AI가 국내 발생 시 유입 가능성이 높은 지역이다. 인접 시·도 전파로 전국 확산 가능성이 높기 때문에 더욱 중요도가 높은 충북도의 AI 방역정책을 자세히 알아본다.

  • PDF

스마트 세대의 AI기반 음성인식 서비스 구매의도 영향요인에 관한 연구

  • Park, Hae-Ryong
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.05a
    • /
    • pp.645-645
    • /
    • 2017
  • 이른바 제4차 산업혁명시대에 즈음하여 산업 기술간 융합과 함께 IOT, AI등 첨단 하이테크 제품, 서비스의 수요가 더욱 증가되는 추세이다. 현재의 스마트세대는 1인 가구가 증가 추세이며 나 홀로족인 혼술, 혼밥 등 솔로 마케팅 연구가 많이 진행 되어 지고 있다. 본 연구는 이에 발맞추어 스마트세대를 대상으로 이성적, 감성적 커뮤니케이션과 구매자의 개인적 특성을 중심으로 AI기반 음성인식 서비스의 구매의도 영향을 알아보고자 한다.

  • PDF

Two-way Interactive Algorithms Based on Speech and Motion Recognition with Generative AI Technology (생성형 AI 기술을 적용한 음성 및 모션 인식 기반 양방향 대화형 알고리즘)

  • Dae-Sung Jang;Jong-Chan Kim
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.19 no.2
    • /
    • pp.397-402
    • /
    • 2024
  • Speech recognition and motion recognition technologies are applied and used in various smart devices, but they are composed of simple command recognition forms and are used as simple functions. Apart from simple functions for recognition data, professional command execution capabilities are required based on data learned in various fields. Research is being conducted on a system platform that provides optimal data to users using Generative AI, which is currently competing around the world, and can interact through voice recognition and motion recognition. The main technical processes designed for this study were designed using technologies such as voice and motion recognition functions, application of AI technology, and two-way communication. In this paper, two-way communication between a device and a user can be achieved by various input methods through voice recognition and motion recognition technology applied with AI technology.

Design & Implementation of Voice-Interface for Web-Browsing (웹 브라우징을 위한 음성 인터페이스 설계 및 구현)

  • Lee, Seung-Ho;Youk, Sang-Cho;Kwon, Young-Mi;Lee, Geuk
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.106-109
    • /
    • 1998
  • WWW은 무한한 확장 가능성을 지닌 HTTP(Hyper-Text Transfer Protocol)와 편리한 웹 브라우져를 통해 질적, 양적 성장 계속해 왔으며 특히 GUI(Graphic User Interface) 환경에서 동작하는 웹 브라우져는 WWW이 수많은 이용자를 확보하는데 일익을 담당했다. 본 논문에서는 이 웹 브라우져에 음성인식 기술을 접목하여 WWW의 이용자가 자신의 음성으로 편리하게 웹 브라우징을 할 수 있도록 하는 음성 인터페이스를 설계, 구현 한다. 본 음성 인터페이스는 계속적으로 입력되는 음성 정보 중 화자의 발성음을 추출하여 음성 인식기에 전달하는 음성 입력기와 화자의 발성을 인식하는 음성 인식기 그리고 인식결과를 웹 브라우져에게 처리 하도록 하는 결과 처리기로 구성되어 있다.

  • PDF

Multifaceted Evaluation Methodology for AI Interview Candidates - Integration of Facial Recognition, Voice Analysis, and Natural Language Processing (AI면접 대상자에 대한 다면적 평가방법론 -얼굴인식, 음성분석, 자연어처리 영역의 융합)

  • Hyunwook Ji;Sangjin Lee;Seongmin Mun;Jaeyeol Lee;Dongeun Lee;kyusang Lim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.55-58
    • /
    • 2024
  • 최근 각 기업의 AI 면접시스템 도입이 증가하고 있으며, AI 면접에 대한 실효성 논란 또한 많은 상황이다. 본 논문에서는 AI 면접 과정에서 지원자를 평가하는 방식을 시각, 음성, 자연어처리 3영역에서 구현함으로써, 면접 지원자를 다방면으로 분석 방법론의 적절성에 대해 평가하고자 한다. 첫째, 시각적 측면에서, 면접 지원자의 감정을 인식하기 위해, 합성곱 신경망(CNN) 기법을 활용해, 지원자 얼굴에서 6가지 감정을 인식했으며, 지원자가 카메라를 응시하고 있는지를 시계열로 도출하였다. 이를 통해 지원자가 면접에 임하는 태도와 특히 얼굴에서 드러나는 감정을 분석하는 데 주력했다. 둘째, 시각적 효과만으로 면접자의 태도를 파악하는 데 한계가 있기 때문에, 지원자 음성을 주파수로 환산해 특성을 추출하고, Bidirectional LSTM을 활용해 훈련해 지원자 음성에 따른 6가지 감정을 추출했다. 셋째, 지원자의 발언 내용과 관련해 맥락적 의미를 파악해 지원자의 상태를 파악하기 위해, 음성을 STT(Speech-to-Text) 기법을 이용하여 텍스트로 변환하고, 사용 단어의 빈도를 분석하여 지원자의 언어 습관을 파악했다. 이와 함께, 지원자의 발언 내용에 대한 감정 분석을 위해 KoBERT 모델을 적용했으며, 지원자의 성격, 태도, 직무에 대한 이해도를 파악하기 위해 객관적인 평가지표를 제작하여 적용했다. 논문의 분석 결과 AI 면접의 다면적 평가시스템의 적절성과 관련해, 시각화 부분에서는 상당 부분 정확도가 객관적으로 입증되었다고 판단된다. 음성에서 감정분석 분야는 면접자가 제한된 시간에 모든 유형의 감정을 드러내지 않고, 또 유사한 톤의 말이 진행되다 보니 특정 감정을 나타내는 주파수가 다소 집중되는 현상이 나타났다. 마지막으로 자연어처리 영역은 면접자의 발언에서 나오는 말투, 특정 단어의 빈도수를 넘어, 전체적인 맥락과 느낌을 이해할 수 있는 자연어처리 분석모델의 필요성이 더욱 커졌음을 판단했다.

  • PDF

The Effect of Perceived Anthropomorphic Characteristics on Continuous Usage Intention of Artificial Intelligence Voice Speaker : Based on the Integrated Adoption Model (인공지능 음성 스피커의 의인화 특성 지각 정도가 지속적 이용 의향에 미치는 영향: 통합 수용 모델을 기반으로)

  • Lee, Sungjoon
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.11
    • /
    • pp.41-55
    • /
    • 2021
  • AI voice speaker has played an important role in forming an early market and development for AI-based goods and service with growing attention from many people. In this context, this research examined factors affecting continuous intention of AI voice speaker based on the integrated adoption model, which combined two factors of perceived playfulness and innovation resistance with extended technology acceptance model. It was also examined whether three perceived anthropomorphic features(i.e., perceived rational support, perceived intimacy, perceived cognitive openness) have influences on continuous intention of AI voice speaker. The data was collected by an online-survey and were responses of those who are in their 20s and 30s and have experienced in using AI voice speaker. They were analyzed by using SEM(Structural Equation Modeling). The results showed that all of perceived ease of use, perceived usefulness, perceived playfulness and innovation resistance had significant influences on continuous intention of AI voice speaker. In addition, all of perceived rational support, perceived intimacy and perceived cognitive openness as perceived anthropomorphic features had significant influences on perceived ease of use, perceived usefulness and perceived playfulness. The implications of found results in this research was also discussed.

The Effect of AI Agent's Multi Modal Interaction on the Driver Experience in the Semi-autonomous Driving Context : With a Focus on the Existence of Visual Character (반자율주행 맥락에서 AI 에이전트의 멀티모달 인터랙션이 운전자 경험에 미치는 효과 : 시각적 캐릭터 유무를 중심으로)

  • Suh, Min-soo;Hong, Seung-Hye;Lee, Jeong-Myeong
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.8
    • /
    • pp.92-101
    • /
    • 2018
  • As the interactive AI speaker becomes popular, voice recognition is regarded as an important vehicle-driver interaction method in case of autonomous driving situation. The purpose of this study is to confirm whether multimodal interaction in which feedback is transmitted by auditory and visual mode of AI characters on screen is more effective in user experience optimization than auditory mode only. We performed the interaction tasks for the music selection and adjustment through the AI speaker while driving to the experiment participant and measured the information and system quality, presence, the perceived usefulness and ease of use, and the continuance intention. As a result of analysis, the multimodal effect of visual characters was not shown in most user experience factors, and the effect was not shown in the intention of continuous use. Rather, it was found that auditory single mode was more effective than multimodal in information quality factor. In the semi-autonomous driving stage, which requires driver 's cognitive effort, multimodal interaction is not effective in optimizing user experience as compared to single mode interaction.