• 제목/요약/키워드: 음성 챗봇

검색결과 28건 처리시간 0.032초

AI 기술 기반 지능형 시니어 도우미 음성인식 시스템 (An AI Technology-based Intelligent Senior Assistant Voice Recognition System)

  • 홍필두
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.355-357
    • /
    • 2019
  • 고령화 사회로 진입하고 있는 지금, 시니어 세대에게는 새로운 디바이스나 IoT기술에 대한 사용자 접점은 매우 불편하다. 이를 개선하기 위하여 우리는 AI 기술 기반 지능형 시니어 도우미 음성인식 시스템을 제안한다. 제안 시스템은 Cloud platform기반 API를 구현하여 머신러닝 처리 활용을 위한 데이터를 축적하며, 치매진단, 치매예방활동을 위한 콘텐츠를 제공하며,시니어 세대를 위한 챗봇 콘텐츠를 제공한다. 우리가 제안한 개념모델을 이용한 서비스를 API로 제공함으로서 시니어 세대에 대한 IoT기반 등 새로운 디바이스의 접근성 및 편리성을 증대하는 계기가 될 것으로 기대한다.

  • PDF

시각장애인 온라인 쇼핑 도움 어플리케이션 설계 및 구현 (Design and implement custom shopping helper applications for blind people)

  • 김채윤;김지선;천명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.570-573
    • /
    • 2019
  • 스마트폰의 대중화로 인터넷 이용률이 증가함에 따라 온라인 쇼핑 시장의 규모가 커지는 반면 대부분의 온라인 쇼핑몰은 시각장애인의 접근성이 미흡하여 온라인 쇼핑의 어려움을 겪고 있다. 그 불편함은 '정보화 사회에서의 소외감' 이라는 정신적 피해로 이어지고 있는 심각한 상황이다. 따라서 이 불편함을 해소하고 정보 접근의 격차를 줄이고자 <쇼움이>를 설계, 구현하게 되었다. <쇼움이>는 챗봇을 활용하여 일문일답으로 입력 받아 시각장애인들이 쉽고 편리하게 상품을 검색/파악할 수 있도록 설계, 구현되었으며, 시각장애인들이 파악하지 못했던 이미지 내의 상품 정보를 분석하여 텍스트와 음성으로 안내한다. 또 관심 상품 등록, 상품 링크 공유 기능을 구현하였다. 또한 사용자의 편리성 확보를 위해 버튼을 포함한 모든 항목이 안드로이드의 voice-assistant 로 읽히도록 설계, 구현하였다.

챗 GPT 의 문제점과 한계에 대한 고찰 (A Study on the Problems and Limitations of Chat GPT)

  • 박보경;한성수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.588-589
    • /
    • 2023
  • 챗 GPT 는 음성 혹은 문자로 사람과 대화할 수 있는 컴퓨터 프로그램인 챗봇(ChatBot) 중 하나이다. 최근 챗 GPT 의 사용자가 급격히 증가하면서 다양한 문제점과 한계가 발견되고 있다. 본 논문에서는 챗 GPT 를 활용 시 발생하는 문제와 한계에 대하여 살펴본다. 챗 GPT 의 문제점에는 챗 GPT 로 악성코드를 작성하는 사이버 범죄, 개인정보 침해 문제, 챗 GPT 로 과제 작성, 타인에게 챗 GPT 와 대화한 내용이 보이는 보안의 취약점이 발견되는 등이 있다. 챗 GPT 의 한계로는 실시간 학습 불가, 아는 것과 모르는 것의 구분 불가, 저작권 침해와 편향성과 같은 것이 있다. 본 논문이 챗 GPT 의 해결 가능한 문제를 신속하게 해결하고 남아있는 한계에 대한 잠재적인 해결책을 파악하는 데 도움이 되기를 기대한다.

형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템 (Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer)

  • 박대근;이완복
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.159-165
    • /
    • 2019
  • 딥러닝을 기반으로 한 음성 인식 기술이 상용 제품에 적용되기 시작했지만, 음성 인식으로 분석된 텍스트를 효율적으로 처리할 방법이 없기 때문에 VR 컨텐츠에서 그 적용 예를 찾아 보기는 쉽지 않다. 본 논문은 문장의 형태소를 분석하는 형태소 분석기와 챗봇 개발에 주로 이용되는 검색 기반 모델(Retrieval-Based Model)을 활용하여 명령어를 효율적으로 인식하고 대응할 수 있는 한국어 텍스트 명령 시스템을 제안하는 것을 목적으로 한다. 실험 결과 제안한 시스템은 문자열 비교 방식과 같은 동작을 하기 위해 16%의 명령어만 필요했으며, Google Cloud Speech와 연동하였을 때 60.1%의 성공률을 보였다. 실험 결과를 통해 제안한 시스템이 문자열 비교 방식보다 효율적이라는 것을 알 수 있다.

어텐션 알고리듬 기반 양방향성 LSTM을 이용한 동영상의 압축 표준 예측 (Video Compression Standard Prediction using Attention-based Bidirectional LSTM)

  • 김상민;박범준;정제창
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.870-878
    • /
    • 2019
  • 본 논문에서는 어텐션 알고리듬 (attention algorithm) 기반의 양방향성 LSTM (bidirectional long short-term memory; BLSTM) 을 동영상의 압축 표준을 예측하기 위해 사용한다. 자연어 처리 (natural language processing; NLP) 분야에서 순환적 신경망 (recurrent neural networks; RNN) 의 구조를 이용하여 문장의 다음 단어를 예측하거나 의미에 따라 문장을 분류하거나 번역하는 연구들은 계속되어왔고, 이는 챗봇, 음성인식 스피커, 번역 애플리케이션 등으로 상용화되었다. LSTM 은 RNN에서 gradient vanishing problem 을 해결하고자 고안됐고, NLP 분야에서 유용하게 사용되고 있다. 제안한 알고리듬은 BLSTM과 특정 단어에 집중하여 분류할 수 있는 어텐션 알고리듬을 자연어 문장이 아닌 동영상의 비트스트림에 적용해 동영상의 압축 표준을 예측하는 것이 가능하다.

최신 대화형 에이전트 기반 상용화 교육 플랫폼 오류 분석 (Error Analysis of Recent Conversational Agent-based Commercialization Education Platform)

  • 이승준;박찬준;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.11-22
    • /
    • 2022
  • 최근 교육 분야에서 다양한 인공지능 기술을 활용한 연구와 개발이 이뤄지고 있다. 인공지능을 활용한 교육 중 특히 대화형 에이전트는 시간과 공간의 제약을 받지 않고 음성인식, 번역과 같은 다양한 인공지능 기술과 결합해 더 효과적인 언어 학습을 가능하게 한다. 본 논문은 상용화된 교육용 플랫폼 중 이용자 수가 많고 영어 학습을 위한 대화형 에이전트가 활용된 플랫폼에 대한 동향 분석을 진행하였다. 동향 분석을 통해 현재 상용화된 교육용 플랫폼의 대화형 에이전트는 여러 한계점과 문제점이 존재했다. 구체적인 문제점과 한계점 분석을 위해 사전 학습된 최신 대용량 대화 모델과 비교 실험을 진행하였고, 실험 방법으로 대화형 에이전트의 대답이 사람과 비슷한지를 평가하는 Sensibleness and Specificity Average (SSA) 휴먼 평가를 진행하였다. 실험 내용을 바탕으로, 효과적인 학습을 위해 개선방안으로 대용량 파라미터로 학습된 대화 모델, 교육 데이터, 정보 검색 기능의 필요성을 제안했다.

생성형AI 서비스의 성공요인에 대한 탐색적 연구: 텍스트 마이닝과 ChatGPT를 활용하여 (An Exploratory Study of Success Factors for Generative AI Services: Utilizing Text Mining and ChatGPT)

  • 양지훈;양성병;윤상혁
    • 경영정보학연구
    • /
    • 제25권2호
    • /
    • pp.125-144
    • /
    • 2023
  • 기존에는 사람이 생성하던 문장, 이미지, 음성 등을 인공지능 기술을 활용하여 자동으로 생성할 수 있게 되면서, 생성형AI 기술이 전 세계적인 관심을 받고 있다. 특히, 대표적 생성형AI 서비스인 ChatGPT는 기존 챗봇 서비스와 차별화되는 능동성과 정확도를 보여주며, 단기간에 이용자 수가 급증하고 있다. 이렇듯 생성형AI 서비스에 대한 관심이 높아지고 있음에도 불구하고, 대부분의 선행연구는 아직 초기 수준에 머무르고 있다. 이에, 본 연구는 생성형AI 서비스의 성공요인을 도출하고 이를 바탕으로 성공적인 비즈니스 전략을 제안하기 위해 LDA 토픽모델링과 키워드 네트워크 다이어그램을 활용하였다. 또한, ChatGPT를 사용하여 기존 텍스트마이닝 방법론을 보완하는 새로운 연구방법론을 제시하였다. 본 연구는 선행연구들의 한계를 극복하고, 생성형AI의 미래 발전에 대한 학술적 및 실무적 시사점을 제공했다는 점에서 의의가 있다.

한국어 특성 기반의 STT 엔진 정확도를 위한 정량적 평가방법 연구 (A Study on Quantitative Evaluation Method for STT Engine Accuracy based on Korean Characteristics)

  • 민소연;이광형;이동선;류동엽
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.699-707
    • /
    • 2020
  • 딥러닝 기술의 발전으로 STT(Speech To Text), TTS(Text To Speech), 챗봇(ChatBOT), 인공지능 비서 등 다양한 분야에 음성처리 관련 기술이 적용되고 있다. 특히, STT는 음성 기반 관련 서비스의 기반이며, 인간의 언어를 텍스트로 변환시키기 때문에 IT관련 서비스에 대한 다양한 응용을 할 수 있다. 따라서 최근 일반 사기업, 공공기관 등 여러 수요처에서 관련 기술에 대한 도입을 시도하고 있다. 하지만 정량적으로 수준을 평가할 수 있는 일반적인 IT 솔루션과는 달리 STT엔진에 대한 정확성을 평가하는 기준과 방법이 모호하며 한국어의 특성을 고려하지 않기 때문에 정량적인 평가 기준 적용이 어렵다. 따라서 본 연구에서는 한국어의 특성에 기반한 STT엔진 변환 성능 평가에 대한 가이드를 제공함으로써 엔진제작사는 한국어 특성에 기반한 STT변환을 수행 할 수 있으며, 수요처에서는 더 정확한 평가를 수행할 수 있다. 실험 데이터에서 기존 방식에 비해 35% 더 정확한 평가를 수행할 수 있다.