DOI QR코드

DOI QR Code

음성기반 대화형 서비스 키오스크 설계 및 구현

Design and Implementation of Voice-based Interactive Service KIOSK

  • 김상우 (한국기술교육대학교 컴퓨터공학부) ;
  • 최대준 (한국기술교육대학교 컴퓨터공학부) ;
  • 송윤미 (한국기술교육대학교 컴퓨터공학부) ;
  • 문일영 (한국기술교육대학교 컴퓨터공학부)
  • Kim, Sang-woo (School of Computer Science and Engineering, Korea University of Technology and Education) ;
  • Choi, Dae-june (School of Computer Science and Engineering, Korea University of Technology and Education) ;
  • Song, Yun-Mi (School of Computer Science and Engineering, Korea University of Technology and Education) ;
  • Moon, Il-Young (School of Computer Science and Engineering, Korea University of Technology and Education)
  • 투고 : 2021.11.30
  • 심사 : 2021.12.23
  • 발행 : 2022.04.30

초록

최근에 늘어가는 키오스크(KIOSK)의 수요에 따라 불편함을 호소하는 이용자가 많아졌다. 이에 음성 기반 대화형 서비스를 구현하여 손쉽게 메뉴 선택 및 주문을 가능하게 해주는 키오스크를 제작해 웹의 형태로 제공한다. Annyang API와 SpeechSynthesis API를 바탕으로 음성 기능을 구현하고 Dialogflow를 통해 사용자의 의도를 파악하는 과정을 Rest API를 기반으로 구현하는 방법에 대해 논한다. 또한 협업 필터링을 기반으로 추천 시스템을 적용하여 기존 키오스크의 낮은 소비자 접근성을 개선하였고, 음성인식 서비스 이용 도중 발생하는 비말로 인한 감염을 예방하기 위해 서비스 이용 전 마스크 착용을 확인하는 기능을 제공한다.

As the demand for kiosks increases, more users complain of discomfort. Accordingly, a kiosk that enables easy menu selection and order by producing a voice-based interactive service is produced and provided in the form of a web. It implements voice functions based on the Annyang API and SpeechSynthesis API, and understands the user's intention through Dialogflow. And discuss how to implement this process based on Rest API. In addition, the recommendation system is applied based on collaborative filtering to improve the low consumer accessibility of existing kiosks, and to prevent infection caused by droplets during the use of voice recognition services, it provides the ability to check the wearing of masks before using the service.

키워드

과제정보

이 논문은 2022년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업(No. 2021R1I1A3057800) 및 2022년도 한국기술교육대학교 교수 교육연구진흥과제 지원에 의하여 연구되었음.

참고문헌

  1. Github, "Annyang API," Sep. 4, 2021 [Online]. Available: https://github.com/TalAter/annyang.
  2. K. Nam, "A study on processing of speech recognition korean words", Journal of the Convergence on Culture Technology, vol. 5, no. 4, pp. 407-412, 2019. https://doi.org/10.17703/JCCT.2019.5.4.407
  3. MDN Web Docs, "SpeechSynthesis API," Sep. 15, 2021 [Online]. Available: https://developer.mozilla.org/en-US/docs/Web/API/SpeechSynthesis.
  4. GoogleCloud, "Google client library," Nov. 9, 2021 [Online]. Available: https://cloud.google.com/apis/docs/client-libraries-explained.
  5. Gumeonggage Coding Team, "The spring web project that you learn with codes," Namgarambooks, September 13, 2018.
  6. GoogleCloud, "Dialogflow ES giude," Oct. 1, 2021 [Online]. Available: https://cloud.google.com/dialogflow/es/docs/quick/api.
  7. Pyimagesearch, "Covid-19:Face Mask Detector with OpenCV, Keras/TensorFlow, and Deep Learning," Mar. 20, 2021 [Online]. Available: https://www.pyimagesearch.com/2020/05/04/covid-19-face-mask-detector-withopencv-keras-tensorflow-and-deep-learning/.
  8. Wiki, "Pearson correlation coefficient," Mar. 25, 2021 [Online]. Available: https://ko.wikipedia.org/wiki/%ED%94%BC%EC%96%B4%EC%8A%A8_%EC%83%81%EA%B4 %80_%EA%B3%84%EC%88%98.
  9. Wiki, "Collaborative filtering," Mar. 25, 2021 [Online]. Available: https://ko.wikipedia.org/wiki/%ED%98%91%EC%97%85_%ED%95%84%ED%84%B0%EB%A7%81.