DOI QR코드

DOI QR Code

Cooking with a smart speaker: User experience of cooking with a voice-only recipe service

스마트 스피커와 요리하기: 음성기반 레시피 제공 서비스의 사용자 경험

  • 정구민 (한림대학교 디지털콘텐츠융합스쿨 심리학과 & 한림응용심리연구소) ;
  • 정혜선 (한림대학교 디지털콘텐츠융합스쿨 심리학과 & 한림응용심리연구소)
  • Received : 2021.08.03
  • Accepted : 2021.11.16
  • Published : 2021.12.01

Abstract

This study examined how users use smart speakers in cooking situations. Skilled and unskilled participants cooked a new recipe while following voice instructions delivered by a smart speaker. The results from video recordings of their cooking, think-aloud protocols, and interviews showed that the smart speakers freed users' hands, allowing them to cook while checking recipes. The lack of visual information did not pose a serious challenge to the cooking task, but impacted cooking quality. The implications for VUI-based recipe service designs are discussed.

음성 기반 컴퓨팅 기술과 서비스의 수준이 높아지면서, 이러한 음성 기반 기술을 활용할 분야도 넓어지고 있다. 그 중 스마트 스피커의 보급이 증가하면서 다양한 음성기반 서비스가 출시되고 있고, 1인 가구 및 요리 방송이 증가하면서 스마트 스피커를 사용한 레시피 서비스 제공이 시작되었다. 전통적으로 레시피 서비스는 시각적인 정보제시를 주로 사용하였으나, 사용자의 경험 증진을 위해서는 음성만으로도 동일한 정보를 적절하게 제공해야 한다. 스마트 스피커가 가진 장점은 '핸즈프리'가 가능하다는 것인데, 이는 요리 상황에서 효율적으로 쓰일 수 있으며, 시각을 사용하지 못하는 사용자에게 도움이 될 수 있다. 본 연구에서는 음성 기반 레시피 서비스가 사용자의 요리 활동을 얼마나 효과적으로 지원하는지 살펴보았다. 현장연구로 요리 숙련도별로 새로운 레시피를 조리하도록 하였고, 소리내어 생각하기(think-aloud), 관찰 및 인터뷰를 실시했다. 그 결과 음성 기반 레시피 서비스는 사용자의 손을 자유롭게 하여 조리 활동을 중단하지 않으면서 레시피를 확인할 수 있도록 하였으나, 조리지시가 한꺼번에 주어져서 사용자가 기억 부담을 하는 것이 관찰되었다. 시각적인 정보의 부재는 심각한 단점으로 작용하지는 않았으나, 조리의 효율성과 완성도에 영향을 주었다. 본 연구의 결과는 HCI의 발전과 음성을 사용한 레시피 서비스 사용자 경험 연구에 참고 될 수 있을 것으로 기대된다.

Keywords

Acknowledgement

본 연구는 한림대학교의 지원을 받아 수행되었음(HRF-202103-002).

References

  1. Won Moon Song, Myung Won Kim, "Performance Improvement of Speech Recognition Using Context and Usage Pattern Information", Korea Information Processing Society, Vol.5, No.108, pp.553-560, 2006.
  2. Harksoo Kim, "Natural Language Processing Techniques of Spoken Assistant Systems based on Artificial Intelligence", Communications of the Korean Institute of Information Scientists and Engineers, Vol.35, No.8, pp.9-18, 2017.
  3. B. Hatscher, M. Luz, L. E. Nacke, N. Elkmann, V. Muller, and C. Hansen, "GazeTap: towards hands-free interaction in the operating room", Multimodal Interfaces and Machine Learning for Multimodal Interaction, pp.243-251, 2017.
  4. G. Shalene, "For the disabled, smart homes are home sweet home", Fortune, 2015.
  5. C. Pearl, "Designing Voice User Interfaces", O'Reilly Media, 2016.
  6. J. E. Tornros, & A. K. Bolling, "Mobile phone use-effects of handheld and handsfree phones on driving performance", Accident Analysis & Prevention, Vol.37, No.5, pp.902-909, 2005. https://doi.org/10.1016/j.aap.2005.04.007
  7. Bobin Kim, Eunjin Lee, Dongwook Kim, Minkyo Lim, Misook Yu, So yeon Kim, "Proposal for an SNS-based sauce-mixing device for improvement of single consumers cooking environment - Centering on a behavior survey of single people", The HCI Society of Korea, pp.225-229, 2014.
  8. Jiyu Choi, Gyusang Han, "Structural Analysis of Cooking Recipe Texts - Based on Kimchi Jjigae Recipe", The Korean Journal of Community Living Science, Vol.28, No.2, pp.191-201, 2017. https://doi.org/10.7856/kjcls.2017.28.2.191
  9. Dongwon Kang, Ki-Young Nam, "Design Criteria for Smart Speakers Multi-modal Interface based on VUI and GUI Characteristics", Korean Society of Design Science, pp.6-7, 2019.
  10. L. Le Bigot, L. Caroux, C. Ros, A. Lacroix, & V. Botherel, "Investigating memory constraints on recall of options in interactive voice response system messages", Behaviour & Information Technology, Vol.32, No.2, pp.106-116, 2013. https://doi.org/10.1080/0144929X.2011.563800
  11. W. Kintsch., & J. Keenan,"Reading rate and retention as a function of the number of propositions in the base structure of sentences", Cognitive Psychology, Vol.5, No.3, pp.257-274, 1973. https://doi.org/10.1016/0010-0285(73)90036-4
  12. R. Hamada, S. Satoh, J. Okabe, S. Sakai, I. Ide, & H. Tanaka, "Cooking Navi: Assistant for daily coo king in kitchen", International Multimedia Conference, pp.371-374, 2005.
  13. F. I. Craik, & E. Bialystok, "Planning and task management in older adults: Cooking breakfast", Memory & Cognition, Vol.34, No.6, pp.1236-1249, 2006. https://doi.org/10.3758/BF03193268
  14. Q. Tran, G. Calcaterra, & E. Mynatt, "How an older and a younger adult adopted a cooking memory aid", Proceedings of HCII: Human Computer Interaction International, 2005.
  15. W. G. Chase, & H. A. Simon, "Perception in chess", Cognitive Psychology, Vol.4, No.1, pp.55-81, 1973. https://doi.org/10.1016/0010-0285(73)90004-2
  16. D. Wickens, "Statistics." Ergonomics in Design, Vol. 6, No. 4, pp.18-22, 1998. https://doi.org/10.1177/106480469800600407
  17. P. Henstam, "How many participants are needed when usability testing physical products?", Dissertation, 2018.
  18. J. Nielsen, & T. K. Landauer, "A mathematical model of the finding of usability problems", Conference on Human Factors in Computing Systems, ACM, pp. 206-213, 1993.
  19. J. Nielsen, "How many test users in a usability study?", Nielsen Norman Group, 2012.
  20. L. Cooke, "Assessing concurrent think-aloud protocol as a usability test method: A technical communication approach", IEEE Transactions on Professional Communication, Vol.53, No.3, pp.202-215, 2010. https://doi.org/10.1109/TPC.2010.2052859
  21. K. A. Ericsson, & H. A. Simon, "Protocol Analysis: Verbal Reports as Data", MIT Press, 1984.
  22. K. J. Turley-Ames, & M. M. Whitfield, "Strategy training and working memory task performance", Journal of Memory and Language, Vol.49, No.4, pp.446-468, 2003. https://doi.org/10.1016/S0749-596X(03)00095-0
  23. K. Doman, C. Y. Kuai, T. Takahashi, I. Ide, & H. Murase, "Video CooKing: Towards the synthesis of multimedia cooking recipes", In International Conference on Multimedia Modeling, pp.135-145, 2011.
  24. E. Nouri, A. Fourney, R. Sim, & R. W. White, "Supporting complex tasks using multiple devices", In Proceedings of WSDM'19 Task Intelligence Workshop, 2019.