DOI QR코드

DOI QR Code

Development and mathematical performance analysis of custom GPTs-Based chatbots

GPTs 기반 문제해결 맞춤형 챗봇 제작 및 수학적 성능 분석

  • Received : 2024.07.04
  • Accepted : 2024.07.26
  • Published : 2024.07.31

Abstract

This study presents the development and performance evaluation of a custom GPT-based chatbot tailored to provide solutions following Polya's problem-solving stages. A beta version of the chatbot was initially deployed to assess its mathematical capabilities, followed by iterative error identification and correction, leading to the final version. The completed chatbot demonstrated an accuracy rate of approximately 89.0%, correctly solving an average of 57.8 out of 65 image-based problems from a 6th-grade elementary mathematics textbook, reflecting a 4 percentage point improvement over the beta version. For a subset of 50 problems, where images were not critical for problem resolution, the chatbot achieved an accuracy rate of approximately 91.0%, solving an average of 45.5 problems correctly. Predominant errors included problem recognition issues, particularly with complex or poorly recognizable images, along with concept confusion and comprehension errors. The custom chatbot exhibited superior mathematical performance compared to the general-purpose ChatGPT. Additionally, its solution process can be adapted to various grade levels, facilitating personalized student instruction. The ease of chatbot creation and customization underscores its potential for diverse applications in mathematics education, such as individualized teacher support and personalized student guidance.

본 연구는 폴리아의 문제해결 단계에 따라 풀이를 제공하는 GPTs 기반 맞춤형 챗봇을 제작하여 수학적 성능을 검증하였다. 우선 맞춤형 챗봇 베타 버전을 제작하여 수학적 성능을 검증한 후 대표적인 오류를 수정하여 최종 맞춤형 챗봇을 완성하였다. 완성된 맞춤형 챗봇은 초등 수학 6학년 교과서에 제시된 이미지 형태의 65개 문제 중 평균 약 57.8개를 옳게 해결하여 약 89.0%의 정답률을 보였으며, 베타 버전에 비해 약 4%p 높은 정답률을 나타냈다. 또한 그림이 문제를 해결하는 데 핵심적인 역할을 하지 않는 50개 문제의 경우 평균 45.5개를 옳게 해결하여 약 91.0%의 정답률을 보였다. 완성된 맞춤형 챗봇의 답변 중 대표적인 오류는 문제 인식 오류이며, 문제에 인식하기 어려운 그림이 사용되었거나 문제 구성이 복잡한 경우에 해당 오류가 나타났다. 다음으로 개념 혼동 오류, 문제 이해 오류 등이 나타났다. 본 연구에서 개발한 문제해결 맞춤형 챗봇은 범용적인 챗봇인 ChatGPT보다 우수한 수학적 성능을 보였다. 또한 학년 수준에 적절하도록 풀이 과정의 조정이 가능하여 학생 개별화 맞춤형 지도에 활용할 수 있으며, 누구나 제작이 가능하여 교사 개인별 수업 보조 등 수학교육에서의 다양한 활용 가능성을 엿볼 수 있다.

Keywords

References

  1. 강윤지(2024). 수학 문장제 해결과 관련한 ChatGPT의 교수학적 활용 방안 모색. 수학교육 논문집, 38(1), 49-67.
  2. 교육부(2021). 수학 6-1. 비상교육.
  3. 교육부(2022). 수학과 교육과정. 교육부 고시 제2022-33호 [별책 8]. 교육부.
  4. 권오남, 오세준, 윤정은, 이경원, 신병철(2023). ChatGPT의 수학적 성능 분석: 국가수준 학업성취도 평가 및 대학수학능력시험 수학 문제 풀이를 중심으로. 수학교육 논문집, 37(2), 233-256.
  5. 김귀훈, 고우영, 윤혜진, 이제현, 임준호, 류운하, 송석리, 이규호, 이도영, 한준구(2023). 생성형 AI 교육자료: ChatGPT 사례 중심으로. 서울특별시교육청.
  6. 김덕진(2023). AI 2024 트렌드 & 활용백과. 스마트북스.
  7. 김덕진, 서승완(2024). 챗봇 2025 트렌드 & 활용백과. 스마트북스.
  8. 김성여, 강언진, 강요한, 고창수, 김보현, 김아롱, 노시현, 박소연, 박용준, 박희정, 송정아, 안효은, 이대현, 정선혜, 정유화, 황윤정(2023). 수학 6-1. 아이스크림 미디어.
  9. 김진중(2024). 최고의 프롬프트 엔지니어링 강의. 리코멘드.
  10. 류희찬, 유현주, 이종영, 조영미, 탁병주, 최인숙, 정미진, 이환규, 전종호, 김광식, 이경선, 박순덕, 김경희, 원선희, 선종희, 김백균, 이영배, 김종욱, 김해동, 장연지, 나미연, 김은미, 박순희, 서우림, 윤현철, 김유리(2023). 수학 6-1. 금성출판사.
  11. 박성선, 류성림, 김상미, 권성룡, 김남균, 강호진, 김경탁, 김보경, 김영진, 김용성, 김용관, 성창근, 오해진, 이명희, 정인수, 최병훈, 최주영(2023). 수학 6-1. YBM.
  12. 선주오(2024). 대화형 수학 튜터링 시스템을 위한 데이터셋 설계 및 구축. 건국대학교 대학원 석사학위논문.
  13. 손태권(2024). 수학교육에서의 인공지능: 지능형 교수시스템에 대한 체계적 문헌 검토. 수학교육학연구, 34(2), 187-208.
  14. 서지영(2024). 랭체인으로 LLM기반의 AI 서비스 개발하기. 길벗.
  15. 신항균, 김태환, 김리나, 정나영, 최혜령, 황혜진, 서형주, 김숙현, 김현미, 남미선, 박재한, 조웅래, 최하철, 김승희, 문행운, 홍혜원, 임연주(2023). 수학 6-1. 비상교육.
  16. 안병곤, 나귀수, 김민경, 이광호, 류현아, 최지선, 조진우, 김남준, 정연숙, 박은정, 허지연, 황창훈, 문은혜, 손태권, 추성엽, 장송이, 정소영, 김주창, 윤재원, 정은희, 차은경(2023). 수학 6-1. 두산동아.
  17. 유호석(2024). 제가 만든 GPT는 당신이 만든 GPT와 전혀 다릅니다. 리코멘드.
  18. 이규남, 조우진, 김동민(2023). 프롬프트 엔지니어링으로 인공지능 제대로 일 시키기. 제이펍.
  19. 이지혜, 허난(2020). 인공지능을 활용한 맞춤형 수학학습 프로그램 개발. East Asian Mathematical Journal, 36(2), 273-289.
  20. 한대희, 고은성, 조형미, 한상희, 이희석, 신희영, 이자미, 문석현, 서현진, 김나라, 김가영, 김태범, 임훈택, 박이서로, 황은지, 오민영(2023). 수학 6-2. 천재교과서.
  21. 허민(2023). 제가 쓰는 챗GPT는 당신이 쓰는 챗GPT와 전혀 다릅니다. 리코멘드.
  22. Afzaal, M., Nouri, J., Zia, A., Papapetrou, P., Fors, U., Wu, Y., Li, X., & Weegar, R. (2021). Explainable AI for data-driven feedback and intelligent action recommendations to support students self-regulation. Frontiers in Artificial Intelligence, 4, 1-20. https://doi.org/10.3389/frai.2021.723447
  23. Almeida, D. R. (2024, April 10). CLIP embeddings to improve multimodal RAG with GPT-4 Vision. OpenAI Cookbook. https://cookbook.openai.com/examples/custom_image_embedding_search
  24. Chelli, M., Descamps, J., Lavoue, V., Trojani, C., Azar, M., Deckert, M., Raynier, J., Clowez, G., Boileau, P., &  Ruetsch-Chelli, C., (2024). Hallucination rates and reference accuracy of ChatGPT and bard for systematic reviews: Comparative analysis. J ournal of Medical Internet Research, 26, e53164. Retrieved from https://www.jmir.org/2024/1/e53164.
  25. Doc, N. V., Nam, N. T. H., Thanh, N. T., & Giam, N. M. (2023). Teaching mathematics with the assistance of an AI chatbot to enhance mathematical thinking skills for high school students. International Journal of Current Science Research and Review, 6(12), 8574-8580.
  26. Holmes, W., Bialik, M., & Fadel, C. (2019). Artificial intelligence in education: Promises and implications for teaching & learning. 정제영, 이선복 역(2020). 인공지능 시대의 미래교육: 가르침 과 배움의 함의. 박영story.
  27. Gallagher, M. A., Ellis, L., & Weiland, T. (2021). Making word problems meaningful. Mathematics Teaching: Learning & Teaching PK-12, 114(8), 580-590. https://doi.org/10.5951/MTLT.2020.0247
  28. Yeh, C. Y. C., Cheng, H. N. H., Chen, Z. H., Liao, C. C. Y., & Chan, T. W. (2019). Enhancing achievement and interest in mathematics learning through Math-Island. Research and Practice in Technology Enhanced Learning, 14(5), 1-19. https://doi.org/10.1186/s41039-019-0095-2