계층적 어탠션 구조와 트랜스포머를 활용한 알츠하이머 진단과 생성 기반 챗봇

Alzheimer's Diagnosis and Generation-Based Chatbot Using Hierarchical Attention and Transformer

  • 박준영 (단국대학교 대학원 인공지능융합학과) ;
  • 최창환 (단국대학교 SW융합대학 컴퓨터공학과) ;
  • 신수종 (단국대학교 SW융합대학 컴퓨터공학과) ;
  • 이정재 (단국대학교 의과대학 정신건강의학과) ;
  • 최상일 (단국대학교 SW융합대학 컴퓨터공학과)
  • Park, Jun Yeong (Dept. of AI Convergence, Dankook University) ;
  • Choi, Chang Hwan (Dept. of Computer Engineering, Dankook University) ;
  • Shin, Su Jong (Dept. of Computer Engineering, Dankook University) ;
  • Lee, Jung Jae (Department of psychiatry, college of medicine, Dankook University) ;
  • Choi, Sang-il (Dept. of Computer Engineering, Dankook University)
  • 발행 : 2022.07.13

초록

본 논문에서는 기존에 두 가지 모델이 필요했던 작업을 하나의 모델로 처리할 수 있는 자연어 처리 아키텍처를 제안한다. 단일 모델로 알츠하이머 환자의 언어패턴과 대화맥락을 분석하고 두 가지 결과인 환자분류와 챗봇의 대답을 도출한다. 일상생활에서 챗봇으로 환자의 언어특징을 파악한다면 의사는 조기진단을 위해 더 정밀한 진단과 치료를 계획할 수 있다. 제안된 모델은 전문가가 필요했던 질문지법을 대체하는 챗봇 개발에 활용된다. 모델이 수행하는 자연어 처리 작업은 두 가지이다. 첫 번째는 환자가 병을 가졌는지 여부를 확률로 표시하는 '자연어 분류'이고 두 번째는 환자의 대답에 대한 챗봇의 다음 '대답을 생성'하는 것이다. 전반부에서는 셀프어탠션 신경망을 통해 환자 발화 특징인 맥락벡터(context vector)를 추출한다. 이 맥락벡터와 챗봇(전문가, 진행자)의 질문을 함께 인코더에 입력해 질문자와 환자 사이 상호작용 특징을 담은 행렬을 얻는다. 벡터화된 행렬은 환자분류를 위한 확률값이 된다. 행렬을 챗봇(진행자)의 다음 대답과 함께 디코더에 입력해 다음 발화를 생성한다. 이 구조를 DementiaBank의 쿠키도둑묘사 말뭉치로 학습한 결과 인코더와 디코더의 손실함수 값이 유의미하게 줄어들며 수렴하는 양상을 확인할 수 있었다. 이는 알츠하이머병 환자의 발화 언어패턴을 포착하는 것이 향후 해당 병의 조기진단과 종단연구에 기여할 수 있음을 보여준다.

키워드

과제정보

이 논문은 2022년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임(IITP-2022-00155227, 문맥정보를 이용한 딥러닝 기반의 의료 진단에 활용 가능한 ICT-BIO 융합 기술 개발, IITP-2017-0-00091, 멀티 모달 딥러닝 기반의 바이오 헬스케어 데이터 분석 기술 개발)