DOI QR코드

DOI QR Code

Korean Symptom-Based Disease Prediction Model according to Input Data Format and Positive/Negative

입력 데이터 형식 및 Positive/Negative에 따른 한국어 증상 기반 질병 예측 모델

  • Min-Jung Kim (Dept. of Computer Software, Han-Yang University) ;
  • In-Whee Joe (Dept. of Computer Software, Han-Yang University)
  • 김민정 (한양대학교 컴퓨터.소프트웨어학과) ;
  • 조인휘 (한양대학교 컴퓨터.소프트웨어학과)
  • Published : 2023.11.02

Abstract

본 논문은 Word2Vec를 이용하여 한국어 증상 기반 질병 예측 모델을 제시한다. 아산병원 질환 백과의 크롤링 데이터를 세 가지 형식으로 나누어, 모델에 알맞은 데이터 형식을 찾고 모델에 적용한다. 가장 모델에 맞는 데이터 형식은 증상별 질병과 질병별 증상을 합친 경우이다. 데이터의 양을 늘려 임베딩 스페이스를 넓혔고, 가장 중요한 증상과 질병의 유사도도 정확하게 출력되었다. 이는 유사도가 높은 질병과 증상들이 제대로 학습이 되었다는 것을 알 수 있다. 이렇게 만들어진 예측 모델에 positive 증상을 입력하면 유사도가 향상되고, negative에 입력하면 하락하는 결과를 확인했다. 따라서 환자의 증상을 positive에 넣으면, 그 증상을 가진 질병이 가까워지는 반면, 환자의 증상이 아닌 증상을 negative에 넣으면, 환자에게 맞지 않는 질병이 멀어진다. 그러므로 환자의 상태에 맞는 질병을 유추해, 의사나 환자가 증상에 대한 질병을 알고 싶을 때 또는 검색에 유용하게 사용할 수 있다. 더불어, 질병의 진료과 데이터를 추가하여, 환자에게 맞는 진료과를 찾는 데도 도움을 줄 수 있다.

Keywords