Regression with Missing Data using Multi-task Learning

멀티태스크 러닝을 통한 회귀 분석에서의 결측값 처리

  • Lee, Jae-Yong (Dept. Computer Science and Engineering, Pohang University of Science and Technology) ;
  • Yu, Hwan-Jo (Dept. Computer Science and Engineering, Pohang University of Science and Technology)
  • 이재용 (포항공과대학교 컴퓨터공학과) ;
  • 유환조 (포항공과대학교 컴퓨터공학과)
  • Published : 2012.06.22

Abstract

데이터의 결측치는 데이터 마이닝 알고리즘 성능에 많은 저하를 일으킨다. 따라서 본 논문에서는 멀티태스크 러닝을 이용하여 회귀 분석시에 결측치를 효율적으로 다루는 방법을 제안한다. 데이터를 데이터의 분포에 따라서 무결점 데이터와 결측 데이터를 구분하여 태스크를 나눈 후 각각의 결과를 종합하여 최적화하는 것을 목표로 한다.

Keywords