Efficient dimension reduction using QR-decomposition and its application to text categorization

QR-분해를 이용한 효율적인 차원 감소 방법과 문서 분류에의 응용

  • Lee Moon-Hwi (Dept. of Computer Science and Engineering, Chungnam National University) ;
  • Park Cheong-Hee (Dept. of Computer Science and Engineering, Chungnam National University)
  • 이문휘 (컴퓨터공학과, 충남대학교) ;
  • 박정희 (컴퓨터공학과, 충남대학교)
  • Published : 2006.06.01

Abstract

LDA는 그룹간 간격을 최대화하고 그룹내 분산을 최소화하는 선형변환을 구함으로써 차원 감소된 공간에서 분별력(classification performance)을 높이는 선형 차원 감소 방법이다. 본 논문에서는 저샘플 문제(undersampled problem)에서 LDA를 적용할 수 있도록 QR-분해를 이용한 효율적인 차원 감소 방법을 제안한다. 특히 제안되는 방법은 문서 분류 문제에서처럼 한 문서가 몇 개의 카테고리에 중복적으로 속하는 경우 등 데이터의 독립성이 보장되지 않는 경우에도 효과적으로 적용될 수 있다는 장점이 있다.

Keywords