DOI QR코드

DOI QR Code

유전자 발현량 데이터의 클러스터링을 이용한 다중 클래스 분류 모델

Multi-Class Classification Model Using Gene Expression Data Clustering

  • 김현진 (연세대학교 컴퓨터과학과) ;
  • 안재균 (연세대학교 컴퓨터과학과) ;
  • 박치현 (연세대학교 컴퓨터과학과) ;
  • 윤영미 (가천의과학대학교 정보공학부) ;
  • 박상현 (연세대학교 컴퓨터과학과)
  • 발행 : 2011.11.11

초록

본 논문에서는 여러 개의 클래스가 존재할 때, 각 클래스 내에서 샘플들을 클러스터링하고 서로 다른 클래스들과 분산도를 비교하여 클러스터가 가장 겹치지 않는 유전자 쌍들을 찾는다. 각 유전자 쌍에서 테스트 샘플과 가장 가까운 클러스터를 찾음으로써 클래스를 분류하고, 최종적으로 과반수 의결(Majority vote)하여 가장 많이 분류된 클래스를 최종 클래스로 확정한다. 그 결과, 해당 모델이 여러 개의 클래스를 가진 데이터에서 다른 비교 알고리즘의 모델들보다 높은 정확도를 나타내었다.

키워드