멀티 소스 데이터 분류와 분석을 위한 이머징 패턴의 적용 방법

Application of emerging patterns for multi-source data classification and analysis

  • 윤혜성 (이화여자대학교 컴퓨터학과) ;
  • 이상호 (이화여자대학교 컴퓨터학과) ;
  • 김주한 (서울대학교 의과대학 생명의료정보학)
  • Yoon Hye-Sung (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Lee Sang-Ho (Dept. of Computer Science and Engineering, Ewha Womans University) ;
  • Kim Ju Han (Seoul National University Biomedical Informatics(SNUBI), Seoul National University College of Medicine)
  • 발행 : 2005.07.01

초록

상호작용하는 구조들을 하나의 클래스로 표현하는 데이터 마이닝 툴로서 이머징 패턴(EP)이 최근에 제안되었다. 기존의 클러스터링 알고리즘과 패턴 마이닝 알고리즘은 고차원의 유전자 발현 데이터 흑은 같은 변수들(e.g. genes)을 가지고 실험한 멀티 소스 데이터 분석을 다루기에 부적절하고, 실험 결과를 이해하는 데에 어려움이 있다. 그러나 EP는 분류 트리의 형태로 표현 가능하기 때문에, 다양한 형식의 데이터를 분류하는 패턴들을 빠르고 간단하게 구성하여 데이터 분석이 가능하도록 돕는다. 본 논문에서는 멀티 소스 바이오 데이터에서 분류 절차의 작업을 향상시키기 위하여 EP를 사용하는 간단한 스킴을 제안한다.

키워드