Pattern Mining of Biological Data by Co-evolutionary Learning with Multi-populations

다중 개체 집단의 공진화적 학습에 의한 바이오 데이터의 패턴 마이닝

  • Kim Soo-Jin (Graduate Program in Bioinformatics, Seoul National University) ;
  • Joung Je-Gun (Graduate Program in Bioinformatics, Seoul National University) ;
  • Zhang Byoung-Tak (Graduate Program in Bioinformatics, Seoul National University)
  • 김수진 (서울대학교 생물정보학 협동과정) ;
  • 정제균 (서울대학교 생물정보학 협동과정) ;
  • 장병탁 (서울대학교 생물정보학 협동과정)
  • Published : 2006.06.01

Abstract

현재 각 분야에서 다양한 실험 데이터가 산출되면서 이종(heterogeneous) 데이터간의 상관관계 분석에 대한 중요성이 더욱 부각되고 있다. 특히, 대규모 실험에 의해 급속하게 증가하고 있는 대량의 바이오 데이터에서 이런 문제를 해결하기 위한 새로운 데이터 마이닝 방법이 요구된다. 본 논문은 특성이 다른 두 데이터 셋에서 서로 상관관계가 있는 부분 패턴을 파악할 수 있는 새로운 알고리즘을 제안한다. 제안한 알고리즘은 다중 개체 집단을 유지하면서 상호간 공진화하는 확률적 진화컴퓨팅 방법에 기반하고, 전체의 탐색 포인트들을 분해하여 최적해를 찾는 점에서 장점을 가지고 있다. 실험 결과, 본 논문에서는 효모 유전자에 대한 발현 데이터와 모티프 데이터의 이종 데이터에 적용해 보았으며, 이러한 데이터에 있어서 주요 상관관계가 있는 패턴들을 추출한 결과를 제시한다.

Keywords