DOI QR코드

DOI QR Code

An Introduction of Two-Step K-means Clustering Applied to Microarray Data

마이크로 어레이 데이터에 적용된 2단계 K-means 클러스터링의 소개

  • 박대훈 (부산대학교 전기공학과) ;
  • 김연태 (부산대학교 전기공학과) ;
  • 김성신 (부산대학교 전기공학과) ;
  • 이춘환 (부산대학교 분자생물학과)
  • Published : 2007.04.25

Abstract

Long gene sequences and their products have been studied by many methods. The use of DNA(Deoxyribonucleic acid) microarray technology has resulted in an enormous amount of data, which has been difficult to analyze using typical research methods. This paper proposes that mass data be analyzed using division clustering with the K-means clustering algorithm. To demonstrate the superiority of the proposed method, it was used to analyze the microarray data from rice DNA. The results were compared to those of the existing K-meansmethod establishing that the proposed method is more useful in spite of the effective reduction of performance time.

많은 유전자 정보와 그 부산물은 많은 방법을 통해 연구되어 왔다. DNA 마이크로어레이 기술의 사용은 많은 데이터를 가져왔으며, 이렇게 얻은 데이터는 기존의 연구 방법으로는 분석하기 힘들다. 본 논문에서는 많은 양의 데이터를 처리할 수 있게 하기 위하여 K-means 클러스터링 알고리즘을 이용한 분할 클러스터링을 제안하였다. 제안한 방법을 쌀 유전자로부터 나온 마이크로어레이 데이터에 적용함으로써 제안된 클러스터링 방법의 유용성을 검증하였으며, 기존의 K-means 클러스터링 알고리즘을 적용한 결과와 비교함으로써 제안된 알고리즘의 우수성을 확인할 수 있었다.

Keywords

References

  1. 황승용, 'DNA chip 기술,' 한국정보과학회지, 제18권 8호, pp .23- 28, 2000.8
  2. E. Hartuv, A. Schumitt, J. Lange, S. Meier-Ewert, H. Legrach and R. Shamir , 'An Algorithm for Clustering cDNAs for Gene Expression Analysis,' Proceedings of the Third International Conference on Computational Molecular Biology (RECOMB 99),pp.188- 197, 1999
  3. A. Ben-Der , R.. Shamir, Z. Yakhini, 'Clustering Gene Expression Patterns,' Journal of Computational Biology, 6:281- 297, July 14, 1999 https://doi.org/10.1089/106652799318274
  4. P. Tamayo, D. Slonim, J. Mesirov, Q. Zhu, S. Kitareewan, E. Dmitrov sky, E. S. Lander and T. R. Golub, 'Interpreting patterns of gene expression with self- organizing maps : Methods and application to Hernatopoeitic differentiation,' Proceedings of National Academy of Sciences of the USA , vol.96, pp.2907- 2912, March 1999
  5. M. B. Eisen, P. T. Spellman, P. O. Brown and D. Botstein, 'Cluster analysis and display of genome-wide expression patterns,' Proceedings of National Academy of Sciences of the USA , vol.95, pp.14863- 14868, December 1998
  6. http://gene-chips.com
  7. A.K.Jain, M.N.Murty, and P.J.Flynn. 'Data clustering: A review,' ACM Computing Surveys, 31(3):264-323, September 1999 https://doi.org/10.1145/331499.331504