DNA Sequence Visualization with k-convex Hull

k-convex hull을 이용한 DNA 염기 배열의 가시화

  • Published : 1996.12.01

Abstract

In this paper we propose a new visualization technique to characterize qualitative information of a large DNA sequence. While a long DNA sequence has huge information, it is not easy to obtain genetic information from the DNA sequence. We transform DNA sequences into a polygon to compute their homology in image domain rather than text domain. Our program visualizes DNA sequences with colored random walk plots and simplify them k-convex hulls. A random walk plot represents DNA sequence as a curve in a plane. A k-convex hull simplifies a random work plot by removing some parts of its insignificant information. This technique gives a biologist an insight to detect and classify DNA sequences with easy. Experiments with real genome data proves our approach gives a good visual forms for long DNA sequences for homology analysis.

본 논문에서는 대용량의 DNA 염기 배열의 정성 정보를 특징짓기 위한 새로운 가시화 방법을 제안한다. DNA 배열은 배열 자체가 방대한 양의 정보를 포함하고 있기 때문에 분석에 많은 어려움이 있다. 우리는 DNA 염기 배열들사이의 상사성 비교를 위해 DNA 염기 배열을 하나의 이미지 도메인으로 변환한다. 프로그램은 random walk plot으로 DNA 염기 배열을 가시화한 후에 k-convex hull로 단순화 시킨다. Random Walk plot은 염기배열을 평면상에 하나의 커브로 표현한다. k-convex hull은 walk plot으로부터 무의미한 부분을 제거함으로서 walk plot을 단순화한다. 이러한 방법은 유전공학자들에게 쉽게 DNA 배열의 특징을 인식하고 분류할 수 있는 직관을 제공한다. 실제 게놈 데이터로 실험한 결과는 논문에서 제안하는 방법이 긴 DNA 염기배열들 사이의 유사성 분석을 위해 좋은 가시화 도구임을 보여준다.

Keywords