A Compressing Method for Genome Sequence Cluster Using Sequence Alignment

Yu, Nam-Hee;Jung, Kwang-Su;Ryu, Keun-Ho;

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

2008.06c
/
Pages.194-197
/
2008
/
1598-5164(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

A Compressing Method for Genome Sequence Cluster Using Sequence Alignment

서열정렬을 이용한 유전체 서열클러스터의 압축 방법

Yu, Nam-Hee (Dept of Computer Science, Chung-buk University) ;
Jung, Kwang-Su (Dept of Computer Science, Chung-buk University) ;
Ryu, Keun-Ho (Dept of Computer Science, Chung-buk University)

유남희 (충북대학교 전자계산학과) ;
정광수 (충북대학교 전자계산학과) ;
류근호 (충북대학교 전자계산학과)

Published : 2008.06.30

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

생물학자들은 기능이 밝혀진 단백질들로부터 치환된 몇몇의 잔기를 이용해 새로운 유용한 단백질들을 만든다. 만들어진 단백질은 높은 서열 유사성을 가지는데 우리는 이런 유사한 서열들로 구성되어 있는 클러스터를 서열 클러스터라고 정의한다. 이 논문에서는 서열정렬방법을 이용하여 서열들의 클러스터에 새로운 요약적 표현방법을 제안한다. 먼저 클러스터 안의 모든 서열들 각각의 거리에서 최소거리를 갖는 서열을 대표로 선택한다. 이 서열거리는 계산된 정렬스코어에 의해 얻을 수 있고 서열정렬의 결과에서 변환된 서열을 Edit-Script라고 불리는 보존정보에 저장한다. 대표로 선택된 서열과 각 클러스터의 Edit-Script가 데이터베이스에 저장되고 이 정보로 각 클러스터의 서열들이 보다 쉽게 만들어진다. 본 연구의 결과에서 Edit-Script의 정보를 이용하면 클러스터안의 서열들의 유사도이 55% 넘었을 때 사이즈가 감소된 것을 알 수 있다. 또한 데이터베이스에서 검색하려는 서열과 관련된 서열들을 검색할 때 데이터베이스 있는 대표서열들을 먼저 비교해 본 후 가장 거리가 가까운 대표서열을 선택하여 그 안의 클러스터 구성서열들과 검색하기 때문에 검색 시간을 단축시킬 수 있다.

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

A Compressing Method for Genome Sequence Cluster Using Sequence Alignment

서열정렬을 이용한 유전체 서열클러스터의 압축 방법

Abstract

Keywords

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)