• 제목/요약/키워드: CNV 분석

검색결과 16건 처리시간 0.033초

CNVDAT : 차세대 시퀀싱 데이터를 위한 유전체 단위 반복 변이 검출 및 분석 도구 (CNVDAT: A Copy Number Variation Detection and Analysis Tool for Next-generation Sequencing Data)

  • 강인호;공진화;신재문;이은주;윤지희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.249-255
    • /
    • 2014
  • 유전체 단위 반복 변이(CNV)는 유전적 구조변이의 하나로서, 암을 포함하는 인간의 질병과 밀접한 연관성이 있는 것으로 알려져 있다. 암 유전자를 규명하기 위하여, 연구자는 특정 암 환자의 대규모 유전체 데이터를 분석하여 CNV를 찾아내야하며, 동시에 대규모 유전/임상 데이터를 연계 분석하여야 한다. 본 연구는 NGS 데이터로부터 CNV를 추출하고, 추출된 CNV와 관련된 유전/임상 정보를 체계적으로 연계 분석하는 기능을 제공하는 새로운 분석 툴 CNVDAT를 제안한다. CNV 추출 모듈은 스케일 스페이스 필터링 기법을 이용하여 CNV를 추출하며, 리드 데이터에 잡음이 포함된 경우에도 CNV의 타입/위치를 정확히 추출해낸다. 또한 시퀀스 분석 모듈은 변이 영역의 브라우징 및 상호 비교를 지원하는 사용자 친화적 프로그램으로서, 암/정상 샘플의 변이 영역의 동시 분석 기능과 refGene, OMIM DB를 기반으로 하는 CNV-유전자-표현형 매핑의 연관성 분석 기능을 제공한다. 본 프로그램의 소스 코드와 샘플프로그램은 http://dblab.hallym.ac.kr/CNVDAT/에서 다운 받을 수 있다.

CNV 영역 검색 알고리즘 (A CNV Detection Algorithm)

  • 홍상균;홍동완;윤지희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.356-359
    • /
    • 2008
  • 최근 생물정보학 분야에서 인간 유전체에 존재하는 CNV(copy number variation)에 관한 연구가 주목 받고 있다. CNV 영역은 1kbp-3Mbp 사리의 서열이 반복되거나 결실되는 변이 영역으로 정의된다. 우리는 선행연구에서 기가 시퀀싱(giga sequencing)의 결과 산출되는 DNA 서열조각인 리드(read)를 레퍼런스 시퀀스에 서열 정렬하여 CNV 영역을 찾아내는 새로운 CNV 검색 방식을 제안하였다. 후속 연구로서 본 논문에서는 DNA 서열에 존재하는 repeat 영역 문제를 해결하기 위한 새로운 방안을 제안하고, 리드의 출현 빈도 정보를 분석하여 CNV 영역을 찾아내는 CNV 영역 검색 알고리즘을 보인다. 제안된 알고리즘 Gaussian 분포를 갖는 출현 빈도 정보로부터 통계적 유의성을 갖는 영역을 추출하여 CNV 영역후보로 하고, 다음 경제 과정을 거쳐 최종의 CNV 영역을 추출한다. 성능 평가를 위하여 프로토타임 시스템을 개발하였으며, 시뮬레이션 실험을 수행하였다. 실험 결과에 의하여 제안된 방식은 반복되거나 결실되는 형태의 CNV 영역을 효율적으로 검출하며, 또한 다양한 크기의 CNV 영역을 효율적으로 검출할 수 있음을 입증한다.

단백질 상호작용 네트워크를 통한 유전체 단위반복변이와 트랜스유전자 발현과의 연관성 분석 (Genome-Wide Association Study between Copy Number Variation and Trans-Gene Expression by Protein-Protein Interaction-Network)

  • 박치현;안재균;윤영미;박상현
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.89-100
    • /
    • 2011
  • 인간 유전체에 존재하는 유전적 구조 변이(genetic structural variation) 중 하나인 유전체 단위반복변이(Copy Number Variation, CNV)은 유전자의 기능 발현과 밀접한 관련이 있다. 특히 특정 유전 질병이 있는 사람들을 대상으로 CNV와 유전자발현의 관계를 밝히는 연구가 계속 진행되고 있지만, 정상인 유전체에 대한 CNV의 기능적 분석은 아직 활발히 이루어지고 있지 않다. 본 논문에서는 다수의 정상인 샘플에서 찾아낸 공통된 CNV에 대하여 유전자들과의 기능적 관계를 유전자의 분자적 위치와 상관없이 밝힐 수 있는 분석 방법을 제시한다. 이를 위해 서로 다른 이질적인 생물학데이터를 통합하는 방법을 제시하고 공통된 CNV와 유전자와의 연관성을 분자적 위치와 상관없이 계산할 수 있는 새로운 방법을 제시한다. 제안된 방법의 유의성을 보이기 위해서 유전자 온톨로지 (Gene Ontology) 데이터베이스를 이용한 다양한 검증 실험들을 수행하였다. 실험결과 새롭게 제안된 연관성 측정방법은 유의성이 있으며 공통된 CNV와 강한 연관성을 갖는 유전적 기능의 후보들을 시스템적으로 제시할 수 있는 것으로 나타났다.

정렬된 리드의 통계적 분석을 기반으로 하는 CNV 검색 알고리즘 (A CNV detection algorithm based on statistical analysis of the aligned reads)

  • 홍상균;홍동완;윤지희;김백섭;박상현
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.661-672
    • /
    • 2009
  • 인간의 유전체 서열에는 유전체 단위반복변위(copy number variation, CNV)를 포함하는 다양한 유전적 구조 변이(genetic structural variation)가 존재하며, 이는 기능적으로 질병에 대한 감수성, 치료에 대한 반응, 유전적 특성 등과 밀접한 관련이 있다. 본 논문에서는 기가 시퀀싱(giga sequencing)의 결과 산출되는 대량의 짧은 길이의 DNA 서열 데이터를 이용한 새로운 CNV 검색 방식을 제안한다. 제안하는 알고리즘에서는 레퍼런스 시퀀스에 DNA 서열 데이터를 서열 정렬시켜 각 레퍼런스 시퀀스의 위치에 대한 서열 데이터의 출현 빈도 정보를 얻은 후, 출현 빈도 정보의 패턴을 분석하여 통계적 유의성을 갖는 1kbp 이상의 연속 영역을 CNV 후보 영역으로 추출한다. 또한 제안된 알고리즘을 효율적으로 지원하기 위한 서열 정렬 방식에 대한 비교 및 분석을 수행한다. 제안된 기법의 유용성을 규명하기 위하여 다양한 실험을 수행하였다. 실험 결과에 의하면, 제안된 기법은 비교적 낮은 커버리지의 기가 시퀀싱 데이터를 이용하여 반복되거나 결실되는 다양한 형태의 CNV 영역을 효율적으로 검출하며, 또한 작은 사이즈의 CNV 영역에서부터 큰 사이즈의 CNV 영역까지 다양한 크기의 CNV 영역을 효율적으로 검출 할 수 있는 것으로 나타났다.

클라우드 컴퓨팅 기반의 병렬 CNV 검출 알고리즘 (Parallel CNV detection algorithm based on Cloud Computing)

  • 홍상균;윤지희;이은주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1264-1267
    • /
    • 2011
  • 시퀀싱 기술의 발달로 최근에는 비교적 저렴한 비용으로 개인의 유전체 시퀀싱 데이터를 산출할 수 있게 되었다. 하지만 이를 기반으로 하는 기존의 분석 방법은 매우 고가의 컴퓨팅 환경을 요구하기 때문에 분석을 위한 비용이 매우 높은 문제가 있다. 본 논문에서 클라우드 컴퓨팅 환경의 병렬 CNV 검출알고리즘을 제안한다. 제안하는 방법은 모양 기반의 CNV 검출 알고리즘인 CNV_shape을 MapReduce 기법으로 개발한 것으로 시퀀싱 데이터를 레퍼런스 서열에 매핑한 결과로부터 리드 커버리지 (read coverage)를 계산하여 커버리지가 감소하거나 증가하는 일정 길이 이상의 영역을 검출하는 방법이다. 클라우드 컴퓨팅 환경에 적용하고 노드의 밸런싱 유지를 위한 방법으로 파티셔닝 기법을 사용하였다. 또한 실 데이터를 이용한 실험을 통해 제안하는 방법의 효율적 데이터 처리를 보인다.

CNV를 이용한 쾌/불쾌 향의 영향 평가 (The Assessment of a Pleasant and an Unpleasant Odor by Contingent Negative Variation (CNV))

  • 성은정;민병찬;한정수;전광진;전효정;남경돈;신미경;정순철;김철중
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2001년도 춘계학술대회 논문집
    • /
    • pp.308-312
    • /
    • 2001
  • 본 연구에서는 사상관련전위인 수반음성변동(CNV)을 이용하여 쾌/불쾌 향의 영향을 평가하고자 하였다. 즉, 건강한 20대 성인을 대상으로 쾌한 향(레몬)과 불쾌한 향(E3) 자극에 따른 CNV의 전기성분 및 후기성분의 변화를 대뇌부위별, 가산횟수별로 비교 분석하였고, 쾌/불쾌 향의 자극 반복에 따른 주관적 평가도 부가하여 검토하였다. 그 결과, 쾌/불쾌 향은 CNV 후기성분의 중심엽 부위에서 10∼15회 가산평균의 경우 정량적으로 구별될 수 있는 가능성을 보였고, 주관적인 평가에서는 반복 자극횟수가 증가함에 따라 쾌/불쾌감이 저하하는 것을 알 수 있었다.

  • PDF

맵리듀스 기반의 암 특이적 유전자 단위 반복 변이 추출 (Highly accurate detection of cancer-specific copy number variations with MapReduce)

  • 신재문;홍상균;이은주;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.19-21
    • /
    • 2012
  • 모든 암 세포는 체세포 변이를 동반한다. 따라서 암 유전체 변이 분석에 의하여 암을 발생시키는 유전자 및 진단/치료법을 찾아낼 수 있다. 본 연구에서는 차세대 시퀀싱 데이터를 이용하여 암 특이적 단이 반복 변이(copy number variation, CNV) 유형을 밝히는 새로운 알고리즘을 제안한다. 제안하는 방식은 암 환자의 정상 세포와 암세포로부터 얻어진 정상 유전체와 암 유전체를 동시 분석하여 각각 CNV 후보 영역을 추출하며, 통계적 유의성 분석을 통하여 암 특이적 CNV 후보 영역을 선별하고, 다음 후처리 과정에서 참조 표준 서열(reference sequence)에 존재하는 오류 영역 보정 작업을 수행하여 정확한 암 특이적 CNV 영역을 추출해 낸다. 또한 다수의 대용량 유전체 데이터 동시 분석을 위하여 맵리듀스(MapReduce) 기법을 기반으로 하는 병렬 수행 알고리즘을 제안한다.

UGT2B17 유전자의 deletion polymorphism과 폐암과의 연관성 (Deletion Polymorphism of UGT2B17 and Its Relation to Lung Cancer)

  • 이세라;안명현;설소영;이지선;정정남;임선희
    • 생명과학회지
    • /
    • 제20권5호
    • /
    • pp.703-709
    • /
    • 2010
  • Glucuronidation은 NNAL [4-(methylnitrosamno)-1-(3-pyridyl)-1-butanol]의 주요 pathway이며, UGT2B의 family인 UGT2B17 (UGT, uridine diphospho-glucuronosyltransferase) 유전자는 발암원의 glucuronidation에 관여 한다. UGT2B17 결손은 NNAL의 감소 수준과 특정 암에 있어 위험도를 증가시킨다. UGT2B17 유전자의 copy 수는 사람에서 개인별로 0~2로 다양하다. 본 연구에서는 UGT2B17 결손이 폐암의 위험도와 연관성을 가지는 가를 알아보기 위해 한국인인 271명의 대조군과 176명의 폐암환자의 샘플로 PCR 방법으로 CNV를 조사하였다. 그 결과, 현재까지 보고된 백인과 흑인에 비해 한국인에서 결실 대립형질이 현저히 높게 나타났다. 백인에서 유전자 두 개 모두가 결실된 0 copy 수가 약 10%를 나타낸 것에 비해, 본 연구의 한국인에서는 0 copy 수가 약 74%를 나타내었다. 더욱이 양 쪽 결실이 여성그룹에서 전반적으로 남성그룹에 비해 높게 나타났다. 그러나 UGT2B17 유전자가 CNV와 폐암과의 연관성은 찾을 수 없었다. 이러한 결과는 UGT2B17 유전자의 결실이 폐암의 감수성과는 연관되어 있지 않으나, UGT2B17 CNV 다형성이 인종간의 진화적 분석의 유용한 마커로 사용이 가능할 것으로 사료된다.

한국 토종닭의 전장 유전체 복제수변이(CNV) 발굴 (Genome-wide Copy Number Variation in a Korean Native Chicken Breed)

  • 조은석;정원형;최정우;장현준;박미나;김남신;김태헌;이경태
    • 한국가금학회지
    • /
    • 제41권4호
    • /
    • pp.305-311
    • /
    • 2014
  • 복제수변이(Copy number variation, CNV)는 DNA 다양한 구조적 변화의 한 형태이다. 복제수변이는 인간의 질병 및 농업의 생산성에 영향을 미치는 것으로 알려져 있다. 이전 우리나라의 닭의 품종은 유럽에서 유입되어진 품종을 기반으로 구축되어져 있었다. 따라서 농촌진흥청 국립축산과학원에서는 20년 동안 재래품종을 복원하려고 노력하였고, 5품종 12계통으로 복원하였다. 최근 염기서열분석 기술의 발달로, 해상도가 좋은 게놈 전체의 복제수변이를 발굴할 수 있게 되었다. 그러나 한국 재래닭 품종에 대해서는 체계적인 연구가 이루어지지 않고 있다. 본 연구에서는 한국 재래 닭(계통 L)에 대해서 게놈 전체의 염기서열을 분석하고 닭의 참고서열과 비교하여 재래닭에서 확인된 복제수 변이를 보고하였다. 닭의 28개 염색체에서 총 501개의 복제수 변이를 확인하였고, 이를 Gain과 Loss로 나누어서 표시하였다. 또한 우리는 501개의 복제수 변이를 포함하고 있는 유전자의 기능을 분류하였다. 그 결과, 전사 및 유전자 조절에 관련된 유전자들이 많이 분류되었다. 본 연구의 결과는 복제수 변이와 한국 재래닭의 경제형질 간의 연관성을 설명할 수 있는 기초자료로 활용될 것으로 사료된다.

인간 게놈의 Copy Number Variation과 유전자 질환 (UNDERSTANDING OF EPIGENETICS AND DNA METHYLATION)

  • 오정환
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제30권2호
    • /
    • pp.205-212
    • /
    • 2008
  • 인간 게놈의 DNA서열의 차이는 개개인의 특이성을 의미하기 때문에 염기서열의 변화는 질병에 대한 감수성, 약물에 대한 반응 등 개인의 성향에 큰 영향을 미치게 된다. 인간 게놈에는 여러 가지 형태의 유전적 변이가 존재하지만 그 중 단일염기다형성이 인간의 유전적, 표현형의 다양성을 설명하는 주된 유전적 변이로 생각되었으나 최근 유전체 전체 분석법의 발전으로 1 kb 이상 크기의 CNV의 발견으로 개체간의 유전적 다양성에 대한 더 많은 이해가 가능하게 되었고, 진화와 유전 질환에 대한 CNV의 역할을 조사하는 연구의 기초를 제공하게 되었다. 현재 인간게놈의 CNV를 찾아내고 특성화 작업을 목표로 하는 The Copy Number Variation Project를 위해 The Wellcome Trust Institute (Hinxton, United Kingdom), Hospital for Sick Children (Toronto), University of Tokyo (Tokyo), Affymetrix (Santa Clara, CA), 그리고 Harvard Medical School/Brigham and Women's Hospital (Boston, MA) 등이 참여하는 international consortium이 구성되어 보다 심도 있는 연구가 진행되고, 또한 향후 진보된 DNA microarray-based technology와 서열화 기술의 개발로 인간 게놈 상의 모든 유전적 변이를 발견하게 되고 포괄적인 CNV 지도를 완성하고 인간 유전자 다양성 인간의 진화, 유전적 질환 개인 맞춤형 의학에 대한 새로운 이해와 연구가 가능하게 될 것으로 기대된다.