• 제목/요약/키워드: 일배체형

검색결과 31건 처리시간 0.026초

일배체형 추론을 위한 후보군 간소화 알고리즘 (A New Algorithm of Reducing Candidate Haplotypes for Haplotype Inference)

  • 최문호;강승호;임형석
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1732-1739
    • /
    • 2013
  • 인간의 한쪽 염색체상에 나타나는 SNP의 서열인 일배체형을 식별해내면 효과적인 유전질병 연관검사를 할 수 있다. 일배체형 추론문제란 특정 집단의 유전자형 집합으로부터 집단에 속한 각 개체의 유전자형을 설명할 수 있는 일배체형 집합을 도출해내는 것을 말한다. 본 논문에서는 검약기반 일배체형 추론 문제에 대해 최종 결과에 기여하지 않는 일배체형 집합을 후보군에서 제외함으로써 일배체형 추론과정에서 탐색해야 할 후보 일배체형의 개수를 줄이는 사전처리 알고리즘을 제시한다. 제시된 알고리즘은 기존의 사전처리 알고리즘에 비해 매우 빠르게 수행되며, 제시된 사전처리 알고리즘의 결과를 적용한 일배체형 추론은 대다수의 경우에 최적해를 산출하고, 최적해를 산출하지 않는 경우에도 최적해의 일배체형 개수와 크게 차이나지 않음을 실험을 통해서 보인다.

EM 알고리듬을 이용한 단일염기변이 (SNP;SINGLE NUCLEOTIDE POLYMORPHISM)군의 일배체형 (HAPLOTYPE) 비율 추정 (Estimation of Haplotype Proportions in Single Necleotide Polymorphism Group Using EM Algorithm)

  • 김선우;김종원;이경아
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.195-202
    • /
    • 2003
  • 복합성유전질환 연구에 있어서 단일염기변이를 이용한 일배체형 분석은 개별적인 단일염기변이 분석에 비하여 비용 및 효율 면에서 훨씬 유용하며, 생물학적으로도 기능적 중요성을 갖는 것으로 평가되고 있다. 그러나 일반적인 유전형분석방법을 이용한 단일염기변이군 자료는 이배체형(diploid)으로서 위상(phase)을 확인할 수 없으므로 일배체형 비율을 예측하기 어렵다. 본 연구에서는 고형종양 환자군과 정상군의 단일염기변이군 이배체형 자료가 주어졌을 때 단일염기변이군 일배체형 비율의 우도함수에 EM알고리듬을 적용하여 각 일배체형의 비율을 추정하였다. 이로부터 단일염기변이간의 연관불균형(linkage disequilibrium)을 분석하여 고형 종양과 연관 가능성이 있는 단일염기변이를 살펴보았다.

일배체형에 기초한 고혈압과 ACE 유전자의 연관성 분석 (Haplotype-Based Association and Linkage Analysis of Angiotensin-I Converting Enzyme(ACE) Gene with a Hypertension)

  • 김진흠;남정모;강대룡;서일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.297-310
    • /
    • 2005
  • 본 연구에서는 강화연구(서일, 2004)를 통해 수집된 277명의 환자-대조군 자료와 40개의 가계 자료를 이용하여 ACE(angiotensin-I converting enzyme) 유전자 내에 있는 4개의 단일염기다형성(single nucleotide polymorphism; SNP)으로 이루어진 일배체형(haplotype)과 고혈압의 관련성을 알아보고자 한다. 이를 위해 일배체형에 기초한 환자-대조군의 우도비 검정과 가계 자료의 TDT(transmission/disequilibrium test) 연구를 수행하고자 한다. 또한 이 일배체형을 동정(identification)할 수 있는 tag-SNPs에 기초하여 동일한 연구를 하고자 하며, Seltman 등(2003)이 제안한 분기도(cladogram) 분석 방법을 써서 일배체형의 진화 과정에서 가깝게 위치하고 질병 발생 위험이 비슷한 클레이드(clade)를 찾아내고 이 클레이드와 고혈압의 연관성을 살펴보고자 한다.

개선된 분기한정 알고리즘을 이용한 인간 유전체의 일배체형 조합문제 해결 (Solving the Haplotype Assembly Problem for Human Using the Improved Branch and Bound Algorithm)

  • 최문호;강승호;임형석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.697-704
    • /
    • 2013
  • 인간의 한쪽 염색체상에 나타나는 SNP의 서열인 일배체형을 식별해내면 효과적인 유전질병 연관검사를 할 수 있다. 주어진 SNP 단편들로부터 계산적인 방법으로 한 쌍의 일배체형을 조합하기 위해 제시된 모델 중 하나인 최소오류수정 모델은 단편에 손실이 없는 경우조차 NP-hard임이 증명되었다. 기존의 분기한정 알고리즘은 많은 계산시간을 요구함에 따라 실제 응용에 사용하기 어려웠다. 그러나 최근에 개선된 분기한정 알고리즘이 제시되었고, 꿀벌(Apis mellifera)의 유전자형 데이터를 대상으로 성능을 분석해봄으로써 개선된 알고리즘이 기존 분기한정 알고리즘보다 효율적임을 보였다. 본 논문에서는 인간의 유전자형 데이터를 대상으로 개선된 분기한정 알고리즘을 적용해 일배체형 조합문제를 수행한다. 실험을 통한 성능분석 결과, 개선된 분기한정 알고리즘이 인간 유전체에 대해서도 성공적으로 적용됨을 확인함으로써 다양한 생명체의 일배체형 조합문제에 적용 가능함을 보인다.

Interleukin-4 유전자의 Promoter 일배체형에 따른 전사능의 차이 (Difference in the Transcriptional Activity of the Interleukin-4 Promoter Haplotypes)

  • 최은화;김희섭;;이환종
    • Clinical and Experimental Pediatrics
    • /
    • 제48권5호
    • /
    • pp.495-499
    • /
    • 2005
  • 목 적 : IL-4는 Th2 면역 반응의 중요한 매개체로 IL4 유전자의 promoter 일배체형(haplotype)은 한국인 소아에서 RSV에 의한 심한 모세기관지염과 연관된다고 알려져 있다. 본 연구는 IL4 유전자의 promoter 다형성에 따른 IL-4 단백의 기능적인 변화를 분석하여 심한 RSV 하기도 감염증에 기여하는 IL4 유전자의 발병 기전의 연관성을 연구하고자 시행하였다. 방 법 : 면역 기능이 정상인 소아 20명을 대상으로 전혈을 채취한 후 genomic DNA를 추출하여 IL4 유전자 promoter 약 1.2 kb 부위를 증폭시켰다. 염기서열 분석을 통하여 IL4 유전자 promoter의 유전형을 결정하고, PHASE 분석으로 일배체형을 결정하였다. 각 일배체형별로 $5{\mu}g$의 DNA를 Jurkat T 세포에 핵형질변환 시켜서 정상 Jurkat T 세포와 PMA(50 ng/mL)로 자극한 세포에서의 luciferase 활성도를 분석하여 IL4 유전자 promoter의 전사능을 결정하였다. 결 과 : 한국인 소아의 일배체형은 3가지 유형 GCC(7%), TCC(17%), 및 TTT(76%)로 분포하였다. Jurkat T 세포의 절대 luciferase 활성도는 GCC형이 가장 낮았고 TTT형이 가장 높았다. GCC 일배체형을 기준으로 하여 나타낸 Jurkat T 세포의 상대 luciferase 활성도는 TCC형이 4.2배, TTT형이 5.3배로 증가되었다. PMA로 자극한 후에 측정한 각 일배체형의 luciferase 활성도 역시 GCC형에 비하여 TCC형이 3.0배, TTT형이 4.1배로 증가되어 자극하지 않은 세포에서와 유사한 활성도의 차이를 보였다. 결 론 : 소아의 심한 RSV 하기도 감염증과 연관된 IL4 유전자의 promoter 일배체형 TTT는 IL4 유전자의 promoter의 전사능을 증가시킴으로써 영아 및 소아의 RSV 하기도 감염증의 병인에 중요한 역할을 할 것으로 생각된다.

환자-대조군 연구에서 인구집단 층화가 일배체형 경향성 검정에 미치는 영향 (Study on Effects of Population Stratification on Haplotype Trend Test in Case-Control Studies)

  • 김진흠;강대룡;임현선;남정모
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.1085-1096
    • /
    • 2009
  • 환자-대조군 연관성 연구에서 후보 유전자와 질병이 연관되어 있지 않더라도 인구집단 층화로 인해 가짜 연관성이 발생할 수도 있다. 본 연구에서는 일배체형에 기초한 환자-대조군 연관성 연구에서 인구집단 층화로 인한 가짜 연관성을 해결하기 위한 방법으로, Zaykin 등 (2002)이 제안한 일배체형 경향성 모형에 인구집단 층화에 대한 정보를 추가하고자 한다. Zaykin 등 (2002)의 모형과 제안한 모형에 기초한 일배체형의 유의성 검정에서 인구집단 층화와 인구집단에 대한 관측 오차가 제1종 오류율에 미치는 영향을 모의실험을 통해 살펴보았다. 인구집단이 층화되어 있지만 각 개체가 속한 인구집단을 정확히 알 수 있을 때, Zaykin 등 (2002)의 모형에 기초한 검정은 제1종 오류율을 잘 조절하지 못했지만 본 연구에서 제안한 모형에 기초한 검정은 제1종 오류율을 잘 조절하는 것으로 나타났다. 그러나 인구집단이 층화되어 있고 관측 오차가 존재하면 제안한 모형에 기초한 검정도 제1종 오류율을 조절하지 못하고 명목 유의수준보다 큰 값을 갖는 것으로 나타났다. 따라서 단일염기다형성에 기초한 환자-대조군 연관성 연구와 마찬가지로 일배체형에 기초한 환자-대조군 연관성 연구에서도 인구집단 층화에 대한 정보를 갖고 있다할지라도 그 속에 관측 오차가 존재하면 위양성을 피하기 어렵다는 것을 알 수 있었다.

소세포폐암에서 Multidrug Resistance-1 유전자의 다형성과 Etoposide-cisplatin 항암화학요법 반응의 관계 (The Relationship between MDR1 Polymorphisms and the Response to Etoposide/Cisplatin Combination Chemotherapy in Small Cell Lung Cancer)

  • 손지웅;이신엽;이수정;전효성;이재희;박재형;김은진;강영모;이재태;차승익;김창호;정태훈;박재용
    • Tuberculosis and Respiratory Diseases
    • /
    • 제58권2호
    • /
    • pp.135-141
    • /
    • 2005
  • 배경 및 목적 : Multidrug Resistance-1 (MDR1) 유전자는 다약제내성에 관여하는 P-glycoprotein을 암호화한다. MDR1 유전자의 다형성은 P-glycoprotein의 발현과 기능의 차이를 일으켜 항암화학요법 반응에 영향을 미칠 수 있을 것이다. 저자들은 소세포폐암 환자에서 MDR1 유전자의 다형성과 일배체형에 따른 항암화학요법에 대한 반응을 조사하였다. 대상 및 방법 : 경북대학병원에서 병리적으로 소세포폐암으로 진단받고 etoposide-cisplatin 항암화학요법을 받은 54명을 대상으로 하였다. 전혈 5cc에서 DNA를 추출하고 PCR-RFLP법을 통해 MDR1 유전자 엑손 21의 2677G>T 다형성과, 엑손 26의 3435C>T 다형성을 조사하고 다형성과 일배체형에 따른 항암화학요법의 반응을 조사하였다. 결 과 : 2677G>T 유전자형에 따른 항암화학요법의 반응은 유의한 차이가 없었다. 3435 CC 유전자형은 3435 CT+TT 형에 비해 치료 반응율이 유의하게 높았다 (P = 0.025). 유전자형 분석 결과와 일치되게 2677G/3435C 일배체형은 다른 일배체형에 비해 치료반응을 보이는 경우가 유의하게 많았다 (P = 0.015). 결 론 : 소세포폐암에서 MDR1 유전자의 2677G>T와 3435C>T 다형성 및 이들 다형성의 일배체형은 etoposide-cisplatin 항암화학요법의 반응을 예측할 수 있는 지표로 사용될 수 있을 것으로 생각된다.

결측치가 존재하는 유전형 자료에서의 연관불균형과 일배체형을 사용한 결측치 대치 방법 (A New Method for Imputation of Missing Genotype using Linkage Disequilibrium and Haplotype Information)

  • 박윤주;김영진;박정선;김규찬;고인송;정호열
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권2호
    • /
    • pp.99-107
    • /
    • 2005
  • 본 논문에서는 단일염기변이(SNP: Single Nucleotide Polymorphism)와 같은 유전형(Rcnotype)자료에서 결측치가 발생하였을 경우 유전형 자료의 특이성을 고려해 자료 원래의 정보손실을 최소화하는 대치법인 연관불균형 기반의 대치법(linkage disequilibrium- based imputation)과 일배체형 기반의 대치법(haplotype-based imputation)을 제시한다. 이러한 결측치 대치는 실험상에서 발생하는 결측치에 의한 중요한 정보의 손실을 최소화 한다는 점에서 필요한 방법이다. 일반적으로 그동안 생물학 자료의 결측치 대치는 대부분 주형질 대치법(major allele imputation)이 활용되어왔는데 유전형 자료에서의 이 방법의 사용은 사료의 특이성으로 인하여 결측치에 대한 높은 오차율(error rate)을 보임으로서 자료의 신뢰성을 떨어뜨릴 수 있다. 본 논문에서는 유전형 자료인 단일염기변이 자료의 시뮬레이션을 통하여 기존의 주형질 대치법과 논문에서 제안된 연관불균형 기반의 대치법과 일배체형 기반의 대치법을 비교하고 그 결과를 보여 준다.

대용량 유전자형 데이터에 대한 LD기반의 일배체형 재구성 시스템 (The LD based Haplotype Reconstruction System for Large scale Genotype dataset)

  • 김상준;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.271-273
    • /
    • 2005
  • 유전자 분석기술의 발전은 지놈 프로젝트(genome project)와 햅맵 프로젝트(hapmap project)를 가능하게 하였으며 이제는 맞춤형 진단 및 신약 개발 등 실제 사업의 구체화를 가져오게 하였다. 실제 사업에 적용시키기 위해서는 비용 절감의 문제를 해결해야 한다. 그래서 대용량의 유전자형(genotype)데이터를 정확하고 빠르게 일배체형(haplotype)으로 재구성해 줄 수 있는 시스템이 생물 산업 및 제약 산업에서 제기되어 지고 있다. 기존의 연구에서 비록 정확성이 높은 알고리즘들이 개발되어 있지만 기존의 방법들은 계산에 필요한 양이 크기 때문에 대용량 데이터에 대한 처리가 불가능하였다. 우리가 제안하는 시스템은 대용량 데이터를 유동적인 크기로 블록을 분할하여 대용량 데이터 처리 문제를 해결하였다. 또한 나누어진 블록에서 나타나는 모호한 이형접합체(heterozygote)의 위상(phase)의 결정 과정에 LD기반의 블록 분할 방법을 이용함으로써, 추론된 결과의 정확률을 높였다. 구현된 시스템의 성능평가는 ms로 구성한 인공데이터를 사용하여 수행하였다.

  • PDF

신뢰도를 가진 SNP 단편들과 유전자형으로부터 일배체형 조합 (Haplotype Assembly from Weighted SNP Fragments and Related Genotype Information)

  • 강승호;정인선;최문호;임형석
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권11호
    • /
    • pp.509-516
    • /
    • 2008
  • Minimum Letter Flips(MLF) 모델과 Weighted Minimum Letter Flips(WMLF) 모델은 일배체형 조합문제(haplotype assembly problem)를 해결하기 위한 모델들이다. 그러나 MLF 모델이나 WMLF 모델은 SNP(Single Nucleotide Polymorphism) 단편들에 손실과 오류가 적은 경우에만 효과적이다. 본 논문은 WMLF 모델의 개선을 목적으로 유전자형 정보를 추가한 WMLF/GI 모델과 문제를 제시한다. 새로 제시한 문제가 NP-hard임을 증명하고, 정확성이 높고 효율적인 문제 해결을 위해 유전자 알고리즘을 설계한다. 실험 결과를 통해 새로운 모델이 기존의 모델들에 비해 SNP 단편들에 손실과 오류가 많은 경우에도 높은 정확성을 가짐과 유전자형 정보가 유전자 알고리즘의 수렴속도를 크게 개선함을 보인다.