• Title/Summary/Keyword: 염기

Search Result 4,784, Processing Time 0.031 seconds

DNA 염기의 토토머화에 의한 염기쌍 변이 연구: 염기쌍의 전이 돌연변이를 중심으로

  • Lee, Yeon-Hui;Lee, Min-Jun;Sin, Seok-Min
    • Proceeding of EDISON Challenge
    • /
    • 2015.03a
    • /
    • pp.99-104
    • /
    • 2015
  • DNA 복제는 굉장한 정확도를 가지고 이루어진다. 하지만 내, 외부적인 여러 요인으로 돌연변이가 일어나기도 한다. 그 중 토토머화에 의해 치환 돌연변이가 일어난다는 가설은 오래전부터 그 가능성이 논의되어 왔고, 직접적인 증거를 찾으려는 노력도 있어 왔다. 토토머화에 의하여 DNA염기가 다른 형으로 변하면 왓슨-크릭 염기쌍 (아데닌-타이민, 시토신-구아닌이 수소결합한 염기쌍)이 아닌 다른 염기쌍이 생성될 수 있다. 이 염기쌍이 기준이 되어 DNA가 복제되기 때문에 결과적으로 전이 돌연변이(transition), 혹은 전환 돌연변이(transversion)된 염기쌍이 생성될 수 있다. 우리는 이런 사례 중에 염기쌍의 전이 돌연변이를 중심으로 연구하고자 한다. A-T염기쌍중 하나가 지배적인 아민형(amine form)이 아니라 이민형(imine form)으로 존재할 때 아민형과는 다른 수소결합이 가능해지며 보통 잘 생성되지 않는 A-C, G-T결합이 생성될 수 있다. 이후 그 염기쌍이 기준이 되어 DNA가 복제될 때에는 왓슨-크릭 염기쌍이 주로 생성되어 A-T염기쌍이 G-C 염기쌍으로 치환되는 DNA가닥이 생기게 된다. 우리는 이러한 과정을 에너지와 반응속도 측면에 집중하여 분석해보았다. 계산 결과, $A-C^*$, $A^*-C$, $G-C^*$, $G^*-C$의 염기쌍 생성이 왓슨-크릭 염기쌍과 비슷하거나 더 큰 정도로 에너지 면에서 유리하였으며 대부분의 돌연변이가 에너지 측면에서 보았을 때 $A-C^*$ 염기쌍을 통하여 생김을 알 수 있었다. 계산된 값은 약 $10^{-6}$ 정도의 빈도를 보였다.

  • PDF

A Study on a tool to generate polymorphic genome and metagenome sequences (다염기변이 및 메타유전체 염기서열 생성도구에 관한 연구)

  • Kim, Jonghyun;Kim, Woocheol;Park, Sanghyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.262-263
    • /
    • 2007
  • 유전체학 (genomics)의 가장 기초적인 기반이 되는 것은 염기서열을 정확하게 결정해 내는 것이다. 많은 진핵생물들 (eukaryotes)은 두개의 상동염색체를 가지며 두개의 염색체의 염기서열에는 차이가 존재한다. 현재의 유전체 염기서열 결정방법으로는 염기변이가 많이 존재할 경우 유전체의 염기서열을 결정하기 어렵다. 특정한 장소에 서식하는 무수히 많은 미생물들의 유전체의 염기서열을 동시에 결정하는 문제도 미생물학에서 중요성을 인정받는 문제이지만, 미생물들간의 염기변이의 정도는 단일개체의 경우보다 복잡하며 염기서열을 효과적으로 결정하기 힘들다. 따라서 염기변이가 많은 생물들과 미생물들 집합의 염기서열을 결정할 수 있는 방법론의 개발이 시급한 실정이다. 본 논문에서는 조립된 다염기변이 유전체및 메타유전체의 염기서열의 정확성을 평가하기 위한 유전체 서열과 시뮬레이션에 기반한 read 들을 생성하는 도구를 개발하는 것을 목표로 한다.

  • PDF

Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4 (As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정)

  • 김상현;박원목;이세영;박영인
    • Korean Journal Plant Pathology
    • /
    • v.12 no.2
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF

A Nucleotide Sequence Signature Extraction Method based on Position-Specific Relative Base Frequency Differences (위치기반 상대빈도차 기반의 바이러스 염기서열 시그너쳐 추출 기법)

  • Hwang, Gyeong-Sun;Lee, Hye-Ri;Lee, Geon-Myeong;Lee, Chan-Hui;Yun, Hyeong-U;Kim, Seong-Su
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.167-170
    • /
    • 2007
  • 동일한 집단에 속하는 개체를 다른 집단에 속하는 개체로부터 구별할 수 있는 염기의 특징을 해당 집단의 시그너쳐라고 한다. 학습 데이터는 두 집단에 속하는 염기서열들이고, 염기서열에 대한 시그너쳐는 개체를 다른 집단과 구별할 수 있는 위치의 염기들로 구성된 서열이다. 제안한 방법에서는 각 집단에 대해서 위치별로 염기의 발생빈도를 계산하고, 가장 발생빈도가 높은 염기를 결정한 다음, 다른 집단의 대응 위치에서 해당 염기의 빈도를 계산하여, 빈도차이가 지정한 분류임계값 이상이면, 해당 위치의 염기를 시그너쳐를 구성하는 특징으로 간주한다. 시그너쳐를 대한 임의의 염기서열에 대한 부합정도는 시그너쳐에 속하는 염기의 학습집단에서의 상대빈도값을 가중치로 하여 계산한다. 임의의 염기서열이 특정 집단에 속하는지 판단하기 위해서는 해당 집단의 시그너쳐에 대한 부합정도를 계산하게 되는데, 부합정도가 얼마이상이 되어야 해당 집단에 속하는 것으로 간주할지 기준이 되는 임계값을 엄밀도 임계값이라고 한다. 엄밀도 임계값은 학습 데이터 집합에 대해서 주어진 시그너쳐에 대한 엄밀도 임계값이 민감도와 특이도를 최대로 하는 것을 선택한다. 제안한 방법을 구현한 바이오인포매틱스 도구를 개발하여, 한국형 HIV-1 바이러스 시그너쳐 추출에 적용하여 분류특성이 우수한 시그너쳐를 추출할 수 있음을 확인하였다.

  • PDF

An effcient algorithm for multiple sequence alignment (복수 염기서열 정렬을 위한 한 유용성 알고리즘)

  • Kim, Jin;Song, Min-Dong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.51-53
    • /
    • 1998
  • 3개 이상의 DNA 혹은 단백질의 염기서열을 정렬하는 복수 염기서열 정렬(multiple sequence alignment)방법은 염기서열들 사이의 진화관계, gene regulation, 단백질의 구조와 기능에 관한 연구에 필수적인 도구이다. 복수 염기서열 정렬문제는 NP-complete 문제군에 속하며, 이 문제를 해결하기 위하여 가장 유용하게 사용되는 알고리즘으로는 dynamic programming이 있다. Dynamic programming은 주어진 입력 염기서열 군들에 대한 최적의 정렬을 생산할 수 있다. 그러나 dynamic programming의 단점은 오랜 실행시간이 요구되며, 때로는 dynamic programming의 속성 때문에 이 알고리즘을 사용하여도 주어진 입력 염기서열 군들에 대한 최적의 정렬을 얻어내지 못하는 경우가 있다. 본 연구에서는 이러한 dynamic programming의 문제를 해결하기 위하여 genetic algorithm을 복수 염기서열 정렬문제에 적용하였다. 본 논문에서는 genetic algorithm의 design과 적용방법을 기술하였다. 본 연구에서 제안된 genetic algorithm을 사용하여 dynamic programming의 단점이었던 오랜 실행시간을 줄일 수 있었으며, dynamic programming이 제공하지 못하는 최적의 염기서열 정렬을 제공할 수 있었다.

  • PDF

Study on identification of candidate DNA marker related with beef quailty in QTL region of BTA 2 in Hanwoo population (한우 2번 염색체 양적형질좌위 영역에서 육질 연관 후보 DNA 마커 규명에 관한 연구)

  • Lee, Yoon-Seok;Oh, Dong-Yep;Yeo, Jung-Sou
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.661-669
    • /
    • 2011
  • By direct sequencing of 12 STS marker, we identified 10 polymorphic SNPs. As a result of genotype frequency analysis between 10 polymorphic SNPs and extreme population (n=20) for marbling score in Hanwoo (n=233), there was over 40 percent of frequency difference of HWSNP_1-1 and HWSNP_9-4 SNP. HWSNP_1-1 SNP was significantly associated with marbling score in large-scale population (n=233). Therefore we suggested that HWSNP_1-1 SNP can be useful as a positional candidate for beef quality for marker-assisted selection in Hanwoo.

Characteristic Signature Extraction using the Base Distribution Substitution Comparison (염기분포와 대치 비교를 이용한 염기서열 집단의 고유 시그너쳐 추출)

  • Hwang, Gyeong-Sun;Lee, Hye-Ri;Lee, Geon-Myeong;Kim, Seong-Su;Lee, Chan-Hui;Lee, Seong-Deok;Yun, Hyeong-U
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.419-422
    • /
    • 2007
  • 유전자 변이가 쉽게 일어나는 바이러스 등은 변이 계통에 따라 집단을 형성하게 된다. 이러한 집단들에 대한 분석은 해당 바이러스 집단에 대한 추적, 백신 및 치료약 개발에서 필수적이다. 어떤 집단의 염기 서열의 특성을 효과적으로 표현하는 패턴을 시그너쳐라 하며, 이러한 시그너쳐는 특정 염기서열 집단의 고유한 특성을 나타내면서 다른 집단과 구별되는 정보를 포함하는 것이 바람직하다. 이 논문에서는 가능한 후보 시그너쳐들을 염기분포를 이용하여 생성해가면서, 시그너쳐 해당부위의 염기를 상대 서열집단의 공통 서열의 염기로 변환하여 집단간의 상대거리를 측정함으로써, 후보 시그너쳐에 의한 집단의 고유성질 표현능력과 집단간 차별화 능력을 고려하여 시그너쳐를 추출하는 방법을 제안한다.

  • PDF

A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method (품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘)

  • Kim, Kwang-Baek
    • Journal of Intelligence and Information Systems
    • /
    • v.13 no.2
    • /
    • pp.55-68
    • /
    • 2007
  • DNA sequence alignment algorithms in computational molecular biology have been improved by diverse methods. In this paper, we proposed a DNA sequence alignment algorithm utilizing quality information and a fuzzy inference method utilizing characteristics of DNA sequence fragments and a fuzzy logic system in order to improve conventional DNA sequence alignment methods using DNA sequence quality information. In conventional algorithms, DNA sequence alignment scores were calculated by the global sequence alignment algorithm proposed by Needleman-Wunsch applying quality information of each DNA fragment. However, there may be errors in the process for calculating DNA sequence alignment scores in case of low quality of DNA fragment tips, because overall DNA sequence quality information are used. In the proposed method, exact DNA sequence alignment can be achieved in spite of low quality of DNA fragment tips by improvement of conventional algorithms using quality information. And also, mapping score parameters used to calculate DNA sequence alignment scores, are dynamically adjusted by the fuzzy logic system utilizing lengths of DNA fragments and frequencies of low quality DNA bases in the fragments. From the experiments by applying real genome data of NCBI (National Center for Biotechnology Information), we could see that the proposed method was more efficient than conventional algorithms using quality information in DNA sequence alignment.

  • PDF

Multiple Sequence Aligmnent Genetic Algorithm (진화 알고리즘을 사용한 복수 염기서열 정렬)

  • Kim, Jin;Song, Min-Dong;Choi, Hong-Sik;Chang, Yeon-Ah
    • Korean Journal of Microbiology
    • /
    • v.35 no.2
    • /
    • pp.115-120
    • /
    • 1999
  • Multiple Sequence Alignment of DNA and protem sequences is a imnport'mt tool in the study of molecular evolution, gene regulation. and prolein suucture-function relationships. Progressive pairwise alignment method generates multiple sequence alignment fast but not necessarily with optimal costs. Dynamic programming generates multiple sequence alig~~menl with optimal costs in most cases but long execution time. In this paper. we suggest genetlc algorithm lo improve the multiple sequence alignment generated from the cnlent methods, describe the design of the genetic algorithm, and compare the multiple sequence alignments from 0111 method and current methods.

  • PDF

Complete Nucleotide Sequence of Tobacco Mosaic Virus Isolated from Wasabi(Eutrema wasabi Maxim.) (고추냉이에서 분리한 담배 모자이크 바이러스(TMV-W)의 전체 유전자 염기서열 분석)

  • 이귀재
    • Korean Journal of Plant Resources
    • /
    • v.16 no.1
    • /
    • pp.82-88
    • /
    • 2003
  • Genomic RNA sequence of a tobamovirus infecting Eutrema wasabi plant(TMV-W) was determined. The RNA is composed 6,298 nucleotide and contains four OREs encoding the protein of 180KD(OREI), 130KD(ORE2),30KD(ORF3) and 18KD(coat protein, ORF4). ORE4, ORF 3, ORF 2 and ORF 1 are overlaped by 130, 20 and 40 nucleotides, and the overapping region can be folded into a stable hairpin styucture. This includes the 3'non-coding region of 238 nucleotides, coat protein gene(537 nucleotides,179 amino acid), 30KD movement protein gene(825 nucleotides, 275 amino acid), 13(IKD protein gene(1,896 nucleotides, 632 amino acid) and 180KD protein gene(2,958 nucleotides, 986 amino acid). The genomic RNA sequence was compared with homologous regions of eleven other tobamoviruses. TMV-WTE was similar to TMV-WSF(98.6%) in nucleotide sequence.