• 제목/요약/키워드: Sequence to Sequence

검색결과 15,206건 처리시간 0.045초

Correlation Analysis between Regulatory Sequence Motifs and Expression Profiles by Kernel CCA

  • Rhee, Je-Keun;Joung, Je-Gun;Chang, Jeong-Ho;Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.63-68
    • /
    • 2005
  • Transcription factors regulate gene expression by binding to gene upstream region. Each transcription factor has the specific binding site in promoter region. So the analysis of gene upstream sequence is necessary for understanding regulatory mechanism of genes, under a plausible idea that assumption that DNA sequence motif profiles are closely related to gene expression behaviors of the corresponding genes. Here, we present an effective approach to the analysis of the relation between gene expression profiles and gene upstream sequences on the basis of kernel canonical correlation analysis (kernel CCA). Kernel CCA is a useful method for finding relationships underlying between two different data sets. In the application to a yeast cell cycle data set, it is shown that gene upstream sequence profile is closely related to gene expression patterns in terms of canonical correlation scores. By the further analysis of the contributing values or weights of sequence motifs in the construction of a pair of sequence motif profiles and expression profiles, we show that the proposed method can identify significant DNA sequence motifs involved with some specific gene expression patterns, including some well known motifs and those putative, in the process of the yeast cell cycle.

  • PDF

T2 Relaxographic Mapping using 8-echo CPMG MRI Pulse Sequence

  • E-K. Jeong;Lee, S-H.;J-S. Suh;Y-Y wak;S-A. Shin;Y-K. Kwon;Y. Huh
    • 한국자기공명학회논문지
    • /
    • 제1권1호
    • /
    • pp.7-20
    • /
    • 1997
  • The mapping of the spin-spin relaxation time T2 in pixed-by-pixel was suggested as a quantitative diagnostic tool in medicine. Although the CPMG pulse sequence has been known to be the best pulse sequence for T2 measurement in physics NMR, the supplied pulse sequence by the manufacture of MRI system was able to obtain the maximum of 4 CPMG images. Eight or more images with different echo time TEs are required to construct a reliable T2 map, so that two or more acquisitions were required, which easily took more than 10 minutes. 4-echo CPMG imaging pulse sequence was modified to generate the maximum of 8 MR images with evenly spaced echo time TEs. In human MR imaging, since patients tend to move at least several pixels between the different acquisitions, 8-echo CPMG imaging sequence reduces the acquisition time and may remove any misregistration of each pixel's signal for the fitting T2. The resultant T2 maps using the theoretically simulated images and using the MR images of the human brain suggested that 8 echo CPMG sequence with short echo spacing such as 17∼20 msec can give the reliable T2 map.

  • PDF

두개의 특성 다항식으로 구성된 이진 난수열 발생기에 관한 연구 (A Study on a Binary Random Sequence Generator with Two Characteristic Polynomials)

  • 김대엽;주학수;임종인
    • 정보보호학회논문지
    • /
    • 제12권3호
    • /
    • pp.77-85
    • /
    • 2002
  • 선형 쉬프트 레지스터를 이용한 이진 난수 발생기의 연구는 1970년대부터 연구되어져 왔으며, 이러한 이진 난수열 발생기는 스트림 암호 기법에 이용되어졌다. 일반적으로, 이진 난수열 발생기는 최대 주기의 선형 쉬프트 레지스터와 선형 복잡도가 높은 난수를 발생시키기 위하여 비선형 여과함수 또는 비선형 결합함수로 구성된다. 그러므로, 높은 선형 복잡도 뿐만 아니라, 긴 주기를 갖는 이진 난수열의 생성은 스트림 암호 기법의 안전성을 평가하는데 중요한 요소가 된다. 일반적으로 L개의 레지스터와 1개의 궤환 함수 또는 특성 다항식으로 구성된 선형 쉬프트 레지스터의 최대 주기는 $2^L$-1을 넘을 수 없다. 본 논문에서는 L개의 레지스터와 2개의 부분 특성 다항식으로 구성된 새로운 이진 난수열 발생기를 제안한다. 제안된 이진 난수열 발생기는 초기 상태 값에 따라 기존의 선형 쉬프트 레지스터에서 생성한 수열의 주기와 같거나 긴 주기를 갖는 이진 난수열을 생성하며, 생성 수열의 선형복잡도 역시 증가된다.

Comparison and Sequence Analysis of the 3` - terminal Regions of RNA 1 of Barley Yellow Mosaic Virus

  • Lee, Kui-Jae
    • Plant Resources
    • /
    • 제1권2호
    • /
    • pp.92-97
    • /
    • 1998
  • An isolate of barley yellow mosaic virus(BaYMV-HN) obtained from Haenam, Korea was compared with two BaYMV strains. BaYMV-Ⅱ-1 from Japan and BaYMV-G from Germany. The sequence of the 3'-terminal 3817nucleotides[excluding the poly (A) tail] of RNA 1 of BaYMV-HN was determined to start within a long open reading frame coding for a part of the NIa-VPg polymerase(26 amino acids). NIa-Pro polymerase (343 amino acids), NIb polymerase(528 amino acids) and the entire capsid protein(297 amino acids), which is followed by a noncoding region(NCR) of 235 nucelotides. In the partial ORFs, BaYMV-HN shows higher sequence homology with BaYMV-Ⅱ-1(99.5%) than BaYMV-G(92.7%). The 3' non-coding regions of BaYMV-HN(235nt) shows higher nucleotide sequence homology with BaYMV-G(235nt)(99.6%) than BaYMV-Ⅱ-1(231nt)(97.0%). The 3' NIa-Pro protein sequence of BaYMV-HN shows higher amino acid sequence homology with BaYMV-Ⅱ-1(95.0%) than BaYMV-G(93.6%), but, NIb protein sequence of BaYMV-HN shows same all amino acid sequence. The capsid protein sequence of BaYMV-HN(297aa) shows same with BaYMV-Ⅱ-1, and shows higher nucleotide sequence homology with BaYMV-UK (from United Kingdom)(97.3%) than BaYMV-G(96.9%) and G2(96.9%). Difference of capsid protein amino acid were 0-9 between the Japan, United Kingdom and Germany and were 2-6 between all Korean isolates. Many of the amino acid differences are located in the N-terminal regions of the capsid proteins from 1 to 74 amino acid positions.

  • PDF

로컬 서열 정렬과 트리거 기반의 단백질 버전 정보 관리 기법 (A management Technique for Protein Version Information based on Local Sequence Alignment and Trigger)

  • 정광수;박성희;류근호
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.51-62
    • /
    • 2005
  • 하나의 아미노산 서열의 기능이 밝혀지면, 그와 유사한 서열 구조를 가지고 있는 서열의 기능도 유추해 낼 수 있다. 또한 기능이 밝혀진 단백질의 아미노산 서열을 변화시키거나 유용한 단백질을 만드는 것도 가능하다. 이 과정에서 하나의 원본 단백질 서열에 대하여 다른 서열 구성을 가지고 있는 여러 가지 단백질 서열이 생겨 날 수 있다. 여기서, 원본 단백질을 변화시켜 만든 단백질 버전 서열과 단백질의 주석정보를 저장 및 관리하는 체계적인 기법이 요구된다. 따라서 이 논문에서는 로컬 서열 정렬 기법을 적용한 단백질 아미노산 서열의 버전관리 기법과 트리거를 적용한 단백질 주석데이터의 이력 관리 기법을 제시하였다. 제안된 기법을 통하여 원본 서열과 버전서열의 유사도 측정 및 버전 관리의 자동화와 저장 공간을 감소시킬 수 있다. 또한 단백질 정보의 이력을 저장하고 서열 변화 정보를 분석하여 돌연변이 연구에 의한 유용한 단백질 개발 및 신약 개발이 가능하다.

시퀀스 유틸리티 리스트를 사용하여 높은 유틸리티 순차 패턴 탐사 기법 (Mining High Utility Sequential Patterns Using Sequence Utility Lists)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.51-62
    • /
    • 2018
  • 높은 유틸리티 순차 패턴 탐사는 데이터 마이닝에서 중요한 연구 주제로 간주되고 있다. 이 주제에 대해 몇 개의 알고리즘들이 제안되었지만, 그것들은 높은 유틸리티 순차 패턴 탐사의 탐색 공간이 커지는 문제에 부딪히게 된다. 한 시퀀스의 더 엄격한 유틸리티 상한 값은 탐색 공간에서 초기에 유망하지 않은 패턴들을 더 가지치기할 수 있다. 본 논문에서 새로운 유틸리티 상한 값을 제안하는데, 그것은 한 시퀀스와 그 자손 시퀀스들의 최대 예상 유틸리티인 sequence expected utility (SEU)이다. 높은 유틸리티 순차 패턴들을 탐사하는데 필수적인 정보를 유지하기 위해 각 패턴에 대한 시퀀스 유틸리티 리스트를 새로운 자료구조로 사용한다. SEU를 활용하여 높은 유틸리티 순차 패턴들을 찾아내는 알고리즘인 High Sequence Utility List-Span (HSUL-Span)을 제안한다. 서로 다른 영역의 합성 데이터세트와 실제 데이터세트에 대한 실험 결과는 HSUL-Span이 상당히 적은 수의 후보 패턴들을 생성하고 실행 시간 면에서 다른 알고리즘들보다 우수한 것을 보여준다.

품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘 (A DNA Sequence Alignment Algorithm Using Quality Information and a Fuzzy Inference Method)

  • 김광백
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.55-68
    • /
    • 2007
  • 분자 생물학(computational molecular biology) 분야에서 DNA 염기 서열 배치 알고리즘은 다양한 방법으로 개선되어 왔다. 본 논문에서는 기존의 DNA 염기의 품질 정보(quality information)를 이용한 DNA 염기 서열 배치 방법을 개선하기 위하여 퍼지 논리 시스템(fuzzy logic system)과 DNA 염기 서열 단편의 특징을 적용한 품질 정보와 퍼지 추론 기법을 이용한 DNA 염기 서열 배치 알고리즘을 제안한다. 기존의 알고리즘은 Needleman-Wunsch가 제안한 전역 배치 알고리즘에 각 DNA 염기의 품질 정보를 적용하여 DNA 염기 서열 배치 점수를 계산하였다. 그러나 전체 DNA 염기의 품질 정보를 이용하여 계산하기 때문에 DNA 염기 말단 부분의 품질이 낮은 경우에는 DNA 염기 서열 배치 점수를 계산하는 과정에서 오차가 발생한다. 본 논문에서는 기존의 품질 정보를 이용한 알고리즘을 개선하여 DNA 염기 서열의 말단 부위의 품질이 낮은 경우에도 정확히 서열을 배치할 수 있도록 한다. 또한 DNA 염기 서열 단편의 길이와 낮은 품질의 DNA 염기 빈도를 퍼지 논리 시스템에 적용하여 DNA 염기 서열 배치 점수를 계산하는데 적용되는 매핑 점수 인자(parameter)를 동적으로 조정한다. 제안된 알고리즘의 성능 평가를 위해 NCBI(National Center for Biotechnology Information)의 실체 유전체 데이터를 받아 성능을 분석한 결과, 제안된 알고리즘이 기존의 품질 정보만을 이용한 알고리즘 보다 DNA 염기 서열 배치에 있어서 효율적임을 확인하였다.

  • PDF

시퀀스 다이어그램으로부터 테스트 케이스 자동 생성을 위한 M2M(Model-to-Model) 변환 규칙 (M2M Transformation Rules for Automatic Test Case Generation from Sequence Diagram)

  • 김진아;김수지;서용진;천은영;김현수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권1호
    • /
    • pp.32-37
    • /
    • 2016
  • 시퀀스 다이어그램에 대한 모델 기반 테스트를 수행하기 위하여 시퀀스 다이어그램으로부터 테스트 케이스를 자동으로 생성해야 한다. 이를 위해서는 시퀀스 다이어그램이 나타내는 시나리오를 파악하고 테스트 커버리지를 만족하는 경로를 추출하여 테스트 정보를 생성해야 한다. 하지만 시퀀스 다이어그램은 결합 조각을 사용하여 반복 및 조건, 대안 정보를 나타내므로 시퀀스 다이어그램으로부터 테스트 케이스를 자동으로 생성하는 것은 복잡하다. 이러한 문제를 해결하기 위하여 본 논문에서는 시퀀스 다이어그램으로부터 액티비티 다이어그램으로 변환을 수행하는 모델 변환 프로세스를 정의하고, 이를 통해 시퀀스 다이어그램의 시나리오를 제어 흐름 형태로 표현하고 여기에 테스트 커버리지를 적용하여 테스트 케이스를 생성하는 과정을 정의한다. 마지막으로, 사례 연구를 통하여 시퀀스 다이어그램으로부터 테스트 케이스를 생성하는 과정을 보인다.

Bacillus subtilis로 부터 분리한 cellulase 유전자의 조절부위에 대한 염기서열분석 (Analysis on the nucleotide sequence of the signal region of bacillus subitilis extracellular cellulase gene)

  • 서연수;이영호;백운화;강현삼
    • 미생물학회지
    • /
    • 제24권3호
    • /
    • pp.236-242
    • /
    • 1986
  • The nucleotide sequence of the genetic control site of Bacillus subtilis gene for $(1-4)-{\beta}-D-glucan$ endoglucanase (cellulase) was determined according to the procedures of the dideoxy chain termination method(Sanger et. al., 1977). The deduced amino acid sequence of this enzyme has a hydrophobic signal peptide at the $NH_2$ terminus similar to those found in fifteen other extracellualr enzymes from Bacillus species. This is followed by a sequence resembling the Bacillus ribosome binding site 14 nucleotide before the first codon of the gene. The presumptive promoter sequence was located 92 base pairs upstream fromthe initiation codon. The homology region in signal sequences was striking when comparing all the signal sequences of sixteen extracellular enzymes from Bacillus species so far compiled.

  • PDF

Aspergillus nidulans의 tRNA유전자의 구조와 발현에 관한 연구 V Aspergillus nidulansd의 $tRNA^{Arg}$ 분자구조 (Studies on the Oranization and Expression of tRNA Genes in Aspergillus nidulans (V) The Molecular Structure of $tRNA^{Arg}$ in Aspergillus nidulans)

  • 이병재;강현삼
    • 미생물학회지
    • /
    • 제24권2호
    • /
    • pp.79-85
    • /
    • 1986
  • A. nidulans의 $tRNA^{Arg}$의 염기순서를 효소절단 방법으로 결정하였다. 이 방법으로 염기순서를 결정한 결과 다음과 같았다. 5'GGCCGGCUGGCCCAAXUGGCAAGGCXUCUGAXUACGAAXCAGGAGAUUGCAXXXXXGAGCXXUXXGUCGGUCACCA3'. 위의 결과로 플로버잎 구조를 만들어본 결과 안티코돈이 ACG인 $tRNA^{Arg}$으로 판명되었고. 이 결과는 아미노산 부하검사(charging test)의 결과와 일치하였다. 이 tRNA의 유천자의 염기순서 결과와 비교하여 염기순서의 정확성을 검증하였고, minor base분석을 통하여 전 염기순서를 추정하였다.

  • PDF