• Title/Summary/Keyword: sequence database

검색결과 567건 처리시간 0.06초

탠덤 질량 분석을 위한 디코이 데이터베이스 생성 방법의 중복성 관점에서의 성능 평가 (Evaluation of the Redundancy in Decoy Database Generation for Tandem Mass Analysis)

  • 이홍란;류단휘;이기욱;황규백
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권1호
    • /
    • pp.56-60
    • /
    • 2016
  • 탠덤 질량 분석에서는 신뢰도 높은 펩타이드 동정을 위해 목표 데이터베이스의 참조 단백질 순서를 재배치한 디코이 데이터베이스가 주로 이용된다. 한편 목표 데이터베이스와 디코이 데이터베이스 사이 혹은 디코이 데이터베이스 내부에 서열이 동일한 중복 펩타이드가 존재할 수 있으며, 이는 단백질 동정을 어렵게 하는 요인이 된다. 따라서 디코이 데이터베이스의 중복성을 최소화하는 것은 중요한 문제이다. 본 논문에서는 디코이 데이터베이스 생성에 널리 사용되는 의사셔플(pseudo-shuffling)과 의사역순(pseudo-reversing) 방법이 디코이 데이터베이스의 중복성에 미치는 영향을 조사하였다. 실험 결과, 목표 데이터베이스 크기와 데이터베이스 생성 시 허용되는 'missed cleavage site'의 최대 개수는 중복성을 증가시킴을 확인하였다. 또한 동일한 조건에서는 의사역순 방법이 의사셔플보다 항상 낮은 수준의 중복성을 가지는 디코이 데이터베이스를 생성하였다.

단백질 모티프 예측 및 갱신 프로토 타입 구현 (Implementation of Prototype for a Protein Motif Prediction and Update)

  • 노기용;김원식;이범주;이상태;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.845-854
    • /
    • 2004
  • 모티프 데이터베이스는 새롭게 등장하는 원시 단백질 서열의 기능 및 구조 예측에 사용된다. 이러한 모티프 데이터베이스들은 원시 단백질 서열의 빠른 성장과 더불어 급속한 이용 증가 추세를 보이고 있으며, 최근에 이르러 모티프 자원 통합에 관한 연구가 진행되고 있다. 그러나 이러한 모티프 데이터베이스들은 각기 개별적인 메소드로 개발되었기 때문에 각기 다른 형식의 검색 결과를 제공한다. 이러한 문제 해결을 위한 데이터베이스 통합에서는 데이터베이스 자동 갱신 문제, 복잡한 질의 처리 문제, 중복된 데이터베이스 엔트리 핸들링 문제, XML 지원 문제 등을 지니고 있다. 이 논문에서는 기존 문제점들을 해결하기 위하여 데이터베이스 자원 통합 방법론을 제안하였고, 통합된 데이터베이스의 주기적 갱신 방안과 XML로의 변환에 관하여 기술하였다. 아울러 구축된 통합 데이터베이스와 사례 데이터베이스를 비교 평가하였다.

유전자 알고리즘을 이용한 Promoter 예측 (Promoter Prediction using Genetic Algorithm)

  • 오민경;김창훈;김기봉;공은배;김승목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.12-14
    • /
    • 1999
  • Promoter는 transcript start site 앞부분에 위치하여 RNA polymerase가 높은 친화성을 보이며 바인당하는 DNA상의 특별한 부위로서 여기서부터 DNA transcription이 시작된다. function이나 tissue-specific gene들의 그룹별로 그 promoter들의 특이한 패턴들의 조합을 발견함으로써 Specific한 transcription을 조절하는 것으로 알려져 있어 promoter로 인한 그 gene의 정보를 어느 정도 알 수가 있다. 사람의 housekeeping gene promoter들을 EPD(eukaryotic promoter database)와 EMBL nucleic acid sequence database로부터 수집하여 이것들 간에 의미 있게 나타나는 모든 패턴들을 optimization algorithm으로 알려진 genetic algorithm을 이용해서 찾아보았다.

  • PDF

로보트 자동 프로그래밍을 위한 원형 시스템의 설계 (A design of a prototype system for automatic robot programming)

  • 조혜경;고명삼;이범희
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1988년도 한국자동제어학술회의논문집(국내학술편); 한국전력공사연수원, 서울; 21-22 Oct. 1988
    • /
    • pp.501-506
    • /
    • 1988
  • This paper describes an experimental system for automatic robot programming, The SNU-ARPS (Seoul National University Automatic Robot Programming System). The SNU-ARPS generates executable robot programs for pick and place operation and some simple mechanical assembly tasks by menudriven dialog. It is intended to enable the user to concentrate on the overall operation sequence instead of the knowledge regarding the details of robot languages. To convert task specifications into manipulator motions, the SNU-ARPS uses an internal representation of the world. This representation initially consists of geometric database from CAD system and is updated at each operation step to reflect the state changes of the world.

  • PDF

Oligomer Probe Sequence Design System in DNA Chips for Mutation Detection

  • Lee, Kyu-Sang
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.87-96
    • /
    • 2001
  • 삼성종합기술원에서는 인간의 genomic DNA의 이상을 발견하여 이와 연관된 질병을 진단하는 DNA chip을 개발하고 있다. 이를 위하여 특정한 염기서열의 변화에 따라 민감하게 hybridization strength가 변화하는 oligomer를 선택해야 한다. 따라서, specificity가 가장 큰 probe를 골라내야 한다. 여기에는 열역학적인 고려와 여러가지 물리화학적인 approximation이 사용되며, DNA chip 생산 공정에 의존하는 요소도 포함되어 있다 모든 생산용 data와 결과의 분석은 database를 기반으로 이루어지며, 자동화된 통계적 분석법과 최적화 방법이 함께 사용된다.

  • PDF

BioCovi: A Visualization Service for Comparative Genomics Analysis

  • Lee, Jungsul;Park, Daeui;Bhak, Jong
    • Genomics & Informatics
    • /
    • 제3권2호
    • /
    • pp.52-54
    • /
    • 2005
  • Visualization of the homology information is an important method to analyze the evolutionary and functional meanings of genes. With a database containing model genomes of Homo sapiens, Mus muculus, and Rattus norvegicus, we constructed a web­based comparative analysis tool, BioCovi, to visualize the homology information of mammalian sequences on a very large scale. The user interface has several features: it marks regions whose identity is greater than that specified, it shows or hides gaps from the result of global sequence alignment, and it inverts the graph when total identity is higher than the threshold specified.

Frequency masking과 Wavelet 변환을 이용한 적응형 오디오 워터마킹 (An Adaptive Audio Watermarking using Frequency Masking and Wavelet Transform)

  • 이동인;김순곤
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.358-363
    • /
    • 2000
  • 본 논문에서는 디지털오디오 원시 데이터의 양에 따라 적당한 양의 오디오워터마크를 생성, 삽입하여 일정한 수준의 오디오데이터의 품질을 유지하도록 하는 적응적 워터마킹을 제안한다. 제안하는 알고리즘은 심리음향모델인 frequency masking과 Wavelet 변환의 개념을 적용한다. 저작권자 혹은 소유자의 데이터는 PN-sequence를 이용하여 생성된다. 워터마크 생성량의 조절은 특정한 모듈이 담당하게 되는데 이 모듈은 원시 데이터의 크기에 따라 워터마크의 적당한 양을 산출하여 오디오데이터의 품질을 유지하도록 한다.

  • PDF

멜론 유전자원의 원예형질 특성 및 유연관계 분석 (Evaluation of horticultural traits and genetic relationship in melon germplasm)

  • 정재민;최성환;오주열;김나희;김다은;손병구;박영훈
    • Journal of Plant Biotechnology
    • /
    • 제42권4호
    • /
    • pp.401-408
    • /
    • 2015
  • 멜론(Cucumis melo L.) 유전자원 83 품종에 대한 형질특성 및 유전적 다양성을 분석하였다. 형질은 유묘, 잎, 줄기, 화기, 과실, 종자에 대해 총 35개 세부특성을 조사하고, 다변량(MANOVA) 분석을 하였다. 주성분 분석(PCA, principal component analysis) 결과 과중, 과장, 과경, 자엽길이, 종자직경, 종자길이 등 8개의 주성분이 전체 변량의 76.3% 를 나타내었다. 평균연관법(Average linkage method)을 사용한 83개의 멜론의 군집분석(Cluster analysis) 결과 coefficient 0.7에서 5개의 cluster로 분류되었다. Cluster I은 과특성에 있어 가장 높은 측정치를, Cluster II는 당도, Cluster V는 과의 성숙기간이 긴 품종들로 주로 구성되었다. 유전자형 분석은 Cucurbit Genomics Initiative (ICuGI) database에 공시된 15개의 Expressed-sequence Tag-Simple Sequence Repeat (EST-SSR) 마커를 이용하였으며 비가중평균결합법(UPGMA)을 통해 품종간 유연관계를 분석하고 6개의 군으로 분류하였다. 형태적 군집분석 결과와 유전적 군집분석 결과의 상관관계를 조사한 결과 상관계수(r) 값이 -0.11으로 매우 낮게 나타났다.

인덱스 보간법에 기반한 효율적인 서브시퀀스 매칭 기법 (An Efficient Subsequence Matching Method Based on Index Interpolation)

  • 노웅기;김상욱
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.345-354
    • /
    • 2005
  • 서브시퀀스 매칭은 데이터 마이닝 분야에서 중요한 연산 중의 하나이다. 기존의 서브시퀀스 매칭 알고리즘들은 하나의 인덱스만을 사용하여 검색을 수행하며, 인덱스를 생성하기 위하여 데이터 시퀀스로부터 추출한 윈도우의 크기와 질의 시퀀스의 길이 간의 차이가 커질수록 검색 성능이 급격히 저하된다. 본 논문에서는 이러한 문제점을 해결하기 위하여 인덱스 보간법에 기반한 새로운 서브시퀀스 매칭 기법을 제안한다. 인덱스 보간법이란 하나 이상의 인덱스를 구축하고 주어진 질의 시퀀스의 길이에 따라 적절한 인덱스를 선택하여 검색을 수행하는 기법이다. 본 논문에서는 먼저 사전 실험을 통하여 서브시퀀스 매칭을 수행하는 데에 있어 질의 시퀀스 길이와 윈도우 크기 간의 차이로 인한 성능의 변화를 관찰하고, 이 관찰을 통하여 물리적 데이터베이스 설계 관점에서 질의 시퀀스의 길이 분포에 따른 검색 비용 공식을 산출한다. 다음에, 윈도우 크기 효과에 의한 성능 저하를 개선하기 위해 인덱스 보간법에 기반한 새로운 검색 기법을 제안한다. 또한, 검색 비용 공식에 기반하여 제안된 검색 기법의 성능을 최적화할 수 있도록 다수의 인덱스를 구성하는 알고리즘을 제시한다. 마지막으로, 실제 데이터와 합성 데이터를 이용한 여러 가지 실험을 통하여 제안된 기법의 우수성을 검증한다.

염기문자의 빈도와 위치정보를 이용한 DNA 인덱스구조 (A DNA Index Structure using Frequency and Position Information of Genetic Alphabet)

  • 김우철;박상현;원정임;김상욱;윤지희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.263-275
    • /
    • 2005
  • 대규모 DNA 데이타베이스를 대상으로 원하는 서열을 빠르게 검색하기 위해 인덱싱 기법을 많이 사용하고 있다. 그러나 대부분의 인덱싱 기법은 원래 데이타베이스보다 더 큰 저장공간을 사용하고 DBMS와의 밀 결합이 어렵다는 문제점을 가지고 있다. 본 논문에서는 완전 매치, 와일드카드 매치, k-미스매치와 같은 근사 매치 질의 처리를 위해 작은 공간을 사용하는 디스크 기반의 효율적인 인덱싱 기법과 질의 처리 기법을 제안한다 인덱싱을 위해서 DNA 염기서열에 일정 크기의 슬라이딩 윈도우를 위치시킨 후, 윈도우 내에서 각 문자의 출현 빈도를 이용해 서명을 추출해서 R*-트리와 같은 다차원 공간 인덱스에 저장한다. 특히 윈도우 내의 각 위치에 따라서 가중치를 줌으로써 서명들이 인덱스 공간에 집중되는 현상을 억제한다. 제안된 질의 처리방법은 질의 시퀀스를 다차원 사각형으로 변환하고 그 사각형과 중첩되는 서명들을 인덱스로부터 찾아낸다 제안된 방법을 실제 생물학자들이 사용하는 데이타를 이용해 실험한 결과 서픽스 트리 기반의 방법에 비해서 완전 매치인 경우 3배 이상, 와일드카드 매치인 경우 2배 이상, k-미스매치인 경우 수십 배 이상의 성능향상을 보였다.