• 제목/요약/키워드: 서열검색

검색결과 173건 처리시간 0.024초

전용 서열블라스트 시스템 설계 및 구현 (Design and Implementation of Personalized Sequence BLAST System)

  • 최영상;최한석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.364-366
    • /
    • 2008
  • 본 논문에서는 지놈 연구에서 반드시 필요한 유전체 서열정보의 상동성 검색을 위해 해외 데이터베이스에만 의존하고 있는 국내 지놈 연구자들에게 더욱 빠르고 쉽게 접근할 수 있는 서열블라스트를 만들 수 있는 방법을 제공함으로써 국내 지놈연구에 도움이되고자 특정 종류의 유전자정보 만을 모아놓은 지놈 서열블라스트 시스템을 설계하고 구현하는 방법을 제시하였다. 이 시스템을 활용하면 많은 생물 지놈 연구자들의 연구시간을 획기적으로 단축할 수 있을 것이다.

그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현 (Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System)

  • 김동욱;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.81-87
    • /
    • 2010
  • 본 논문에서는 현재 생물정보학 연구에서 가장 많이 사용하고 있는 BLAST의 문제점을 분석하고 이에 따른 해결책을 제시하기 위하여 그리드 컴퓨팅을 이용한 G-BLAST(Grid Computing을 이용한 Basic Local Alignment Search Tool)를 제안한다. 본 연구에서 제안하고 있는 G-BLAST을 이용한 시스템은 이기종 분산 환경에서 수행이 가능한 서열분석 통합 소프트웨어 패키지이며 기존 서열분석 서비스의 취약점인 검색 성능을 개선하여 BLAST 검색 기능을 강화 하였다. 또한, BLAST 결과를 사용자가 관리 및 분석이 용이하도록 데이터베이스 및 유전체 서열분석 서비스 시스템을 구현하였다. 본 논문에서는 G-BLAST시스템의 성능확인을 위하여 병렬컴퓨팅 성능테스트 기법을 도입하여 구현된 시스템을 기존 BLAST와 속도 및 효율부분에서 비교하여 성능개선을 확인하였으며 서열결과 분석에 필요한 자료를 사용자관점에서 제공해주고 있다.

Sphingomonas chungbukensis DJ77의 16S rRNA 염기서열과 이차구조 (Nucleotide Sequence and Secondary Structure of 16S rRNA from Sphingomonas chungbukensis DJ77)

  • 이관영;권해룡;이원호;김영창
    • 미생물학회지
    • /
    • 제41권2호
    • /
    • pp.125-128
    • /
    • 2005
  • S. chungbukensis DJ77로부터 16S rRNA유전자의 염기서열을 분식하였다. 염기서열은 총 1,502 bp로 2000 년에 등록된 부분 서열(1,435 bp)보다 5' 방향과 3' 방향으로 29 bp와 37 bp 길이만큼 각각 확장하였으며, 1 bp가 추가로 삽입되었다. E. coli의 16S rRNA유전자를 모델로 이차구조를 제작하였으며, 네 부위가 특이적임을 발견하였다. Sphnigomonas spp.의 16S rRNA 서열과 S. chungbukensis DJ77의 다중서열검색 결과, Sphingomonas종에서만 나타나는 보존부위와 가변부위를 발견할 수 있었다. 특히, Campylobacter jejuni에서만 나타나는 것으로 알려진 긴 stem loop구조가 서열은 조금 다르지만 구조적 일치를 보이는 유사한 구조를 S. chungbukensis DJ77에서도 발견하였다. 결과적으로, 다중서열검색을 통해 제작한 계통수와 nucleotide signatures분석에 근거하여 S. chugukensis DJ77을 cluster II (Sphingobium)로 분류하였다.

메타게놈 서열에 존재하는 보존적인 전사와 번역 인자를 이용한 ORF 예측 (Prediction of ORFs in Metagenome by Using Cis-acting Transcriptional and Translational Factors)

  • 정대은;김근중
    • KSBB Journal
    • /
    • 제25권5호
    • /
    • pp.490-496
    • /
    • 2010
  • 미생물은 지구상에 약 $5\;{\times}\;10^{30}$ 정도의 개체가 존재하며, 350~550 Pg (1Pg = 1015g)의 탄소, 85~130 Pg의 질소, 9~14 Pg의 인 등, 지구상의 어떠한 생물 종보다 거대한 양의 원소를 포함하고 있다. 또한 이러한 미생물과 생태계를 구성하는 다른 유기체나 무기물과의 관계가 지속적으로 밝혀지고 있다. 이러한 연구들의 기본적인 목표는 상호작용에 중요한 인자들의 규명 (대표적으로 유전자)하는 것이기 때문에, 염색체에 존재하는 true ORF의 검색과 확인은 가장 중요한 기본 수단이 된다. 그러나 다양한 미생물로 구성된 환경 유전체는 기존 정보로 검색 가능한 비율을 정확하게 유추할 수 없기에 많은 어려움이 있다. 이렇게 경계가 불분명한 자료의 검색을 위해서는 보다 많은 정보를 필요 (training이나 space를 규정하기 위한 보다 많은 유전자 서열)로 하며, 다른 검색 방법이나 기법들이 추가적으로 개발되어야 할 것이다. 이러한 방법의 대안으로써, 미생물의 유전자간 서열에 존재하는 전사/번역인자의 보존성에 근거한 검색방법은 개량 여하에 따라 광범위한 적용 범위를 지닐 것이다. 현 수준에서도 조합 탐색, 즉 기존의 방법과 혼용하거나 기존의 방법을 보완하는 과정으로 충분한 가치를 지니고 있다. 이러한 추정은, 기존의 ORF 중심의 발굴 결과와 전혀 일치되지 않는 경우에서부터 90% 이상 일치하는 등의 결과로서 확인하였다. 일치 되지 않는 많은 경우가 BLASTing으로 검색되지 않는 새로운 ORF를 포함하기 때문이다.

타일 정렬을 이용한 이미지 검색 알고리즘 (Image Search Algorithm with Tile Alignment)

  • 박웅;전호윤;신종우;전명재;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.712-714
    • /
    • 2004
  • 인터넷상의 대부분 이미지 검색엔진들은 이미지의 실제 내용보다는 이미지 파일명이나 부가적인 색인과 같은 문자 정보에 의존하여 이미지 검색을 하고 있다. 한편 이미지의 색상 정보를 비교에 사용하는 RGB 히스토그램 방법은 수행시간은 짧지만 형태는 고려하지 않기 때문에 높은 정확도는 기대하기 어렵다. 본 논문에서는 이미지의 실제 내용을 비교하여 비정형의 복잡한 물체를 검색하는 새로운 이미지 검색 알고리즘을 제안한다. 제안하는 알고리즘은 이미지의 색상과 형태 정보를 담은 타일 서열을 local alignment 알고리즘으로 정렬하여 이미지 검색을 한다 비정형 물체인 음식 사진을 사용한 실험에서 기존의 방법 RGB 히스토그램을 이용한 방법보다 월등히 향상된 정확도를 나타내었다.

  • PDF

데이터 베이스를 이용한 웹 기반 계통수 추론 시스템 설계 (Design of Web-based Phylogentic Tree Inference System Using DataBase)

  • 김신석;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.121-124
    • /
    • 2001
  • 계통수는 특정 객체의 분류 즉 특정 객체로부터 추출한 염기서열을 이용하여 그 객체의 소속 분류 집단을 결정하기 위해서 사용될 수 있다. 만약 특정지역에서 획득한 토끼의 종을 구분하기 위해서 이미 분류된 토끼의 염기서열들을 가지고 염기서열들과의 관계를 표현하는 계통수를 제작함으로써, 객체를 분류 할 수 있다. 계통수 제작은 기존의 계통수 제작 도구들(MEGA등)이 사용되지만, 이러한 계통수 제작 도구는 객체의 어떤 특성에 의해서 종이 나뉘어지는 가는 예측 할 수 없다. 계통수 제작에 이용되는 염기서열 데이터는 기존의 염기서열 데이터 베이스들(EMBL, GenBank, DDBJ)에서 인터넷을 이용하여 찾을 수 있지만, 계통생물학을 위해 누적된 데이터가 아니므로, 계통수 제작을 위해서는 사용이 제한적이다. 또 계통수 제작 도구을 사용하기 위해서는 자신이 관련 염기서열 데이터를 수집하여야 한다. 본 논문은 웹기반 계통수 추론 시스템을 제시한다. 본 시스템은 염기서열 데이터를 검색하여, 계통 분류 즉 계통수 제작을 위한 데이터로 저장하고, 이를 이용하여 계통수를 그릴 수 있다. 또한 이렇게 저장된 데이터는 데이터 마이닝 분류 기법을 사용하여, 각 객체 분류 집단을 모델링하며, 분류 속성을 예측할 수 있다.

  • PDF

공간객체 모델 기반 단백질 3차 구조 모델링 (Modelling of three Dimensional Structure in Protein based on Spatial Object Model)

  • 한욱;박성희;이순희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.73-75
    • /
    • 2002
  • PDB에서 제공하는 단백질 3차원 고분자결정 구조에 대한 플랫파일은 인자들의 좌표, 서열정보, 실험정보 및 참조 정보가 포함된다. 이러한 정보를 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적인 검색을 위해서는 이러한 데이터를 추출하여 데이터베이스 구축이 요구되며 이 때 단백질 구조 및 서열 정보와 실험 및 탐조 정보의 관계에 대한 모델링이 중요하다. 따라서 이 논문에서는 PDB에서 제공하는 플랫파일들의 엔트리들을 분석하고 3차원 공간 객체의 기하적 특성을 갖는 단백질 3차 구조를 공간객체로 표현하고 공간객체 모델을 적용하여 모델링한다. 이렇게 함으로써 단백질 3차 구조 분자를 구성하는 인자 및 구조 정보 검색이 가능하며 위상 및 기하 연산자글 이용하여 단백질 구조 분석에 활용할 수 있다.

  • PDF

색상 서열 비교를 통한 영상의 유사도 분석 기법 (Method of Image Similarity Analysis Using Sequence Alignment of Colors)

  • 정인준;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.426-429
    • /
    • 2011
  • 영상처리를 이용한 영상간의 유사도 비교 기법은 영상의 검색 및 영상의 자동 인식 등을 위한 연구로 최근 각광받고 있다. 최근 영상 처리 기법은 화소의 질적 향상 및 처리시간 최적화, 효율적인 특정 요소의 추출 등 다양한 방법으로 시도되고 있다. 특히, 영상의 유사도 비교는 유사 영상 검색과 같은 경우에 많이 쓰인다. 영상의 유사도를 비교하기 위한 기법으로는 영상 데이터의 특징에 따라 대상 영역을 여러 영역으로 나누는 영역분할 기법과 군집화, 퍼지, 유전자 알고리즘 등이 있다. 본 논문에서는 영상을 HSV 색공간으로 변환한 후 색상 값에 대하여 전역 정렬 기법을 사용하는 유사도 측정 방법을 제시한다. 전역 정렬 기법은 유전자 서열 비교 기법 중 하나로서 두 유전체의 유사도를 측정하는데 사용된다. 유사도 측정 효율을 높이기 위해 색상 값을 8단계로 양자화하여 영상의 서열을 생성하였다. 실험결과 제시한 방법을 영상 회전이나 대칭, 글자 삽입 등의 간단한 연산에 크게 영향을 받지 않는 것으로 드러났다.

핵산증폭용 특정 길이의 Primer 검색 프로그램 (RCA-mer: A Web-Based Program Searching for Primer Candidates)

  • 조영훈;박기정;이대상
    • 미생물학회지
    • /
    • 제44권2호
    • /
    • pp.164-167
    • /
    • 2008
  • PCR 방법과 더불어 최근 핵산증폭기법으로 주목받기 시작한 방법이 Rolling Circle Amplification (RCA) 기법을 응용한 것이다. 본 논문에서 RCA 기술을 활용하는 실험에 이용할 수 있는 특정 길이(N-mer)를 가진 primer의 후보 리스트를 vector 서열이나 특정 미생물 염색체 서열에서 검색할 수 있는 프로그램인 RCA-mer를 개발하였다. RCA-mer는 사용자의 염기서열을 입력으로 받아 이 서열을 대상으로 특정 길이의 N-mer에 대한 존재 유무에 대한 리스트의 후브를 웹으로 보여주는 기능을 가지고 있다. 또한 서로 다른 두 개의 염기서열들에 대해 N-mer가 공통으로 존재하는지, 한쪽 서열에만 존재하는지 확인할 수 있는 기능을 가지도록 개발하였다. 사용자는 선발된 primer 후보들로 부터 적절한 N-mer 서열을 선택하여 실제 RCA를 이용한 실험 곧바로 응용할 수 있도록 후보 primer를 선별하여 사용할 수 있도록 하였다.

색인어 퍼지 관계와 서열기법을 이용한 정보 검색 방법론 (A Methodology of the Information Retrieval System Using Fuzzy Connection Matrix and Document Connectivity Order)

  • 김철;이승채;김병기
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1160-1169
    • /
    • 1996
  • 본 연구에서는 색인어 퍼지 관계행렬을 이용한 정보검색 방법을 제안하고 간단한 문헌정보 검색시스템을 사용하여 실험을 수행하고 그 결과를 분석하였다. 불리안 연산 자인 AND, OR, NOT으로 색인어들을 조합한 질의식을 통해 실험을 수행한 결과 일반 집합이론에 의한 검색실험에서보다 상당히 우수한 성능을 보였다. 특히 재현율과 정확 률을 측정한 성능평가 결과는 퍼지 문헌검색 시스템이 가능한 검색 대안이라는 사실을 확인 하였다고 할 수 있다. 한편, 검색의 기법 측면에서 고려하였을 때 본 실험은 먼저, 색인어 관계행렬에 따라서 검색결과에 서열을 부여하였고, 기준적합도값의 변동에 따라 검색결과가 유동적으로 대응하도록 하였으며, 관계값을 의미적 거리로 파악함으 로써 검색과정과 검색 시맨틱스를 일치시키고자 새롭게 시도하였다.

  • PDF