• 제목/요약/키워드: 유전자 정보

검색결과 1,503건 처리시간 0.031초

Knock-out 데이터를 이용한 유전자 조절망의 구성 (Constructing Gene Regulatory Networks using Knock-out Data)

  • 홍성룡;손기락
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.105-113
    • /
    • 2007
  • 유전자 조절망은 유전자의 발현이 다른 유전자에게 영향을 주는 것을 표현하는 유전자 망이다. 오늘날 마이크로 어레이 실험으로부터 유전자의 발현량을 측정한 대용량의 데이터가 이용 가능하다. 전형적인 데이터중의 하나는 특정 유전자를 제거한 후 다른 유전자의 발현량을 측정한 steady-state data이다. 본 논문은 이런 측정 데이터를 이용하여 중복 정보를 최소화하는 유전자 조절망을 재구성하는 방법을 제시한다. 제시한 모델은 기존 연구에서는 고려되지 않았던 사이클 형태로 나타나는 자동 조절 기능을 고려하였고, 또한 유전자의 억제자 또는 촉진자 역할을 고려하였다.

  • PDF

유전자 알고리즘에서의 개선된 유전자 선택기법의 비교 (A Evaluation on Improver Gen Code Selection Method for the Genetic Algorithms)

  • 김태식;정성용
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 1997년도 추계학술대회 발표논문집:21세기를 향한 정보통신 기술의 전망
    • /
    • pp.63-77
    • /
    • 1997
  • 유전자 알고리즘(Genetic Algorithms)은 우수형질이 계속 번식하고 열성형질은 도태하는 자연의 진화 메커니즘을 모방한 탐색 알고리즘으로 전형적인 조합 최적화 문제에 많이 적용되고 있다. 유전자 알고리즘의 성능을 향상시키기 위해 알고리즘 실행과정에 적용할 수많은 이론과 경험적인 유전자 조작 기법이 제시되고 있는데, 이러한 기법들은 대부분 우수형질을 확보함으로써 최적의 값을 효과적으로 탐색하기 위한 것이다. 그러나, 적절하지 못한 유전자 조작의 경우 탐색지점의 제한등으로 인한 Local Optimum에 빠질 위험이 있으므로, 유전자 조작에 대한 평가가 이루어져야 한다. 본 연구에서는 유전자 알고리즘의 유전자 조작기법중 적응도 비례전략을 개선한 유전자조작이 적절한 선택기법들로 유전자 알고리즘에 응용될수 있는지를 밝히기 위해, 냅색문제를 대상으로 세대수의 변화에 따른 탐색 결과를 평가하였다.

  • PDF

정보병목기법에 기반한 유전자 발현 데이터의 이중 클러스터링 (Double Clustering of Gene Expression Data Based on the Information Bottleneck Method)

  • 김병희;황규백;장정호;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.362-364
    • /
    • 2003
  • 기능 유전체학에서 클러스터링 기법은 고차원의 마이크로 어레이 데이터 분석을 위한 주된 도구 중의 하나이다. 본 논문에서는 정보병목(information bottleneck)기법 기반의 이중 클러스터링에 의한, 유전자 발현 데이터의 계층적 병합방식 클러스터링 기법을 제안한다. 정보병목기법은, 두 랜덤변수의 결합확률분포가 주어진 경우 두 변수의 상호 정보량을 최대한 보존하면서 한 변수를 압축하는 기법이며, 두 변수를 차례로 압축하는 것이 이중 클러스터링이다. 실제 마이크로 어레이 데이터인 NC160 데이터(암세포 내 유전자 발현 데이터)에 대한 실험에서, 먼저 유전자를 그 발현패턴에 따라 클러스터링 한 후 이를 이용하여 표본들을 클러스터링하고 그 성능을 다각도로 분석하였다. 상호 정보량과 유전자 및 표본 클러스터 수와 엔트로피 척도에 의한 성능을 검토해 본 결과, 표본이 추출 조직에 따라 구분 가능할 것이라는 가정을 검증할 수 있었으며, 적절한 클러스터의 수를 결정할 수 있는 임계점의 기준을 설정할 수 있었다.

  • PDF

암 분류를 목적으로 하는 기계 학습 분류기를 위한 효과적인 유전자 선택 방법 (The Method of Gene Selection for Machine Learning Classifiers In Career Classification)

  • 박형근;이수정;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.205-207
    • /
    • 2004
  • 유전자 발현 분석 시스템에 있어서 microarray 기술의 발전은 유전 질환 진단의 정확성과 신뢰도를 향상시키는 데에 큰 기여를 하였다. 다양한 microarray기술을 통해 얻은 대량의 유전자 발현 정보는 기계 학습분류기를 이용한 암의 분류와 진단, 예측 분야에도 효과적으로 이용될 수 있다. 이 과정에서 종류에 따른 암의 정확한 분류를 위해서는 되도록 해당 암 클래스와의 직접적인 연관이 있는 유전자만을 선택하여 활용하는 것이 효과적이다. 본 논문에서는 이러한 정보력 있는 유전자(informative gene)를 효과적으로 선택 할 수 있는 유전자 선택 방법을 제시하고, 이를 이용하여 세 가지 벤치마크 암 데이터에 대하여 체계적인 실험을 하였다. 그 결과 향상된 분류 성능을 확인할 수 있었다.

  • PDF

암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍 (Neural Network Pair with Negatively Correlated Genes for Cancer Classification)

  • 원홍희;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

마이크로어레이 데이터를 이용한 점증적 유전자 선택기반 암 분류 (Incremental Gene Selection-based Cancer Classification Using Microarray Data)

  • 권형태;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.7-10
    • /
    • 2007
  • 마이크로어레이 데이터는 매우 많은 수의 유전자로 구성되며, 암 분류 성능을 높이기 위해서는 대상 암과 관련된 유용한 유전자를 선택해야 한다. 기존 필터 기반 유전자 선택 기법은 유전자를 개별적으로 평가하여 암 분류에 사용하기 때문에, 유전자 사이의 관계나 분류기와의 상관성을 고려하지 않으며, 비슷한 특성의 유전자를 중복해서 선택하는 경향이 있다. 본 논문에서는 필터와 래퍼 방식을 결합하여 분류결과를 반복적으로 반영하며 유전자를 선택하는 기법을 제안한다. 필터 기법으로 유전자의 순위를 계산할 때 이전 분류에서 틀린 샘플의 가중치가 높도록 설계하고, 분류를 반복하면서 각 단계에서 유용한 유전자를 추가로 선택한다. 제안하는 방법을 대표적 암 분류 데이터인 림포마 암과 대장암 데이터에 적용하여 유용성을 검증하였다.

  • PDF

진화프로그래밍을 이용한 이상 유전자 분류 방법 제안 (Suggestion Method of Classific System of Abnormal Genetic using EP)

  • 김영지;배상현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.776-779
    • /
    • 2008
  • DNA 기술의 발달로 얻어진 대량의 유전자 정보를 손쉽게 이상 값을 가진 유전자의 정확한 분류와 진단을 할 수 있는 방법인 Microarray 기술에 대한 기대가 커지고 있다. 정확한 분류를 하기 위해서는 추출된 유전자에 들어 있는 많은 잡음 즉 이상 값을 가진 유전자만을 추출할 필요가 있다. 따라서 본 논문에서는 세 가지 dataset에 대해 기존 연구방법의 여러 가지 유전자 추출 방법을 조사하고 Matlab으로 구현한 진화프로그램을 이용하여 새로운 데이터의 분류방법과 모델링 방법을 제안한다.

  • PDF

Ortholog 데이터베이스를 이용한 생물 경로 재구축 시스템 (Pathway Reconstruction System using Orthlogs Database)

  • 정태성;오정수;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2005
  • 현재 국내외 적으로 많은 대사경로 재구축을 위한 소프트웨어들이 개발 보급되고 있다. 그러나 기존의 소프트웨어들은 유전자 서열의 주해 작업이 끝난 게놈에 대해서만 가능하다. 따라서 대사경로를 예측하고자 할 경우는 주해 작업이 선행되어야 하는 어려움이 있었다. 본 논문에서는 주해 작업이 완료되지 않은 유전자 서열로부터 유전자의 기능 예측뿐만 아니라 대사경로를 예측할 수 있는 시스템을 제안한다. 제안된 시스템은 Orthologous 데이터베이스를 활용하여 새롭게 밝혀진 유전자 서열을 대상으로 비교적 정확성이 높은 대사경로를 예측하는 기능을 제공한다. 이 방법을 통해 주해 작업이 완료되지 않은 유전자 서열을 이용하여 서열 내에 포함된 유전자의 기능을 예측할 뿐만 아니라 예측된 유전자 정보를 이용하여 대사 경로를 예측할 수 있다.

  • PDF

전진 선택법을 이용한 유전자 발현정보 기반의 암 분류 (Cancer Classification with Gene Expression Profiles using Forward Selection Method)

  • 유시호;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.293-296
    • /
    • 2003
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 microarray상에서 측정한 것으로 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에, 유전발현 데이터를 통하여 암을 분류할 수 있다. 하지만 분류에 모든 유전자가 관여하지는 않으므로 관련성 있는 유전자만을 선별해내는 작업인 특징 선택방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선택하고 분류하는 방법을 제안한다. 실험데이터는 대장암 데이트를 사용하였고, 분류기는 KNN을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택 방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징 선택방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다.

  • PDF

서지분석을 통한 노화 관련 유전자 정보 데이터베이스 구축 (Construction of the Aging Related Gene Database using Text-mining)

  • 유석종;박준호;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.41-42
    • /
    • 2013
  • 최근 노령화가 급속히 진행되면서 노화에 대한 연구가 활발히 진행되고 있다. 하지만 노화현상은 광범위한 표현형을 지니고 있는 생명현상으로 이에 대한 체계적인 연구를 지원하기 위한 웹포털 사이트가 필요한 실정이다. 특히 노화에 따른 질병과의 연관성 및 관련 유전자에 대한 정보를 수집하고 이를 체계적으로 분석할 수 있는 통합정보시스템은 향후 노화연구를 지원하기 위한 가장 핵심적인 요소라고 할 수 있다. 본 연구에서는 기존 노화와 관련된 461개의 유전자를 기반으로 관련된 질병과의 연관성을 OMIM 데이터베이스를 활용하여 분석하였다. 또한 관련 단백질의 기능을 GO데이터베이스 분석을 통해 유전자의 기능을 분석하였다. Pubmed에서 제공하는 노화관련 논문들의 MeSH 정보 분석을 통해서 노화와 관련된 용어를 분석하였다. 노화와 관련된 64개의 유전자를 키워드로 NCBI의 pubmed 데이터베이스로부터 관련논문을 다운로드 받아 생물학적 상호작용 정보를 추출했다. 생물학적 상호작용은 NCBI에서 제공하는 Metamap 데이터베이스를 기반으로 각각의 생물학적 용어를 정의했다. 현재 노화 유전자 64개에 대해 128,729개의 생물학적 상호작용 정보를 추출했고, 8대 노인성만성질환에 대해 301,176개의 생물학적 상호작용 정보를 추출하였다.

  • PDF