• 제목/요약/키워드: 기계학습마이크로어레이

검색결과 7건 처리시간 0.025초

마이크로어레이 기반 miRNA 모듈 분석을 위한 하이퍼망 분류 기법 (Hypernetwork Classifiers for Microarray-Based miRNA Module Analysis)

  • 김선;김수진;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.347-356
    • /
    • 2008
  • 마이크로어레이는 분자 생물학 실험에 있어 중요한 도구로 사용되고 있으며, 마이크로어레이 데이타 분석을 위한 다양한 계산학적 방법이 개발되어 왔다. 그러나, 기존 분석방법은 주어진 조건에 영향을 주는 개별 유전자를 추출하는 데 강한 방면, 유전자 간의 복합작용에 의한 영향을 분석하기 힘들다는 단점을 가지고 있다. 하이퍼망 모델은 생물학적인 네트워크 작용을 모방한 구조이며, 계산과정에서 요소간의 복합작용을 직접 고려하기 때문에 기존 방법에서 다루기 힘들었던 요소간 상호작용 분석이 가능하다는 장점을 가진다. 본 논문에서는 마이크로어레이 데이타를 기반으로 microRNA(miRNA) 프로파일 분석을 위한 하이퍼망 분류 기법을 소개한다. 하이퍼망 분류기는 miRNA 쌍을 기본 요소로 하여 진화 과정을 통해 miRNA 분류 데이타를 학습한다. 학습된 하이퍼망으로부터 유의하다.고 판단되는 miRNA 모듈을 쉽게 추출할 수 있으며, 사용자는 추출된 모듈의 유치미성을 직접 판단할 수 있다. 하이퍼망 분류기는 암 관련 miRNA 발현 데이타 분류 실험을 통해 91.46%의 정확도를 보임으로써 기존 기계학습 방법에 비해 뛰어난 성능을 보여주었으며, 하이퍼망 분석을 통해 생물학적으로 유의한 miRNA 모듈을 찾을 수 있음을 확인하였다.

기계학습 접근법에 기반한 유전자 선택 방법들에 대한 리뷰 (A review of gene selection methods based on machine learning approaches)

  • 이하정;김재직
    • 응용통계연구
    • /
    • 제35권5호
    • /
    • pp.667-684
    • /
    • 2022
  • 유전자 발현 데이터는 각 유전자에 대해 mRNA 양의 정도를 나타내고, 그러한 유전자 발현량에 대한 분석은 질병 발생에 대한 메커니즘을 이해하고 새로운 치료제와 치료 방법을 개발하는데 중요한 아이디어를 제공해오고 있다. 오늘날 DNA 마이크로어레이와 RNA-시퀀싱과 같은 고출력 기술은 수천 개의 유전자 발현량을 동시에 측정하는 것을 가능하게 하여 고차원성이라는 유전자 발현 데이터의 특징을 발생시켰다. 이러한 고차원성으로 인해 유전자 발현 데이터를 분석하기 위한 학습 모형들은 과적합 문제에 부딪히기 쉽고, 이를 해결하기 위해 차원 축소 또는 변수 선택 기술들이 사전 분석 단계로써 보통 사용된다. 특히, 사전 분석 단계에서 우리는 유전자 선택법을 이용하여 부적절하거나 중복된 유전자를 제거할 수 있고 중요한 유전자를 찾아낼 수도 있다. 현재까지 다양한 유전자 선택 방법들이 기계학습의 맥락에서 개발되어왔다. 본 논문에서는 기계학습 접근법을 사용하는 최근의 유전자 선택 방법들을 집중적으로 살펴보고자 한다. 또한, 현재까지 개발된 유전자 선택 방법들의 근본적인 문제점과 앞으로의 연구 방향에 대해 논의하고자 한다.

기계학습에 의한 압타머칩 데이터 기반 심혈관 질환 단계의 예측 (Estimation of the steps of cardiovascular disease by machine learning based on aptamers-based biochip data)

  • 김병희;김성천;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.85-87
    • /
    • 2006
  • 압타머칩은 (주)제노프라에서 개발한 새로운 개념의 바이오칩으로서, 압타머(aptamer)를 이용하여 혈액중의 특정 단백질군의 상대적인 양의 변화를 측정할 수 있으며, 질병 진단에 바로 응용할 수 있는 도구이다. 본 논문에서는 압타머칩 데이터 분석을 통해 심혈관 질환 환자의 질병 진행 단계를 예측할 수 있음을 보인다. 정상, 안정/불안정성 협심증, 심근경색의 네 단계로 표지된 환자의 혈액 샘플로부터 제작한 (주)제노프라의 3K 압타머칩 데이터를, 일반 DNA 마이크로어레이 분석과 동일한 과정을 거쳐 분류한 결과, 각 단계별 환자샘플이 확연히 구분되는 것을 확인하였다. 분산분석 결과 P-Value를 이용하여 자질 선택을 수행하고, 분류 알고리즘으로는 신경망, 결정트리, SVM, 베이지안망을 적용한 결과. 각 알고리즘별로 50대 남성환자 31개의 샘플에 대하여 $77{\sim}100%$의 정확도로 심혈관 질환의 단계를 구분해내었다.

  • PDF

종양 분류를 위한 특징 추출 및 분류 기법 (Feature Selection and Classification Methods for Tumor Classification)

  • 박윤정;이민수;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.799-801
    • /
    • 2005
  • 현재 마이크로어레이 기술은 대량의 유전자 발현 데이터 특히 종양과 관련한 데이터들을 쏟아내고 있다. 이 데이터를 기반으로 종양의 종류에 따른 유전자들의 차별적 발현 양상을 분석하고 발현량의 변화가 두드러지는 유전자들에 기반하여 종양을 분별할 수 있는 분류 모델을 구축한 후, 이것을 종양을 진단하거나 예측하는데 이용할 수 있다. 대부분의 종양은 생성 매커니즘에 따라 세부 부류로 나눌 수 있고 세부 부류에 따라 치료 방법이나 예후가 달라지므로, 정확하게 종양의 세부 부류를 진단하는 것이 매우 중요하다. 본 논문에서는 종양의 종류에 따라 발현량이 민감하게 변화하는 유전자들을 뽑아내기 위한 특징 추출 방법들과 추출된 특징들에 기반해서 종양의 종류를 분별할 수 있는 기계학습 알고리즘들의 조합들의 성능을 비교분석 하였다.

  • PDF

압타머 단백질 바이오칩을 이용한 간암 진단 생체 정보 예측 시스템 개발 (The Developement of Liver cancer Vital Sign Information Prediction System using Aptamer Protein Biochip)

  • 김광준;이형근
    • 한국전자통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.965-971
    • /
    • 2011
  • 우리나라 암 발생빈도 중 간암은 위암에 이어 두 번째로 흔한 암으로서 조기에 발견될 경우는 치료성적이 우수하여 조기 발견이 대단히 중요시된다. 본 시스템은 간암의 조기발견을 위한 생체 정보 예측 시스템으로, 간암으로 확진된 환자 와 간암이외의 대조군의 혈청을 바이오칩에 반응시켜 압타머 단백질 바이오칩 프로파일을 기계학습을 통해 분류하는 시스템이다. 본 논문에서는 총 85샘플로 구성된 간암 확진환자와 310샘플로 구성된 간암이외의 대조군의 혈액시료를 1149의 서로 다른 올리고로 구성된 압타머 단백질 바이오칩에 반응시켜 획득한 데이터를 인공신경망을 통해 분석한 결과 95.38~97.95%의 분류 성능을 보였다.

조건(암, 정상)에 따라 특이적 관계를 나타내는 유전자 쌍으로 구성된 유전자 모듈을 이용한 독립샘플의 클래스예측 (Class prediction of an independent sample using a set of gene modules consisting of gene-pairs which were condition(Tumor, Normal) specific)

  • 정현이;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.197-207
    • /
    • 2010
  • 대용량(High-throughput) 형태로 얻어진 cDNA 마이크로어레이 데이터에 다양한 데이터 마이닝 기법을 적용하면 서로 다른 조직에서 추출한 유전자의 발현정도를 비교할 수 있고 정상세포와 암세포에서 발현량의 차이를 보이는 DEG(Differently Expression Gene) 유전자를 추출할 수 있다. 이들을 이용하여 병을 진단할 수 있을 뿐만 아니라, 암의 진행 단계(Cancer Stage)에 따른 치료 방법을 결정할 수 있다. 마이크로어레이를 기반으로 한 대부분의 암 분류자는 기계학습 기법을 이용하여 암 관련 유전자를 추출하여, 이들 유전자를 총체적으로 이용하여 독립 샘플의 클래스(암, 정상)를 판정한다. 하지만 유전자의 발현량의 차이뿐만 아니라 유전자와 유전자의 상관관계의 변화가 질병 진단에 활용될 수 있다. 대부분의 질병은 단독 유전자의 변이에 의한 것이 아니라 유전자의 모듈로 이루어진 유전자조절네트워크의 변이에 의한 것이기 때문이다. 본 논문에서는 조건에 따라 특이적 관계를 나타내는 유전자 쌍을 식별하여, 이들 유전자 쌍을 이용한 유전자 분류 모듈을 생성한다. 분류 모듈을 이용한 암 분류 방법이 기존의 암 분류 방법보다 높은 정확도로 암과정상 샘플을 분류함을 보여주고 있다. 분류 모듈을 구성하는 유전자의 수가 상대적으로 적으므로 임상키트로의 개발도 고려할 수 있다. 향후 분류 모듈에 속하는 유전자의 기능적 검증을, GO(Gene Ontology)를 활용함으로서, 밝혀지지 않은 새로운 암 관련 유전자를 식별하고, 분류 모듈을 확대하여 암 특이적 유전자조절네트워크 구성에 활용할 계획이다.

바이오칩을 이용한 간암진단 예측 시스템 (Liver cancer Prediction System using Biochip)

  • 이형근;김충원;이준;김성천
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.967-970
    • /
    • 2008
  • 우리나라 암 발생빈도 중 간암은 위암에 이어 두 번째로 흔한 암으로, 초기에는 특이 증상이나 증후 없이 서서히 진행되는 경우가 많아 증상이 생긴 후 간암으로 진단될 경우, 대부분 마땅한 치료방법이 별로 없어 어떠한 치료를 해도 환자의 예후는 불량하나, 조기에 발견될 경우는 치료성적이 우수하여 조기 발견이 대단히 중요시된다. 본 시스템은 간암의 조기발견을 위한 시스템으로, 간암으로 확진된 환자와 간암이외의 대조군의 혈액을 바이오침에 반응시켜 바이오칩 프로파일을 기계학습을 통해 분류하는 시스템이다. 본 논문에서는 총 50샘플로 구성된 간암환자 와 100샘플로 구성된 간암 이외의 대조군의 혈액시료를 1149의 서로 다른 올리고로 구성된 바이오칩에 반응시켜 획득한 데이터를 인공신경 망을 통해 분석한 결과 $92{\sim}96%$의 분류 성능을 보였다.

  • PDF