• Title/Summary/Keyword: 유전자 데이터

Search Result 660, Processing Time 0.049 seconds

Screening and Clustering for Time-course Yeast Microarray Gene Expression Data using Gaussian Process Regression (효모 마이크로어레이 유전자 발현데이터에 대한 가우시안 과정 회귀를 이용한 유전자 선별 및 군집화)

  • Kim, Jaehee;Kim, Taehoun
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.3
    • /
    • pp.389-399
    • /
    • 2013
  • This article introduces Gaussian process regression and shows its application with time-course microarray gene expression data. Gene screening for yeast cell cycle microarray expression data is accomplished with a ratio of log marginal likelihood that uses Gaussian process regression with a squared exponential covariance kernel function. Gaussian process regression fitting with each gene is done and shown with the nine top ranking genes. With the screened data the Gaussian model-based clustering is done and its silhouette values are calculated for cluster validity.

Bayesian Validation Method based on Fuzzy c-Means Algorithm for Analysis of Optimal Gene Clustering (최적의 유전자 클러스터 분석을 위한 퍼지 c-Means 알고리즘 기반의 베이지안 검증 방법)

  • 유시호;원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.736-738
    • /
    • 2003
  • 수천 개의 유전자 발현 정보를 가지고 있는 DNA 마이크로어레이 기술의 발달로 대량의 생물정보를 빠른 시간 내에 분석하는 것이 가능하게 되었다. 유전자를 분석하는 방법 중 하나인 클러스터링 방법은 비슷한 기능을 가진 유전자들을 집단화시켜서 집단내의 유전자들의 기능을 밝히거나, 미지의 유전자를 분석하는데 이용되고 있다. 본 논문에서는 유전자 데이터를 분석하기 위한 퍼지 클러스터링 방법과 이를 효과적으로 검증할 수 있는 베이지안 검증 방법을 제안한다. 퍼지 c-means 알고리즘을 사용하여 클러스터를 생성하고, 클러스터 결과를 기존의 퍼지 클러스터 검증 방법들과 본 논문에서 제안하는 베이지안 검증 방법을 사용하여 비교 평가한다. 베이지안 검증 방법은 각 유전자의 클러스터 멤버쉽을 확률로 이용하여 각 클러스터에 속할 확률을 계산하고, 이 값을 가장 크게 해주는 클러스터 집단을 선택한다. 이 방법은 기존의 퍼지 클러스터 검증 방법들과는 달리 클러스터 수에 무관한 평가가 가능한 장점을 가지고 있다. Serum과 Yeast 데이터에 대한 실험 결과, 베이지안 검증 방법의 유용성을 확인할 수 있었다.

  • PDF

Seed를 이용한 마이크로어레이 데이터 클러스터링과 유전자 온틀로지를 이용한 클러스터의 해석

  • 강은미;신미영;정호열;박선희;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.244-246
    • /
    • 2004
  • 마이크로어레이 칩 실험을 통하여 대량으로 생산되는 유전자 발현 데이터는 여러 가지 클러스터링 방법을 적용하여 분석할 수 있으며, 생성된 클러스터들 또한 여러 가지 방법으로 해석 할 수 있다. 본 논문에서는 기존의 클러스터링 방법들을 응용한 seed클러스터링 방법을 제안하고 생물학적 온톨로지인 Gene Ontology를 기반으로 클러스터를 해석한다. 본 논문에서는 효과적인 유전자 발현 데이터 클러스터링 방법과 생물학적 지식을 바탕으로 클러스터를 해석, 평가하는 방법을 보여 준다.

  • PDF

Clustering and Leaf Ordering for Gene Expression Profiles (유전자 발현 데이터에 대한 클러스터링과 리프오더링 연구)

  • 여상수;이정원;김성권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.736-738
    • /
    • 2002
  • 계층적 클러스터링(hierarchical clustering)은 유전자 발현 데이터를 분석할 때 일반적으로 사용하는 방법이다. 계층적 클러스터링의 결과물은 유전자 발현 데이터의 덴드로그램이다. 이 덴드로그램에서 인접한 리프 노드들간의 유사도는 높아지게 하고 멀리 떨어진 노드들간의 유사도는 낮아지게 하기 위해서, 리프 노드들을 재배열하는 과정을 리프오더링이라고 한다. 본 논문에서는 전체 리프 노드들을 대상으로 하는 리프오더링 알고리즘들을 변형하여 각 클러스터별로 리프오더링을 하는 접근방식을 제안하고, 기존의 리프오더링 알고리즘을 사용했을 때의 결과와 제안하는 접근방식을 사용했을 때의 결과를 비교 분석하였다.

  • PDF

Program Development of Integrated Expression Profile Analysis System for DNA Chip Data Analysis (DNA칩 데이터 분석을 위한 유전자발연 통합분석 프로그램의 개발)

  • 양영렬;허철구
    • KSBB Journal
    • /
    • v.16 no.4
    • /
    • pp.381-388
    • /
    • 2001
  • A program for integrated gene expression profile analysis such as hierarchical clustering, K-means, fuzzy c-means, self-organizing map(SOM), principal component analysis(PCA), and singular value decomposition(SVD) was made for DNA chip data anlysis by using Matlab. It also contained the normalization method of gene expression input data. The integrated data anlysis program could be effectively used in DNA chip data analysis and help researchers to get more comprehensive analysis view on gene expression data of their own.

  • PDF

Human-Genetic Algorithm Interaction for Emotional Image Retrieval (감성적 영상검색을 위한 인간과 유전자 알고리즘의 상호작용)

  • 이주영;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.225-227
    • /
    • 1998
  • 내용기반 영상검색 방법은 영상 데이터 베이스 검색 분야에서 최근 활발히 연구되고 있는데, 기존의 키워드기반 검색방법에 비해 보다 효율적인 데이터의 관리와 검색 방법을 제공한다. 그러나 데이터의 양이 증가하고 널리 이용됨에 따라 검색 과정에 사용자의 직관과 선호도를 반영한다면 보다 사용자의만족도가 높은 검색결과를 제공할 수 있을 것이다. 이러한 검색 시스템을 개발하기 위하여 이제까지 대화형 유전자 알고리즘을 이용한 감성기반 영상 검색 방법을 개발하여 왔다. 이것은 목적함수가 명시적으로 정의될 수 없는 경우 사용자의 판단을 적합도 함수로 사용하는 유전자 알고리즘이라 할 수 있다. 이 방법은 구체적으로 표현될 수 있는 영상 뿐 아니라 추상적인 감성을 이용하여 영상을 검색할 수 있도록 한다. 본 논문에서는 2000개의 영상 데이터를 대상으로 주관적 실험을 하여 그 유용성을 입증하고자 한다. 이 실험에 대한 통계적 분석 결과 감성적 영상 검색을 위한 유전자 알고리즘의 적용이 유용하다는 것을 알 수 있다.

  • PDF

데이터 마이닝을 이용한 인터넷 쇼핑몰 상품추천시스템

  • Kim, Gyeong-Jae;Kim, Byeong-Guk
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.05a
    • /
    • pp.258-265
    • /
    • 2005
  • 전자상거래의 확산에 따라 인터넷 쇼핑몰에서의 구매활동은 일반적인 현상이 되었다. 그 결과, 유사한 업종이나 업태의 인터넷 쇼핑몰이 범람하게 되었고 업체들 간의 경쟁도 심화되어 차별화된 서비스를 제공하지 않는 업체는 도태되기 쉬운 상황이다. 본 연구에서는 치열한 경쟁환경 하에서 인터넷 쇼핑몰의 차별화된 마케팅 서비스의 수단으로써 이용되고 있는 상품추천시스템의 개선된 모형을 제시하고자 한다. 본 연구에서 제안하는 모형은 전역 최적화 기법 중의 하나인 유전자 알고리즘을 데이터 마이닝의 도구로 활용한 인터넷 쇼핑몰에서의 개인화된 상품추천시스템 모형이다. 유전자 알고리즘은 추출하기가 어려운 소비자의 성향을 데이터를 통해 추출하고 이에 맞는 상품군을 선택할 수 있도록 해주는 최적화 기법으로 상품추천시스템의 추천엔진으로써 유용할 것으로 기대된다. 본 연구에서는 제안한 유전자 알고리즘에 기반한 추천 규칙들이 장착된 웹 기반의 개인화된 상품추천시스템의 프로토타입을 개발하고 이에 대한 실제 사용자들의 이용 만족도를 확인함으로써 본 연구에서 제안한 방법론의 유용성을 확인하고자 한다.

  • PDF

GELIM: An Integrated System with Genetic Network Analyzer and LIMS (GELIM: 유전자 네트워크 분석과 데이터 관리를 위한 통합 시스템)

  • Kim, Hye-Jung;Cho, Hwan-Gue;Park, Seon-Hee;Shin, Mi-Young;Jung, Ho-Youl;Lee, Kyung-Shin
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2004.11a
    • /
    • pp.286-295
    • /
    • 2004
  • 생물학적으로 의미 있는 결과를 도출하기 위해서는 많은 실험 데이터가 필요하다. 최근에는 마이크로 어레이 실험 기술이 발달함에 따라 대량의 데이터를 얻을 수 있게 되었고, 이로 인해서 데이터를 체계적으로 관리하고 필요한 정보를 습득할 수 있는 시스템이 필요하게 되었다. LIMS(Laboratory Information Management System) 는 이러한 요구 조건을 충족시키기 위한 시스템으로 기존의 파일 시스템에 의존해서 비효율적으로 실험 데이터를 관리해 오던 것을 체계적이고 효율적으로 관리해 주기 위한 시스템이다. 대량의 유전자 발현 데이터의 생산은 유전자의 조절 네트워크 예측을 가능하게 하였다. 유전자간의 상호 작용을 분석하는 것은 세포의 활동을 이해하는데 매우 중요한 요소라고 할 수 있다. 본 논문에서는 기존의 LIMS 기능과 유전자 조절 네트워크 분석 시스템을 통합하여 사용자가 쉽게 데이터를 공유 및 습득할 수 있으며 편리한 사용자 인터페이스를 이용하여 컴퓨터에 익숙하지 않은 실험들도 쉽게 사용할 수 있는 GELIM(an Integrated system with GEnetic network analyzer and LIMs) 을 소개한다.

  • PDF

Fuzzy Clustering Algorithm to Predict Cancer Class Using Gene Expression Data (유전자 발현 데이터를 이용한 암의 클래스 예측을 위한 퍼지 클러스터링 알고리즘)

  • 원홍희;유시호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.757-759
    • /
    • 2003
  • 암의 치료법은 같은 종류의 암이라 해도 그 하부 클래스에 따라 매우 다르기 때문에 암의 클래스를 예측하는 것은 그 정확한 치료를 위하여 매우 중요하다. 유전자 발현 데이터를 이용한 암의 분류에 있어 기존의 연구들은 각 데이터를 하나의 클러스터에 소속시키는 하드 분할(hard partition)에 의한 분할 방식을 사용하는 하드 클러스터링을 사용하였다. 하지만 일반적으로 유전자 발현 암 데이터와 같은 실세계의 데이터는 쉽게 나뉘어지기 힘들거나 클러스터 간의 경계가 분명하지 않기 때문에 하드 클러스터링 기법은 주어진 데이터의 성질을 손실시킬 수 있는데 반해, 퍼지 클러스터링 기법은 각 데이터가 소속 정도에 따라 여러 개의 클러스터에 속할 수 있도록 분할하기 때문에 이러한 손실을 최소화할 수 있다. 따라서 본 논문에서는 퍼지 클러스터링의 대표적인 방법인 fuzzy c-means 클러스터링을 적용하여 암의 클래스를 예측하고, 다양한 하드 클러스터링 방법과 비교함으로써 퍼지 클러스터링의 성능을 검증하였다.

  • PDF

Genetics-Based Machine Learning for Generating Classification Rule in Data Mining (데이터 마이닝의 분류 규칙 발견을 위한 유전자알고리즘 학습방법)

  • 김대희;박상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.429-434
    • /
    • 2001
  • 데이터(data)치 홍수와 정보의 빈곤이라는 환경에 처한 지금, 정보기술을 이용하여 데이터를 여과하고, 분석하며, 결과를 해석하는 자동화 된 데이터 분석 방안에 높은 관심을 가지게 되었으며, 데이터 마이닝(Data Mining))은 이러한 요구를 충족시키는 정보기술의 활용방법이다. 특히 데이터 마이닝(Data Mining)의 분류(Classification) 방법은 중요한 분야가 되고 있다. 분류 작업의 핵심은 어떻게 적당한 결정규칙(decision rule)을 정의하느냐에 달려 있는데 이를 위해 학습능력을 가지고 있는 알고리즘이 필요하다. 본 논문에서는 유전자 알고리즘(Genetic Algorithm)을 기반으로 하는 강건한 학습방법을 제시했으며, 이러한 학습을 통해 데이터 마이닝(Data Mining)의 분류시스템을 제안하였다.

  • PDF