• Title/Summary/Keyword: 유전자정보

Search Result 1,508, Processing Time 0.045 seconds

Gene sequence analysis and management system for supporting functional genomics (기능 유전체학을 지원하는 유전자 서열 분석 및 관리시스템)

  • Heo, Jin-Seok;Kim, Hyun-Sik;Jin, Hoon;Kim, In-Cheol
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.480-488
    • /
    • 2002
  • 본 논문에서는 하나의 시스템 안에서 효율적인 유전자 데이터의 관리와 다양한 서열 분석작업이 가능한 기능 유전체학을 지원하는 서열 분석 및 관리 시스템인 GWB(Gene WorkBench)를 설계하고 구현하였다. GWB는 로컬 데이터베이스 관리뿐만 아니라 GenBank, EMBL, SWISSPROT와 같은 외부 공공 데이터베이스에 대한 접근 기능도 제공하며, 권한을 가진 내부 이용자와 그렇지 못한 외부 이용자들을 구분하여 일부 유용한 기능들은 외부 사용자들도 이용할 수 있도록 설계되었다. 또 GWB는 유전자에 관한 문헌정보 검색과 관련 유전자 탐색 기능 등 일부 유전자 기능 연구를 지원하는 기능을 제공하고 있다.

  • PDF

Classification of Lymphoma Dataset with Combinatorially Correlated Feature Set (통합 상관된 특징 집합을 이용한 림프종 데이터의 분류)

  • Park, Chan-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.321-324
    • /
    • 2003
  • 근래, DNA microarray와 관련된 기술의 발달은 한번에 수천 개 이상의 유전자발현데이터를 얻을 수 있게 해주었고, 많은 연구기관에서 이를 이용한 질병 분류에 관하여 연구를 진행하고 있다. 하지만 수천 개의 유전자 모두가 암에 관계된 것은 아니기 때문에, 관련 유전자의 선별 작업을 먼저 수행하는 것이 필요하며, 이를 위하여 통계기반 방법, 정보이론기반 방법 등 다양한 방법이 사용되고 있다. 본 논문에서는 의미 있는 유전자를 선택하는 방법으로서, 일반적인 순위-기반 방법이 양의 상관관계만 이용한다는 점을 보완하여, 유전자와 학습데이터 사이의 음의 상관관계까지도 고려한 방법을 제시하였다. 제안한 방법의 성능을 검증하고자 잘 알려진 암 관련 유전자발현데이터이인 림프종 데이터에 대하여, MLP와 KNN을 이용한 분류를 해 보았다. 실험 걸과 총합 상관관계를 가지는 특징 집합이 일반적인 순위-기반 방식의 특징 집합에 비하여 높은 분류 인식률을 보여주었다.

  • PDF

Identification for Gene Regulatory Motifs by Kernel CCA (Kernel CCA를 이용한 유전자 발현 조절 기능 모티프 추출)

  • Rhee Je-Keun;Joung Je-Gun;Chang Jeong-Ho;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.274-276
    • /
    • 2005
  • 유전자 발현은 많은 전자조절인자에 의해서 조절된다. 이러한 조절인자들은 각각 DNA 상에 존재하는 특정한 모티프에 결합하여 그 기능을 수행한다. 따라서 DNA 상의 특정한 서열 정보가 유전자 발현과 직접적으로 연관되어 있다고 생각할 수 있다. 본 논문에서는 두 가지 서로 다른 데이터들에 대한 관계를 알아보기 위하여 사용되는 방법인 Kernel CCA를 이용하여 DNA 상의 특정한 모티프와 유전자 발현 사이의 관계를 알아보았다. 이를 이용한 실험 결과, 유전자 발현과 밀접하게 관련되어 있는 모티프들을 발견할 수 있었고, 기존에 중요한 것으로 알려져 있는 모티프가 실제로도 유전자 발현에 밀접한 영향을 미친다는 것을 알 수 있었다.

  • PDF

The gene prediction method considering stages of cancer, obtained by integrating gene expression, genetic interaction data and document (문헌정보와 유전자 발현 및 상호 작용 데이터를 통합, 암의 단계를 고려한 질병 유전자 예측 방법)

  • Kim, Jungrim;Yeu, Yunku;Park, Sanghyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1113-1116
    • /
    • 2013
  • 유전체에 대한 관심이 크게 증가하면서, 이에 따른 다양한 연구가 이루어졌다. 그 결과 유전체와 관련된 다양한 종류의 데이터가 얻어졌으며, 그것을 해석하고 다른 데이터와 통합하는 것이 중요한 연구과제 중 하나가 되었다. 본 논문은 유전자 상호작용(genetic interaction) 데이터, 유전자 발현 데이터, 문헌으로부터 텍스트마이닝 기술을 통해 얻은 이종(heterogeneous) 데이터를 통합하여 암과 관련이 있는 유전자를 찾는 실험을 수행하였다. 또한, 단순히 질병(disease)-정상(normal)의 대조가 아니라 암의 단계(stage)를 고려한 실험을 수행하였다. 데이터를 통합하지 않거나 암의 단계를 고려하지 않았을 경우에 비하여 제안하는 방법이 더 높은 유전자 예측 성능을 나타냈다.

An analysis of microarray gene expression using FST (FST를 이용한 마이크로어레이 유전자발현에 관한 해석)

  • Choe, Gyeong-Ok;Jeong, Hwan-Muk
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.77-80
    • /
    • 2007
  • 현재 생명공학은 급속도로 발전하고 있으며, 이를 통해 만들어지는 생물정보의 양은 기하급수적으로 늘어나고 있다. 이러한 것을 가능하게 하는 기술 중의 하나인 마이크로어레이 기법은 현재 질병의 진단 및 신약 개발 등을 위해 사용되고 있다. 마이크로어레이 유전자 발현에 관한 분석은 크게 유의한 유전자 추출, 클러스터링, 분류 및 유전자 네트워크 구축 등으로 볼 수 있다. 유의한 유전자 식별을 위한 통계학적 방법으로 T-test 및 Wilcoxon Rank Sum test 등이 있다. 최근에는 수정인자를 추가하거나 혹은 퍼지이론 등의 지능정보 이론을 추가하여 그 계산결과를 좀 더 상세화하고 세분화하는 연구들이 계속되고 있다. 본 논문에서는 두 개의 그룹에서 발현된 유전자들 중 유의하게 발현되는 유전자를 식별하기 위한 방법으로 퍼지이론을 도입하여 유의한 유전자를 규명하는 FST(Fuzzy Significance Test) 방법을 제안한다.

  • PDF

Searching for the regulated gene groups through temporal profiling of microarray expressions based on the latent variable learning model (은닉변수학습 모형에 기반한 시간적 프로파일을 이용한 조절 유전자군의 탐색)

  • Yang Jin-San;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.40-42
    • /
    • 2006
  • 유전자 발현에 있어서의 조절작용은 유전자간의 복합적인 상호작용의 결과에 기인한다. 따라서 이러한 현상으로부터 기능적으로 연관된 유전자 군을 식별하기 위해서는 단일 유전자보다는 복수의 유전자군의 발현패턴을 대상으로 하게 된다. 이 경우 발현패턴의 시간에 따른 다양하고 복잡한 특징들은 은닉변수학습 모형을 이용하므로서 보다 명확하게 표현될 수 있고, 유사한 기능을 가진 유전자 군을 탐색 하는데에 효과적으로 이용될 수 있다. 본 논문에서 제시된 은닉변수학습 모형은 이스트 Cell Cycle 데이터에 적용한 결과 특정 조절유전자에 대하여 생물학적으로 연관된 유전자 군을 찾는 데에 다른 방법과 비교하여 효과적임을 보일 수 있었다.

  • PDF

Feature Extraction Method for Gene Expression Data using Bayesian Neural Network (베이지안 신경망을 이용한 유전자 발현 데이터에서의 피처 추출 기법)

  • 이상근;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.235-237
    • /
    • 2004
  • Microarray 로 표현되는 유전자 발현 데이터는 일반적으로 샘플(sample) 수에 비해 많은 수의 유전자를 포함한다. 피처 추출은 이러한 데이터에 기계학습 방법론을 효과적으로 적용하기 위한 방법 중 하나로, 학습성능을 향상시키고 계산 시간을 줄일 수 있을 뿐만 아니라 중요한 피처들을 발견할 수 있다는 점에서 큰 의미를 갖는다. 본 연구에서는 베이지안 신경망(Bayesian Neural Network)에 기반 한 자동유효성탐지(Automatic Relevance Detection, ARD) 기법을 사용하여 유전자 발현 데이터에서 학습 오류를 줄이는 동시에 학습에 필요한 최소한의 유전자 집합을 추출할 수 있는 방법을 제시했다. CAMDA 2003에서 제시된 폐종양 환자의 유전자 발현 데이터에 대해 실험한 결과, 12600 개의 유전자 중에서 가장 중요하다고 여겨지는 187 개의 유전자를 발견했으며, 높은 학습성능을 달성했다.

  • PDF

MicroRNA Target Prediction using a Support Vector Machine and Position based Features (SVM과 위치 기반의 자질을 이용한 MicroRNA 목표 유전자 예측)

  • Kim Sung-Kyu;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.286-288
    • /
    • 2005
  • MicroRNA (miRNA)는 작은 크기의 RNA분자로서 동식물의 유전자 발현 과점을 직접적으로 조절하는 인자로 알려져 있다. MiRNA는 보통 목표 유전자의 3'-UTR 영역에 상보성을 갖고 결합함으로써 작용하며 특히 miRNA의 5'부분의 8 nt 정도가 seed로서 중요하다고 알려져 있다. 반면 최근의 연구에 따르면 seed 부분의 서열의 조성 및 양상이 변화함에 따라 특이도가 결정됨을 알 수 있지만 기존의 컴퓨터를 이용한 miRNA 목표 유전자 예측 방법들은 이러한 정보를 활용하지 못한다. 본 논문에서는 열역학적인 수치와 서열의 조성뿐 아니라 miRNA:mRNA pair의 위치에 기반한 정보들을 학습에 자질로서 포함하여 목표 유전자를 예측한다. 그 결과는 위치 기반 자질이 학습 성능 향상에 중요하게 기여함을 보여준다.

  • PDF

The implementation of PSO clustering Algorithm for Embedded Systems (임베디드 시스템을 위한 PSO 기반의 군집화 알고리즘의 구현)

  • Meang, Boyeon;Choi, Ok-ju;Lee, Minsoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.290-293
    • /
    • 2009
  • 바이오 칩 분석 시스템은 유전자와 실험의 두 축으로 이루어진 바이오 칩에서 자료를 추출하고 필요한 정보를 얻기 위해 데이터를 분석하는 시스템이다. 유전자 데이터를 효율적으로 분석할 수 있는 방법으로 바이오 칩 분석 시스템이 각광받으면서 데이터의 양과 종류가 방대해지고 메모리의 효율적인 사용과 이에 따른 속도 개선을 위해 임베디드 시스템이 필요해지고 있다. 이에 따라 본 연구에서는 임베디드 시스템을 위한 PSO 기반의 군집화 알고리즘을 구현하였다. 방대한 양의 유전자 데이터를 분석하기 위해 생태계 모방 알고리즘인 Particle Swarm Optimization 알고리즘과 비슷한 유전자의 분류를 위한 기법으로 군집화를 사용하여 유전자 데이터의 통합 분석 시스템을 구현, 사용자에게 더욱 효율적으로 정보를 제공한다. 본 논문에서는 방대한 양의 데이터의 최적화에 효율적인 생태계 모방 알고리즘 Particle Swarm Optimization 을 이용하여 데이터들을 군집화하는 알고리즘을 임베디드 시스템을 위해 구현한 방법을 기술하고 있다.

Informatics Network Representation Using Probabilistic Graphical Models of Network Genetics (유전자 네트워크에서 확률적 그래프 모델을 이용한 정보 네트워크 추론)

  • Ra Sang-Dong;Park Dong-Suk;Youn Young-Ji
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.10 no.8
    • /
    • pp.1386-1392
    • /
    • 2006
  • This study is a numerical representative modelling analysis for applying the process that unravels networks between cells in genetics to WWW of informatics. Using the probabilistic graphical model, the insight from the data describing biological networks is used for making a probabilistic function. Rather than a complex network of cells, we reconstruct a simple lower-stage model and show a genetic representation level from the genetic based network logic. We made probabilistic graphical models from genetic data and extends them to genetic representation data in the method of network modelling in informatics.