• 제목/요약/키워드: 유전자 예측

검색결과 503건 처리시간 0.027초

생물학적 시스템에서 확률적 연결 모델 추론 (Probabilistic Connection Models Representation of Systems Genetic)

  • 박동석;송선희;나하선;김문환;배철수;나상동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.566-570
    • /
    • 2005
  • 생물학적 유전자 배열에서 다양한 레벨로 분자 세포 간 네트워크를 입증하여 고 처리를 응용하여 수치학적인 표현 모델 분석으로 정보공학 네트워크를 연구한다. 확률적 그래프 모델을 사용하여 네트워크의 계층적 구성 특성을 이용하여 생물학적 통찰력을 확률함수를 응용해 복잡한 세포 간 네트워크에 대한 고 대역 처리 데이터의 근원인 DNA 마이크로 배열을 응용하여 유전자 베이스네트워크 논리를 유전자 표현 레벨로 나타낸다. 유전자 데이터로부터 확률적 그래프 모델들을 추정 및 분석하고 논리적으로 예측하여 확률적 그래프 모델이 정보공학 네트워크로 확장 추론 한다.

  • PDF

Aspect model 기반의 차원 축소를 이용한 유전자 발현데이터 분석 (Gene Expression Pattern Analysis Using Aspect Model-based Dimensionality Reduction)

  • 장정호;엄재홍;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.247-249
    • /
    • 2004
  • 본 논문에서는 aspect model을 이용한 차원 축소 기반의 유전자 발현 데이터 분석을 제시한다. Aspect model은 은닉변수모델의 하나로서, 이를 이용하여 유전자 발현 데이터에 대한 확률적 학습 과정을 통해 특징적 발현 패턴을 추출할 수 있다. 또한 모델로부터 커널함수를 유도함으로써 발현패턴에 기반한 유전자간의 유사도를 자연스럽게 측정할 수 있다. 모델에 의해 정의되는 은닉공간 차원 수는 데이터 permutation 기반의 검증을 통해 결정한다. 효모 (yeast)의 세포 주기(cell cycle) 관련 발현데이터네 대한 실험에서, 주기별 특징 발현 패턴을 추출할 수 있었다. 또한 aspect model로부터 유도된 커널 기반의 유사도 척도를 이용함으로써, 동일 기능 또는 동일 complex 범주에 속하는 유전자 쌍 예측에서 기본적인 상관계수에 의한 방법에 비해 보다 향상된 성능을 얻을 수 있었다.

  • PDF

점진적 주성분 분석을 이용한 시계열 유전자 발현 데이터의 효율적인 차원 축소 (Dimension Reduction in Time-series Gene Expression Data using incremental PCA)

  • 김선희;김만선;양형정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.733-736
    • /
    • 2007
  • 최근 생명 공학 기술의 발달로 마이크로 단위의 실험이 가능해지고 하나의 칩상에 수 만개의 유전자들의 발현 양상을 보다 쉽게 관찰할 수 있게 되었다. DNA 칩 기술에 의해 얻어지는 마이크로어레이(microarray) 데이터는 세포나 조직 내의 유전자 발현도(expression level)를 측정한 것으로 질병 진단이나 유전자 기능 예측 등에 이용되고 있다. 본 논문에서는 대량의 시계열 마이크로어레이 데이터 분석을 위해 효율적으로 데이터의 차원을 판단하는 점진적 주성분 분석을 이용하여 데이터의 차원을 축소 한다. 제안된 방법은 실제 시계열 마이크로어레이 데이터인 yeast cell cycle 데이터에 적용되었고, 데이터 차원 축소에 대한 효율성을 검증하기 위해 클러스터링을 수행하였다. 그 결과 데이터를 축소하여 클러스터링을 수행한 경우 학습 성능이 향상 된 결과를 보였다.

Application of DNA microarry : Comparative functional genomic approach

  • 추인선
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2006년도 Principles and Practice of Microarray for Biomedical Researchers
    • /
    • pp.109-114
    • /
    • 2006
  • 최근 Human 지놈 프로젝트를 포함한 다양한 종의 지놈 프로젝트가 수행되고 수많은 지놈정보가 생산되고 있으며 이를 해석하고 서로 연관성를 찾기 위한 다양한 연구가 진행되고 있다. 즉 최신 생명공학과 관련된 연구방향이 DNA의 구조적 해석에서 기능 해석과 유전자들의 상호연관성을 규명하는 방향으로 변화하고 있으며 이를 위한 강력한 도구로서 DNA microarray (DNA chip)는 방대한 양의 지놈 정보를 이용하여 단시간에 대량으로 고속처리하여 효율적으로 유전자 기능을 분석할 수 있는 주목받고 있는 방법이다. DNA microarray 실험과 분석에 있어 데이터분석, 재현성, 종간의 비교, 확인실험 및 비용 등의 문제가 있지만 유전자발현양상 데이터로부터 정확한 환자의 예후를 예측할 수 있는 비교적 적은 유전자 그룹의 진단마커를 찾거나, 하나의 유전자가 아니라 mouse 전체 지놈의 유전자발현 패턴을 인간의 암을 위시한 각종 질병 연구를 위한 발현 신호나 변화 등을 발견하여 신약개발 등에 활용하고자 하는 시도가 활발히 진행되고 있다. 서로 다른 종간에 비슷한 phenotype의 유전자발현도 진화적으로 보존되었다는 전제 하에서 지놈 sequence의 비교연구가 가능하고 DNA microarray 발현 데이터에 근거하여 독립적으로 각 종간의 유전자발현패턴을 비교함으로써 난치병 등을 새롭게 분류할 수 있다. 즉, 암세포 등에서 유전자발현 양상은 유전학적, 환경적 alteration들이 잘 반영되어 있다고 간주하고, 이러한 양상을 바탕으로 인간의 암을 위시한 다양한 질병 연구를 위한 최적의 mouse 모델을 찾을 수 있고, 이는 결국 새로운 치료 방법 개발이나 맞춤의학 실현에 중요한 역할을 할 것으로 기대된다. 특히 pathway 타겟으로 하는 치료를 위해서는 Human-mouse 비교를 통한 발현 신호를 찾는 것이 진단에서는 매우 유용한 방법이다. 이를 위한 고성능의 분석방법이나 시스템의 개발이 중요하게 된다.. 관류의 정도와 조영증강정도를 중심으로 관류 MR 영상소견과 조직학적 소견을 관련지어 분석하였다. 결과: 조영증강 T1강조MR영상에서 환상조영증강을 보이는 다형성 교보세포종 2예에서는 변연부 외륜이 고관류를, 중심부의 괴사부위는 저관류로 나타났다. 저등급 교종은 경계가 불분명한 저관류부위로 보였다. 뇌농양 2예는 변연부 외륜이 경도의 고관류를, 중심부는 저관류로 나타났다. 뇌수막종은 미만성의 균일한 중등도 혹은 고도의 고관류로 보였으며, 임파종과 배아종은 경계가 명확한 저관류부위로 나타났다. 신경세포종은 종괴\ulcorner 일부에 중등도 혹은 고도의 고관류부위가 관찰되었고, 전이암은 다수병변중 일부에서 중등도의 고관류를 보였다. 방사선괴사는 저관류부위내에 국소적 고관류부위를 보였다. 결론: 관류 MR영상은 뇌종양의 관류상태를 비교적 잘 반영하며, 조직학적 특성을 예측하는데에 도움을 주 수 있을 것으로 기대된다. 뇌종야에서의 관류MR영상의 분명한 역할을 규명하기 위해서는 앞으로 더 많은 임상적 연구가 필요할 것으로 생각된다.조증 환자의 자극성 전타액내 lactobacilli양은 peroxidase system을 함유한 세치제를 사용한 군에서 대조군에 비해 상대적으로 낮게 나타났으나(p = 0.067) 통계학적 유의성은 없었다.같은 예에서 찾아 볼 수 있다. 첫째, 발음상으로 동사의 변화형에서 "porte[$p{\jmath}rte$](들다: 현재형), porte[$p{\jmath}rte$](과거분사형), porta[$p{\jmath}rte$](단순과거형)"등이 대립되며, 이휘 "Porto[$p{\jmath}rte$](포르토)"와도 대립된다. 둘째, 어휘적 대립 "le haut[$l{\partial}o$](위)/l'eau[lo](물)"와 형태론적 대립 "le[$l{\partial}$](정관사, 남성단수)/l

  • PDF

유전자알고리즘 기반 복수 분류모형 통합에 의한 캐피탈고객의 신용 스코어링 모형 (A credit scoring model of a capital company's customers using genetic algorithm based integration of multiple classifiers)

  • 김갑식
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.279-286
    • /
    • 2005
  • 본 연구에서는 캐피탈시장에서의 고객신용예측을 위한 모형으로 여러 가지 인공신경망(Neural Network) 모형들을 유전자 알고리즘(Genetic Algorithm)을 이용하여 통합한 신용예측모형을 제안하였다. 10개의 학습된 인공신경망 모형들을 유전자알고리즘을 이용하여 종류별로 통합하여 MLP (Multi-Layered Perceptron), Linear, RBF(Radial Basis Function) 세 가지의 대표모델을 얻고 이를 다시 하나의 인공신경망 모델로 통합하였다. 이를 통합되기 이전의 각각의 인공신경망 모형들과 성능을 비교, 분석하여 본 연구에서 제안한 통합모형의 유효성과 통합방법의 타당성을 제시하였다.

  • PDF

유전자 알고리즘 기반 최적 다항식 뉴럴네트워크 및 비선형 공정으로의 응용 (Genetic Algorithms based Optimal Polynomial Neural Network and Its application to Nonlinear Process)

  • 김완수;오성권;김현기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.191-194
    • /
    • 2005
  • 본 논문은 최적 탐색 알고리즘인 유전자 알고리즘을 이용하여 다항식 뉴럴네트워크(Polynomial Neural Networks : PNN)의 최적 설계가 그 목적이다. 기존의 다항식 뉴럴네트워크는 확장된 GMDH(Group Method of Data Handling) 방법에 기반을 두며, 네트워크의 성장과정을 통하여 각 층의 다항식뉴런(혹은 노드)에서 고정된 (설계자에 의해 미리 선택된) 노드 입력들의 수뿐만 아니라 다항식 차수(1차, 2차, 그리고 수정된 2차식)를 이용하였다. 더구나, 그 방법은 학습을 통해 생성된 PNN이 최적 네트워크 구조를 가진다는 것을 보증하지 못한다. 그러나, 제안된 GA-based PW 모델은 다음의 파라미터들- 즉 입력변수의 수, 입력변수, 및 다항식 차수-을 유전자 알고리즘을 이용하여 선택 동조함으로써 그 구조를 구조적으로 더 최적화된 네트워크가 되도록 하고, 기존의 PNN보다 훨씬 더 유연하고, 선호된 뉴럴 네트워크가 되도록 한다. 하중계수를 가진 합성성능지수가 그 모델의 근사화 및 일반화(예측) 능력 사이의 상호 균형을 얻기 위해 제안된다. GA-based PNN의 성능을 평가하기 위해 그 모델은 가스 터빈발전소의 NOx 배출 공정 데이터로 실험된다. 비교해석은 제안된 GA-based PNN이 앞서 나타난 다른 지능모델보다 더 우수한 예측능력뿐만 아니라 높은 정확성을 가진 모델임을 보인다.

  • PDF

녹섹(NOGSEC): A NOnparametric method for Genome SEquence Clustering (NOGSEC: A NOnparametric method for Genome SEquence Clustering)

  • 이영복;김판규;조환규
    • 미생물학회지
    • /
    • 제39권2호
    • /
    • pp.67-75
    • /
    • 2003
  • 비교유전체학의 주요 주제 중 유전자서열을 분류하고 단백질기능을 예측하는 연구가 있으며, 이를 위해 단백질 구조, 공통서열 및 바인딩 위치 예측등의 방법과 함께, 전유전체 서열에서 구해지는 유사도 그래프를 분석해 상동유전자를 검색하는 계산학적인 접근방법이 있다. 유사도그래프를 사용한 방법은 서열에 대한 기존 지식에 의존하지 않는 장점이 있지만 유사도 하한값과 같은 주관적인 임계값이 필요한 단점이 있다. 본 논문에서는 반복적으로 그래프를 분해하는 이전의 방법을 일반화시켜, 유사도 그래프에 기반한 유전자 서열군집분석 방법론과 객관적이고 안정적인 파라미터 임계값 계산 방법을 제안한다. 제시된 방법으로 알려진 미생물 유전체 서 열을 분석하여 이전의 방법인 BAG 알고리즘 결과와 비교했다.

유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형 개발에 관한 연구 (Development of Hazard-Level Forecasting Model using Combined Method of Genetic Algorithm and Artificial Neural Network at Signalized Intersections)

  • 김중효;신재만;박제진;하태준
    • 대한토목학회논문집
    • /
    • 제30권4D호
    • /
    • pp.351-360
    • /
    • 2010
  • 2010년 말 현재 우리나라의 자동차등록대수는 1,748만 대에 육박할 정도로 비약적인 증가를 보이고 있다. 자동차의 급격한 증가는 오늘날 우리가 직면한 심각한 사회문제 중 하나인 교통사고를 증가시키고, 이로 인해 인명피해 및 경제적 손실을 초래하고 있다. 이에 본 연구는 유전자 알고리즘과 신경망 이론의 결합에 의한, 향상된 신호교차로 위험도를 예측하는 모형을 개발하여, 장래 교통사고 안전대책 수립시 근간이 되는 기초자료를 제공함으로써, 교통사고를 줄이는데 도움이 되고자 한다. 본 연구에서는, 첫 번째로 교통사고와 교통혼잡이 빈번하게 발생하는 신호교차로를 대상으로 접근로별 교통량과 도로 기하구조 요소를 파악하였고, 교통사고와 교통상충간의 순위상관관계분석을 실시하여 통계적 유의성을 파악하였으며, 교통사고와 교통상충을 적용한 선형회귀모형을 구축하였다. 두 번째로, 유전자 알고리즘과 신경망 이론의 결합에 의한 신호교차로 위험도 예측모형은 신호교차로 교통량 및 도로 기하구조 요소, 교통상충의 특성변수를 적용하여 개발하였다. 마지막으로, 신호교차로 교통사고건수 실측값과 개발모형의 예측값에 대한 적합도 분석을 통해 신뢰수준을 검증한 결과, 개발모형의 신뢰도와 정확도가 기존의 모형에 비해 우수한 것으로 나타났다. 결론적으로, 향후 본 연구를 통해 개발된 교통사고위험도 예측모형을 신호교차로 교통안전정책 수립과 교통안전개선사업에 사용할 경우, 전반적으로 교통안전관련사업의 비용/효율성을 극대화할 수 있을 것으로 기대된다.

HMM을 이용한 단백질 $\beta$-barrel 막횡단 부위 예측 (Predicting Transmembrane $\beta$-barrel membrane protein with HMM)

  • 안창신;유성준;박현석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.802-804
    • /
    • 2003
  • 2000년대 초 인간 지놈 프로젝트의 완성으로 새로운 포스트-지놈 시대를 맞이하여, 유전자에 대한 해독보다는 인간의 모든 대사와 질병에 직접관여 하고 있는 단백질의 구조와 기능에 대해 많은 관심과 연구가 이루어지고 있다. 특히, 특정 단백질들은 암과 같은 불치병에 직접관여 하고 있으므로 이러한 단백질들의 기능과 구조에 대한 예측 성능의 향상은 새로운 신약 개발에 큰 도움이 될 것이다. 본 논문은 기계학습(Machine Learning)의 한 분야인 HMM(Hidden Markov Model)을 이용하여 $\beta$-barrel 형태로 막횡단하는 단백질의 특성과 기능으로부터 막횡단하는 부위가 존재하는지 여부를 예측하는 프로그램을 구현했다.

  • PDF

SVM과 HMM을 이용한 $\alpha$-Helix 막횡단 단백질 예측 (Predicting Transmembrane $\alpha$-helix protein with SVM and HMM)

  • 송철환;유성준;김민경;설영주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.817-819
    • /
    • 2003
  • 현재 바이오인포매틱스(Bioinformatics) 분야에서 가장 중요한 부분 중의 하나는 유전자 및 단백질의 구조와 기능을 정확하게 예측하는 것이다. 이는 질병 치료 및 신약개발에 유용하여 이로부터 나온 결과로부터 경제적 산업적 효과를 기대할 수 있다. 이 논문에서는 기계학습(Machine Learning)의 한 분야인 SVM(Support Vector Machine)과 HMM(Hidden Markov Model)를 결합하여 단백질의 막횡단(Transmembrane) $\alpha$-Helix 단백질 지역을 예측하는 새로운 알고리즘을 개발, 구현 및 실험하였다. 그 결과 이 두 가지 알고리즘이 결합된 방식을 사용함으로써 성능을 향상 시킬 수 있음을 증명했다.

  • PDF