• Title/Summary/Keyword: 유전자 예측

Search Result 503, Processing Time 0.038 seconds

A Genetic Algorithm for Optimal Period Forecasting Of Moving Average (유전자 알고리즘을 이용한 Moving Average의 최적 Period 예측 시스템 구현)

  • Kim, So-Young;Han, Chi-Geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2447-2450
    • /
    • 2002
  • 주가지수선물시장은 주식투자에 따르는 위험을 효과적으로 관리할 수 있는 제도적 장치로서 오늘날 불안한 주식시장 현황에 있어서 더욱더 중요한 위치를 갖고 있다. 현재 이러한 주가지수선물거래에 있어서 Moving Average 를 예측하고자 하는 여러 트레이딩 시스템을 선보이고 있다. 이 논문에서는 과거의 데이터를 토대로 한 Moving Average Line 분석에 있어서 일반적으로 기존방법보다 효과적이라고 알려진 유전자 알고리즘을 이용하여 Moving Average 의 최적 Period 예측 시스템을 구현한다.

  • PDF

Modeling of Charge Density of Thin Film Charge Density by Using Neural Network and Genetic Algorithm (유전자 알고리즘과 일반화된 회귀 신경망을 이용한 박막 전하밀도 예측모델)

  • Kwon, Sang-Hee;Kim, Byung-Whan
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1805-1806
    • /
    • 2007
  • Silicon nitride (SiN) 박막을 플라즈마 응용화학기상법을 이용하여 증착하였다. SiN박막의 전하밀도는 일반화된 회귀 신경망 (GRNN)을 이용하여 모델링하였다. PECVD 공정은 Box Wilson 실험계획표를 이용하여 수행하였다. GRNN 모델의 예측수행은 유전자 알고리즘 (GA)을 이용하여 최적화하였다. 최적화한 GA-GRNN 모델은 종래의 GRNN 모델과 비교하여, 약55%정도의 예측성능의 향상을 보였다.

  • PDF

Comparison of External Information Performance Predicting Subcellular Localization of Proteins (단백질의 세포내 위치를 예측하기 위한 외부정보의 성능 비교)

  • Chi, Sang-Mun
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.11
    • /
    • pp.803-811
    • /
    • 2010
  • Since protein subcellular location and biological function are highly correlated, the prediction of protein subcellular localization can provide information about the function of a protein. In order to enhance the prediction performance, external information other than amino acids sequence information is actively exploited in many researches. This paper compares the prediction capabilities resided in amino acid sequence similarity, protein profile, gene ontology, motif, and textual information. In the experiments using PLOC dataset which has proteins less than 80% sequence similarity, sequence similarity information and gene ontology are effective information, achieving a classification accuracy of 94.8%. In the experiments using BaCelLo IDS dataset with low sequence similarity less than 30%, using gene ontology gives the best prediction accuracies, 93.2% for animals and 86.6% for fungi.

Study on Water Stage Prediction Using Hybrid Model of Artificial Neural Network and Genetic Algorithm (인공신경망과 유전자알고리즘의 결합모형을 이용한 수위예측에 관한 연구)

  • Yeo, Woon-Ki;Seo, Young-Min;Lee, Seung-Yoon;Jee, Hong-Kee
    • Journal of Korea Water Resources Association
    • /
    • v.43 no.8
    • /
    • pp.721-731
    • /
    • 2010
  • The rainfall-runoff relationship is very difficult to predict because it is complicate factor affected by many temporal and spatial parameters of the basin. In recent, models which is based on artificial intelligent such as neural network, genetic algorithm fuzzy etc., are frequently used to predict discharge while stochastic or deterministic or empirical models are used in the past. However, the discharge data which are generally used for prediction as training and validation set are often estimated from rating curve which has potential error in its estimation that makes a problem in reliability. Therefore, in this study, water stage is predicted from antecedent rainfall and water stage data for short term using three models of neural network which trained by error back propagation algorithm and optimized by genetic algorithm and training error back propagation after it is optimized by genetic algorithm respectively. As the result, the model optimized by Genetic Algorithm gives the best forecasting ability which is not much decreased as the forecasting time increase. Moreover, the models using stage data only as the input data give better results than the models using precipitation data with stage data.

A credit prediction model of a capital company′s customers using genetic algorithm based integration of multiple classifiers (유전자 알고리즘기반 복수 분류모형 통합에 의한 할부금융고객의 신용예측모형)

  • 이웅규;김홍철
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.161-164
    • /
    • 2001
  • 본 연구에서는 할부금융시장에서의 고객신용예측을 위한 모형으로 여러 가지 인공신경망(Neural Network) 모형들을 유전자 알고리즘(Genetic Algorithm)을 이용하여 통합한 신용예측모형을 제안한다. 10개의 학습된 인공신경망 모형들을 유전자알고리즘을 이용하여 종류별로 통합하여 MLP(Multi-Layered Perceptrons), Linear, RBF(Radial Basis Function) 세 가지의 대표모델을 얻고 이를 다시 하나의 인공신경망 모델로 통합하였다. 이를 통합되기 이전의 각각의 인공신경망 모형들과 성능을 비교, 분석하여 본 연구에서 제안한 통합모형의 유효성과 통합방법의 타당성을 제시하였다.

  • PDF

Fuzzy Clustering Algorithm to Predict Cancer Class Using Gene Expression Data (유전자 발현 데이터를 이용한 암의 클래스 예측을 위한 퍼지 클러스터링 알고리즘)

  • 원홍희;유시호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.757-759
    • /
    • 2003
  • 암의 치료법은 같은 종류의 암이라 해도 그 하부 클래스에 따라 매우 다르기 때문에 암의 클래스를 예측하는 것은 그 정확한 치료를 위하여 매우 중요하다. 유전자 발현 데이터를 이용한 암의 분류에 있어 기존의 연구들은 각 데이터를 하나의 클러스터에 소속시키는 하드 분할(hard partition)에 의한 분할 방식을 사용하는 하드 클러스터링을 사용하였다. 하지만 일반적으로 유전자 발현 암 데이터와 같은 실세계의 데이터는 쉽게 나뉘어지기 힘들거나 클러스터 간의 경계가 분명하지 않기 때문에 하드 클러스터링 기법은 주어진 데이터의 성질을 손실시킬 수 있는데 반해, 퍼지 클러스터링 기법은 각 데이터가 소속 정도에 따라 여러 개의 클러스터에 속할 수 있도록 분할하기 때문에 이러한 손실을 최소화할 수 있다. 따라서 본 논문에서는 퍼지 클러스터링의 대표적인 방법인 fuzzy c-means 클러스터링을 적용하여 암의 클래스를 예측하고, 다양한 하드 클러스터링 방법과 비교함으로써 퍼지 클러스터링의 성능을 검증하였다.

  • PDF

Prediction of MicroRNA Strand Selection using Hypernetwork Model (하이퍼망 모델을 이용한 MircoRNA Strand 선택 예측)

  • Lee, Ji-Hoon;Ha, Jung-Woo;Rhee, Je-Keun;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.235-239
    • /
    • 2010
  • MicroRNA는 RNA로 전사된 유전자와의 상보결합을 통해 유전자 발현을 억제하는 조절인자이다. MicroRNA 생성과정에서 pre-microRNA의 3' 또는 5' 부근의 strand가 선택되어 mature 시퀀스가 되고 유전자 조절에 직접 작용하게 된다. 하지만 어떤 특징을 가진 strand가 선택 되는지에 대한 정확한 메커니즘은 아직 연구되어 있지 않다. 본 논문에서는 microRNA 시퀀스 정보를 바탕으로 하이퍼망을 구성하여 strand 선택 예측 모델을 구축하였다. 실험 결과 하이퍼망 학습을 통해 microRNA strand 선택에 중요한 영향을 미치는 시퀀스 특징을 찾을 수 있었고, strand 선택을 높은 정확도로 예측할 수 있음을 확인하였다.

  • PDF

A Crash Prediction Model for Expressways Using Genetic Programming (유전자 프로그래밍을 이용한 고속도로 사고예측모형)

  • Kwak, Ho-Chan;Kim, Dong-Kyu;Kho, Seung-Young;Lee, Chungwon
    • Journal of Korean Society of Transportation
    • /
    • v.32 no.4
    • /
    • pp.369-379
    • /
    • 2014
  • The Statistical regression model has been used to construct crash prediction models, despite its limitations in assuming data distribution and functional form. In response to the limitations associated with the statistical regression models, a few studies based on non-parametric methods such as neural networks have been proposed to develop crash prediction models. However, these models have a major limitation in that they work as black boxes, and therefore cannot be directly used to identify the relationships between crash frequency and crash factors. A genetic programming model can find a solution to a problem without any specified assumptions and remove the black box effect. Hence, this paper investigates the application of the genetic programming technique to develope the crash prediction model. The data collected from the Gyeongbu expressway during the past three years (2010-2012), were separated into straight and curve sections. The random forest technique was applied to select the important variables that affect crash occurrence. The genetic programming model was developed based on the variables that were selected by the random forest. To test the goodness of fit of the genetic programming model, the RMSE of each model was compared to that of the negative binomial regression model. The test results indicate that the goodness of fit of the genetic programming models is superior to that of the negative binomial models.

Inflow Forecasting Using Fuzzy-Grey Model (Fuzzy-Grey 모형을 이용한 유입량 예측)

  • Kim, Yong;Yi, Choong Sung;Kim, Hung Soo;Shim, Myung Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.759-764
    • /
    • 2004
  • 본 연구는 Deng(1989)이 제시한 Grey 모형을 이용하여 성진강댐의 월유입량을 예측하였고 그 방법을 제시하였다. Grey 모형은 시계열모형이나 다른 모형에 비해 비교적 적은 수의 자료를 이용하고, 간단할 수식으로 구성되어 있는 장점이 있으나, 적은 수의 자료로 인해 입력자료가 가지는 증감의 경향(trend)으로 오차가 발생하기 쉽다. 그러므로 예측오차를 극복하기 위해서 Fuzzy 시스템을 결합한 Fuzzy-Grey 모형을 구성하였고 Fuzzy 시스템에 필요한 매개변수를 추정하기 위해 최적화기법인 유전자 알고리즘(GA; Genetic Algorithm)을 이용하였다. Grey 모형과 결합된 Fuzzy 시스템은 현재의 입력자료가 가지는 패턴과 가장 유사한 패턴의 과거자료를 이용하여 현재의 입력자료의 예측오차를 추론해내는 기능을 가진다. 오차를 추론하기 위해서 과거 월유입량 자료중 현재 입력 자료와 유사한 패턴을 Grey 상관도를 이용하여 검색하고, 보다 높은 유사성을 가지는 패턴을 선별하고자 노름(norm)을 사용하였고, 유전자 알고리즘의 탐색공간을 제한하였다. 이렇게 구성한 Fuzzy-Grey 모형을 이용하여 전국적인 가뭄년도였던 1992년, 1988년, 2001년에 대해 섬진강댐의 월유입량을 예측하였다. 오차는 1982년, 2001년, 1988년 순으로 비슷한 크기의 오차가 발생하였는데 결과를 분석하여 보면, 급격한 월유입량의 변화가 있었던 경우에 오차가 크게 발생하였으나 가뭄년도에 대해 월유입량의 불확실성이 큼에도 불구하고 비교적 월유입량의 추세를 잘 예측한 것으로 판단된다. 본 연구에서 적용한 Fuzzy-Grey 모형은 적은 수의 자료를 이용하여 예측하고 예측결과를 다시 입력자료로 사용하는 업데이트 방식을 사용하기 때문에 예측결과의 오차가 완전하게 보정되지 않으면 다음 결과에 역시 오차를 주게 되어 오차보정이 상당히 중요하다는 것을 알 수 있었다. 오차를 보다 효과적으로 보정하기 위해서는 퍼지제어에 사용되는 퍼지규칙의 수를 늘리고, 유입량에 직접적인 영향을 주는 강우량과 연계한 2변수의 Fuzzy-Grey 모형을 이용한다면 보다 정확한 유입량 예측이 가능할 것으로 사료된다.

  • PDF

Disease Prediction Index of Customized Nutrition And Exercise Management Services Based On Personal Genetic Information (개인유전자정보에 따른 맞춤형 영양 및 운동관리시스템의 질병 예측 인덱스)

  • Seo, Young-woo;Joo, Moon-il;Huh, Gyung Hye;Kim, Hee-cheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.10a
    • /
    • pp.602-604
    • /
    • 2017
  • As human life span has increased, people have wanted to live healthier desires. Especially Korea has rapidly entered an aging society, leading to the burden of medical expenses to the increase of disease accompanying aging. To alleviate the burden of medical expenses, prediction and prevention are important rather than treatment of diseases. It is possible to predict and prevent diseases by measuring individual genetic information. In order to utilize individual's genetic information Korea's genetic information is grasped through SNP (800 thousand) and GWAS optimized for the discovery of genetic factors of phenotype and disease of Koreans, The genetic information of each individual is analyzed in the genetic (constitutional) characteristics of the individual. In this thesis we develop a classification index so that we can classify populations of specific chronic diseases (obesity, diabetes or cardiovascular system). Try to develop health care services to manage custom diet and exercise associated with chronic illness.

  • PDF