• Title/Summary/Keyword: 유전자 예측

Search Result 504, Processing Time 0.031 seconds

Association Rule Discovery for Sequence Analysis (서열 분석을 위한 연관 규칙 탐사)

  • 김정자;이도헌
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.91-93
    • /
    • 2001
  • 최근 지놈(Genome) 프로젝트를 통해 핵산, 단백질 서열 정보가 밝혀짐에 따라 분자 수준의 유전자 정보를 다루는 기법들이 활발히 연구되면서 방대한 서열 정보를 데이터 베이스화하고, 부족하기 위한 효과적인 도구와 컴퓨터 알고리즘의 개발을 필요로 하고 있다. 본 논문에서는 여러 단백질에 공통적으로 존재하는 서열 정보간에 존재하는 연관성을 탐사하기 위한 서열 연관 규칙 알고리즘을 제안한다. 원자 항목을 취급하였던 기존 알고리즘과는 달리 중복을 반영해야 하는 서열 데이터의 특성을 고려하여야 한다. 실험을 단백질 서열 데이터를 대상으로 수행하였다. 먼저 여러 서열에 빈발하게 발생하는 부 서열 집합을 찾고, 부 서열 집합들간에 존재하는 관련성을 탐사한다. 본 연구의 결과는 탐사된 규칙으로부터 다른 단백질의 구조와 기능을 예측할 수 있고, 이 정보는 필요로 하는 생물학적 분석을 방향을 제시할 것이다. 이는 생물학적 실험 대상의 후부조합을 최소화함으로써 많은 시간과 노력 비용을 절감할 수 있다.

  • PDF

MicroRNA Target Prediction using DNA Kernels (DNA 커널을 이용한 MicroRNA 목표 유전자 예측)

  • Noh Yung-Kyun;Kim Sung-Kyu;Kim Cheong-Tag;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.259-261
    • /
    • 2005
  • 분류 방법으로서의 SVM(Support Vector Machine)은 커널 방법과 함께 사용됨으로써 그 유용성을 크게 향상시켰다. 커널 방법은 일반적으로 입력 데이터의 자질(feature)로 나타내는 공간으로부터 높은 차원의 공간으로 데이터를 사상(mapping)시키는 역할을 하게 되나, 기본적으로는 데이터간에 새로운 거리(metric)를 부설해주는 역할을 하는 것이다. 지금까지 나온 다양한 커널 방법은 구조화된(structured) 데이터에 대해 커널 형태로 거리를 부여하는 방법을 제시한다. 본 논문에서는 DNA의 작용을 모델링하여 만든 새로운 커널이 miRNA(micro RNA)와 mRNA(messenger RNA)쌍에 대한 발현 여부를 분류해 내기 위해 커널 형식으로 거리를 부여하는 방법을 보인다. 이 방법은 실리콘 컴퓨터가 아닌 실제 DNA분자로 실험할 수 있도록 설계된 것을 고려할 때 여러 종류의 DNA 코드를 분석하는 데 사용될 수 있는 새로운 분자컴퓨팅 방법이다.

  • PDF

Using spatial data and crop growth modeling to predict performance of South Korean rice varieties grown in western coastal plains in North Korea I. Generation of daily weather data for model input (공간정보와 생육모의에 의한 남한 벼 품종의 북한 서부지대 적응성 예측 I. 최근 30년간 기후자료에 근거한 일 기상자료 복원)

  • 구자민;한상욱;김희동;김영호
    • Proceedings of The Korean Society of Agricultural and Forest Meteorology Conference
    • /
    • 2002.11a
    • /
    • pp.65-68
    • /
    • 2002
  • 몇 개 농업관련 시험장에서 북한 벼 품종의 출수반응을 관찰한 결과 북한에서 조생종으로 분류된 품종들은 온도에 민감한 반응을 보여 기준품종인 남한의 오대벼에 비해 출수가 빨랐고, 중생종은 그보다 출수가 늦어 전체적으로 남한 품종의 조만성과 유사하였다 (양 등, 2000). 또한 유전자 분석을 통해 북한품종 및 계통 101개를 남한품종과 비교해 본 결과 40% 유사도 수준에서 남한 품종과 같이 통일형과 자포니까형으로 나눌 수 있었으며, 자포니카형 품종들간 유사도는 80%에 달했다.(정 등, 2001)(중략)

  • PDF

Prediction of epigenetic carcinogenesis based on protein network (단백질 네트워크 기반 후성유전학적 암 발생 기전 예측)

  • Jin, Hye Jeong;Lee, Jihoo;Kim, Hak Yong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2016.05a
    • /
    • pp.191-192
    • /
    • 2016
  • DNA 염기서열 자체에는 변화가 없으나 크로마틴의 변형을 통하여 유전자의 발현 양상이 변하는 현상을 후성유전이라 한다. 최근에 이런 후성유전학적 변이가 암 발생과 밀접한 연관이 있는 것으로 알려졌다. 본 연구에서는 암 관련 단백질과 암 관련 후성유전 단백질 상호작용 네트워크를 통하여 암과 후성 유전적 관계를 분석하고자 하였다. 먼저 상호작용 네트워크를 기반으로 허브에 해당하는 히스톤 변형 단백질 20개를 추출하였다. 추출한 20개 단백질을 KEGG pathway에 적용하여 암 관련 단백질과의 상관관계를 분석하였다. 암 관련 단백질 발현양상을 확인할 수 있는 Expression Atlas로부터 발현이 증가하거나 감소하는 단백질을 분류하고, 발현 정보를 KEGG pathway 위에 있는 단백질에 적용함으로써 후성유전학적 암 발생 기전을 도출하였다.

  • PDF

Estimation of Dinucleotide Step Parameters of Double Helix Structure on MicroRNA Using Genetic Algorithms (유전알고리즘을 이용한 MicroRNA 이중나선 구조의 Dinucleotide Step 파라미터 추정)

  • Nam Jin-Wu;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.262-264
    • /
    • 2005
  • MicroRNA는 약 22 nucleotide 길이로, 세포질에서 유전자의 전사 후 조절 기능을 맡는 small RNA의 한 종류이다. MiRNA는 긴 전사체인 pri-miRNA에서 Drosha에 의해 절단 되어 핵 밖으로 나가 최종 Dicer에 의해 성숙된다. 하지만, 아직까지 이 효소들이 pri-miRNA를 잘라내는 3차 구조상의 메커니즘을 이해하지 못하고 있다. 본 연구에서는 완숙한 miRNA 이중나선이 약 2 회전을 이루게 된다는 정보를 바탕으로, Drosha가 붙는 miRNA stem구조의 dinucleotide step 파라미터를 유전 알고리즘을 이용하여 추정한다. 추정된 파라미터로부터 실제 miRNA들의 3차구조를 예측할 수 있으며, 3차 구조상의 Drosha의 절단 메커니즘을 이해하는데 도움을 줄 것이다.

  • PDF

Draft genome sequence of Lactobacillus reuteri KLR3004 from a fattening pig (비육돈 분변으로부터 분리한 Lactobacillus reuteri KLR3004 유산균주의 유전체 분석)

  • Park, Jongbin;Lee, Jun-Yeong;Jin, Gwi-Deuk;Kim, Eun Bae
    • Korean Journal of Microbiology
    • /
    • v.53 no.2
    • /
    • pp.146-148
    • /
    • 2017
  • We sequenced the genome of Lactobacillus reuteri KLR3004 strain isolated from a fattening pig in South Korea. The sequences were assembled into a draft genome containing 1,996,237 bp with a G+C content of 38.75% and 1,837 predicted protein-coding sequences in 149 contigs.

Financial Application of Integrated Optimization and Machine Learning Technique (최적화와 기계학습 결합기법의 재무응용)

  • Kim, Kyoung-jae;Park, Hoyeon;Cha, Injoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.429-430
    • /
    • 2019
  • 본 논문에서는 최적화 기법에 기반한 지능형 시스템의 재무응용사례를 다룬다. 본 연구에서 제안하는 모형은 대표적인 최적화 기법 중 하나인 시뮬레이티드 어니일링인데 이는 유전자 알고리듬과 유사한 최적화 성능을 가지고 있는 것으로 알려져 있으나 재무분야에서 응용된 사례가 거의 없다. 본 연구에서 제안하는 지능형 시스템은 시뮬레이티드 어니일링과 기계학습 기법을 결합한 것이다. 일반적으로 최적화와 기계학습 기법을 결합하는 방법은 특징선택(feature selection), 특징 가중치 최적화(feature weighting), 사례선택(instance selection), 모수 최적화(parameter optimization) 등의 방법이 있는데 선행연구에서 가장 많이 사용된 것은 특징선택에 두 기법을 결합하는 방식이다. 본 연구에서도 기계학습 기법을 재무 문제에 활용함에 있어서 최적의 특징선택을 위해 시뮬레이티드 어니일링을 결합하는 방식을 사용한다. 본 연구에서 제안된 기법의 유용성을 확인하기 위하여 실제 재무분야의 데이터를 활용하여 예측 정확도를 확인하였으며 그 결과를 통하여 제안하는 모형의 유용성을 확인할 수 있었다.

  • PDF

Structural Optimization and Improvement of Initial Weight Dependency of the Neural Network Model for Determination of Preconsolidation Pressure from Piezocone Test Result (피에조콘을 이용한 선행압밀하중 결정 신경망 모델의 구조 최적화 및 초기 연결강도 의존성 개선)

  • Kim, Young-Sang;Joo, No-Ah;Park, Hyun-Il;Park, Sol-Ji
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.29 no.3C
    • /
    • pp.115-125
    • /
    • 2009
  • The preconsolidation pressure has been commonly determined by oedometer test. However, it can also be determined by insitu test, such as piezocone test with theoretical and(or) empirical correlations. Recently, Neural Network (NN) theory was applied and some models were proposed to estimate the preconsolidation pressure or OCR. It was already found that NN model can come over the site dependency and prediction accuracy is greatly improved when compared with present theoretical and empirical models. However, since the optimization process of synaptic weights of NN model is dependent on the initial synaptic weights, NN models which are trained with different initial weights can't avoid the variability on prediction result for new database even though they have same structure and use same transfer function. In this study, Committee Neural Network (CNN) model is proposed to improve the initial weight dependency of multi-layered neural network model on the prediction of preconsolidation pressure of soft clay from piezocone test result. Prediction results of CNN model are compared with those of conventional empirical and theoretical models and multi-layered neural network model, which has the optimized structure. It was found that even though the NN model has the optimized structure for given training data set, it still has the initial weight dependency, while the proposed CNN model can improve the initial weight dependency of the NN model and provide a consistent and precise inference result than existing NN models.

Pattern Recognition System Combining KNN rules and New Feature Weighting algorithm (KNN 규칙과 새로운 특징 가중치 알고리즘을 결합한 패턴 인식 시스템)

  • Lee Hee-Sung;Kim Euntai;Kim Dongyeon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.42 no.4 s.304
    • /
    • pp.43-50
    • /
    • 2005
  • This paper proposes a new pattern recognition system combining the new adaptive feature weighting based on the genetic algorithm and the modified KNN(K Nearest-Neighbor) rules. The new feature weighting proposed herein avoids the overfitting and finds the Proper feature weighting value by determining the middle value of weights using GA. New GA operators are introduced to obtain the high performance of the system. Moreover, a class dependent feature weighting strategy is employed. Whilst the classical methods use the same feature space for all classes, the Proposed method uses a different feature space for each class. The KNN rule is modified to estimate the class of test pattern using adaptive feature space. Experiments were performed with the unconstrained handwritten numeral database of Concordia University in Canada to show the performance of the proposed method.

Time Series Perturbation Modeling Algorithm : Combination of Genetic Programming and Quantum Mechanical Perturbation Theory (시계열 섭동 모델링 알고리즘 : 운전자 프로그래밍과 양자역학 섭동이론의 통합)

  • Lee, Geum-Yong
    • The KIPS Transactions:PartB
    • /
    • v.9B no.3
    • /
    • pp.277-286
    • /
    • 2002
  • Genetic programming (GP) has been combined with quantum mechanical perturbation theory to make a new algorithm to construct mathematical models and perform predictions for chaotic time series from real world. Procedural similarities between time series modeling and perturbation theory to solve quantum mechanical wave equations are discussed, and the exemplary GP approach for implementing them is proposed. The approach is based on multiple populations and uses orthogonal functions for GP function set. GP is applied to original time series to get the first mathematical model. Numerical values of the model are subtracted from the original time series data to form a residual time series which is again subject to GP modeling procedure. The process is repeated until predetermined terminating conditions are met. The algorithm has been successfully applied to construct highly effective mathematical models for many real world chaotic time series. Comparisons with other methodologies and topics for further study are also introduced.