• 제목/요약/키워드: MCL algorithm

검색결과 19건 처리시간 0.024초

MCL 알고리즘을 사용한 유전자 발현 데이터 클러스터링 (Clustering Gene Expression Data by MCL Algorithm)

  • 손호선;류근호
    • 전자공학회논문지CI
    • /
    • 제45권4호
    • /
    • pp.27-33
    • /
    • 2008
  • 유전자 발현 데이터의 분석 기법 중 무감독 학습 기반의 클러스터링 기법은 생물학적 변화와 진의 발현 정도를 이해하는데 자주 사용되는 방법이다. 생명공학 연구에 있어서 그래프 기반의 MCL 알고리즘은 그래프 내의 노드들을 클러스터링 하는 알고리즘으로 빠르고 효과적이다. 우리는 기존의 MCL 알고리즘을 개선하여 마이크로어레이 데이터에 적용시켰다. MCL 알고리즘 수행 시 inflation과 대각선 항의 두 요인을 조정하는 시뮬레이션을 실행하였으며, 마코브 행렬을 이용하여 변환하였다. 또한 개선된 MCL 알고리즘에서는 더 명확한 클래스를 구분하기 위하여 각 열의 평균을 구한 후 그 값을 임계치로 사용하였다. 따라서 수정된 알고리즘은 기존의 알고리즘들보다 정확도를 높일 수 있었다. 즉, 실제 실험 결과 기존에 알려진 클래스와 비교했을 때 평균 70%의 정확도를 보였다. 또한, 다른 클러스터링 기법, K-means 알고리즘, 계층적 클러스터링 그리고 SOM 알고리즘을 비교 분석하였으며, 그 결과 MCL 알고리즘이 다른 클러스터링 기법보다 더 좋은 결과를 보임을 알 수 있다.

MCL 알고리즘을 이용한 단백질 표면의 바인딩 영역 분석 기법 (Investigating Binding Area of Protein Surface using MCL Algorithm)

  • 정광수;유기진;정용제;류근호
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.743-752
    • /
    • 2007
  • 단백질은 다른 물질과의 결합하여 기능을 수행하기 때문에 활성 사이트가 유사한 단백질은 유사한 기능을 가진다. 따라서 단백질의 바인딩 영역을 식별함으로써 단백질의 기능을 추론할 수 있다. 이 논문은 MCL (Markov Cluster) 알고리즘을 이용하여 단백질의 바인딩 영역을 추출하는 새로운 방법을 제시한다. 이를 위하여 단백질의 표면 잔기 거리를 나타내는 distance matrix를 생성하고, 여기에 MCL 프로세스를 적용한다. 제시한 방법을 평가하기 위해 Catalytic Site Atlas (CSA) 데이터를 사용하였다. CSA 데이터 (94개의 단일 체인 단백질)를 이용한 실험 결과, 알고리즘은 91개 단백질의 활성 사이트 주변의 바인딩 영역을 검출하였다. 이 논문은 단백질 활성 사이트를 분석하기 위한 새로운 기하학적 특징을 제시하였고, 활성 사이트와 관련이 없는 잔기를 제거함으로써 단백질 표면의 분석의 시간을 줄일 수 있는 장점이 있다.

CLUSTERING DNA MICROARRAY DATA BY STOCHASTIC ALGORITHM

  • Shon, Ho-Sun;Kim, Sun-Shin;Wang, Ling;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.438-441
    • /
    • 2007
  • Recently, due to molecular biology and engineering technology, DNA microarray makes people watch thousands of genes and the state of variation from the tissue samples of living body. With DNA Microarray, it is possible to construct a genetic group that has similar expression patterns and grasp the progress and variation of gene. This paper practices Cluster Analysis which purposes the discovery of biological subgroup or class by using gene expression information. Hence, the purpose of this paper is to predict a new class which is unknown, open leukaemia data are used for the experiment, and MCL (Markov CLustering) algorithm is applied as an analysis method. The MCL algorithm is based on probability and graph flow theory. MCL simulates random walks on a graph using Markov matrices to determine the transition probabilities among nodes of the graph. If you look at closely to the method, first, MCL algorithm should be applied after getting the distance by using Euclidean distance, then inflation and diagonal factors which are tuning modulus should be tuned, and finally the threshold using the average of each column should be gotten to distinguish one class from another class. Our method has improved the accuracy through using the threshold, namely the average of each column. Our experimental result shows about 70% of accuracy in average compared to the class that is known before. Also, for the comparison evaluation to other algorithm, the proposed method compared to and analyzed SOM (Self-Organizing Map) clustering algorithm which is divided into neural network and hierarchical clustering. The method shows the better result when compared to hierarchical clustering. In further study, it should be studied whether there will be a similar result when the parameter of inflation gotten from our experiment is applied to other gene expression data. We are also trying to make a systematic method to improve the accuracy by regulating the factors mentioned above.

  • PDF

몬테카를로 위치추정 알고리즘을 이용한 수중로봇의 위치추정 (Localization on an Underwater Robot Using Monte Carlo Localization Algorithm)

  • 김태균;고낙용;노성우;이영필
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.288-295
    • /
    • 2011
  • 본 논문에서는 몬테 카를로 방법을 사용한 수중로봇의 위치추정 방법을 제안한다. 수중로봇의 위치추정은 자율 주행을 위한 기본 기능의 하나이다. 제안된 알고리즘에 의하면 추측항법(데드 레크닝 방법)의 약점인 위치 오차 누적 문제를 해결할 수 있다. 제안된 방법은 확률적인 방법으로 로봇 동작의 불확실성과 센서 정보의 불확실성을 처리한다. 특히 칼만 필터 방법과 달리, 로봇의 비선형 운동 특성과 센서의 비가우시안 출력 분포 특성을 모델링할 수 있다. 본 논문에서는 수중로봇 위치 추정에 몬테카를로 위치추정(Monte Carlo Localization : MCL, 이하 MCL로 표기함) 알고리즘을 적용하기 위하여 오일러각을 이용하여 모션모델을 구하였다. 또한 수중로봇에 모션모델과 센서모델을 적용하여 시뮬레이션을 구현하고, 이를 통해 수중로봇에 MCL 알고리즘의 적용 가능성을 보였다.

Moderately clipped LASSO for the high-dimensional generalized linear model

  • Lee, Sangin;Ku, Boncho;Kown, Sunghoon
    • Communications for Statistical Applications and Methods
    • /
    • 제27권4호
    • /
    • pp.445-458
    • /
    • 2020
  • The least absolute shrinkage and selection operator (LASSO) is a popular method for a high-dimensional regression model. LASSO has high prediction accuracy; however, it also selects many irrelevant variables. In this paper, we consider the moderately clipped LASSO (MCL) for the high-dimensional generalized linear model which is a hybrid method of the LASSO and minimax concave penalty (MCP). The MCL preserves advantages of the LASSO and MCP since it shows high prediction accuracy and successfully selects relevant variables. We prove that the MCL achieves the oracle property under some regularity conditions, even when the number of parameters is larger than the sample size. An efficient algorithm is also provided. Various numerical studies confirm that the MCL can be a better alternative to other competitors.

확률론에 기반한 점자블록 추종 알고리즘 및 센서장치의 개발 (Development of Sensor Device and Probability-based Algorithm for Braille-block Tracking)

  • 노치원;이성하;강성철;홍석교
    • 제어로봇시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.249-255
    • /
    • 2007
  • Under the situation of a fire, it is difficult for a rescue robot to use sensors such as vision sensor, ultrasonic sensor or laser distance sensor because of diffusion, refraction or block of light and sound by dense smoke. But, braille blocks that are installed for the visaully impaired at public places such as subway stations can be used as a map for autonomous mobile robot's localization and navigation. In this paper, we developed a laser sensor stan device which can detect braille blcoks in spite of dense smoke and integrated the device to the robot developed to carry out rescue mission in various hazardous disaster areas at KIST. We implemented MCL algorithm for robot's attitude estimation according to the scanned data and transformed a braille block map to a topological map and designed a nonlinear path tracking controller for autonomous navigation. From various simulations and experiments, we could verify that the developed laser sensor device and the proposed localization method are effective to autonomous tracking of braille blocks and the autonomous navigation robot system can be used for rescue under fire.

지향성 안테나를 이용한 무선 센서 네트워크에서의 위치 인식 알고리즘 (Localization Algorithm in Wireless Sensor Networks Using a Directional Antenna)

  • 홍성화;강봉직
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.111-118
    • /
    • 2010
  • 본 논문에서 제안한 방법은 지향성 안테나를 이용한 위치인식 기법이다. 여기서 앵커 노드는 GPS모듈, 섹터안테나, 그리고 디지털 나침반을 이용하여 각 섹터의 방위각을 전송 할 수 있는 능력을 가지고 있다고 가정한다. 기존의 센서네트워크에서 위치인식 알고리즘은 대부분이 센서 노드들이 고정되어 있는 환경에서 위치 값을 알고 있는 앵커 노드의 최소 3개의 위치 값을 알아야 센서의 위치추정을 하였다. 하지만 본 논문에서는 센서 노드를 부착하고 계속적으로 움직이는 노드들의 위치를 추정하는 위치인식 알고리즘들을 제안하였다. 제안한 알고리즘은 Matlab을 이용하여 시뮬레이션하였다. 시뮬레이션한 결과는 제안한 기법이 다른 기법 (MCL, DV-distance)들 보다 우수함을 보여주었다.

대용량 네트워크 압축 기반 클러스터링 알고리즘 개발 (Development of Clustering Algorithm based on Massive Network Compression)

  • 서동민;유석종;이민호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.53-54
    • /
    • 2016
  • 빅데이터란 대용량 데이터 활용 및 분석을 통해 가치 있는 정보를 추출하고, 이를 바탕으로 대응 방안 도출 또는 변화를 예측하는 기술을 의미한다. 그리고 빅데이터 분석에 활용되는 데이터인 페이스북과 같은 소셜 데이터, 유전자 발현과 같은 바이오 데이터, 항공망과 같은 지리정보 데이터들은 대용량 네트워크로 구성되어 있다. 네트워크 클러스터링은 서로 유사한 특성을 갖는 네트워크 내의 데이터들을 동일한 클러스터로 묶는 기법으로 네트워크 데이터를 분석하고 그 특성을 파악하는데 폭넓게 사용된다. 최근 빅데이터가 다양한 분야에서 활용되면서 방대한 양의 네트워크 데이터가 생성되고 있고, 이에 따라서 대용량 네트워크 데이터를 효율적으로 처리하는 클러스터링 기법의 중요성이 증가하고 있다. MCL(Markov Clustering) 알고리즘은 플로우 기반 무감독(unsupervised) 클러스터링 알고리즘으로 확장성이 우수해 다양한 분야에서 활용되고 있다. 하지만, MCL은 대용량 네트워크에 대해서는 많은 클러스터링 연산을 요구하며 너무 많은 클러스터를 생성하는 문제를 갖는다. 본 논문에서는 네트워크 압축을 기반으로 한 클러스터링 알고리즘을 제안함으로써 MCL보다 클러스터링 속도와 정확도를 향상시켰다. 또한, 희소행렬을 효율적으로 저장하는 CSC(Compressed Sparse Column) 자료구조와 MapReduce 기법을 제안한 클러스터링 알고리즘에 적용함으로써 대용량 네트워크에 대한 클러스터링 속도를 향상시켰다.

  • PDF

외부 센서를 이용한 이동 로봇 실내 위치 추정 (Indoor Localization of a Mobile Robot Using External Sensor)

  • 고낙용;김태균
    • 제어로봇시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.420-427
    • /
    • 2010
  • This paper describes a localization method based on Monte Carlo Localization approach for a mobile robot. The method uses range data which are measured from ultrasound transmitting beacons whose locations are given a priori. The ultrasound receiver on-board a robot detects the range from the beacons. The method requires several beacons, theoretically over three. The method proposes a sensor model for the range sensing based on statistical analysis of the sensor output. The experiment uses commercialized beacons and detector which are used for trilateration localization. The performance of the proposed method is verified through real implementation. Especially, it is shown that the performance of the localization degrades as the sensor update rate decreases compared with the MCL algorithm update rate. Though the method requires exact location of the beacons, it doesn't require geometrical map information of the environment. Also, it is applicable to estimation of the location of both the beacons and robot simultaneously.

Bayesian Survival Analysis of High-Dimensional Microarray Data for Mantle Cell Lymphoma Patients

  • Moslemi, Azam;Mahjub, Hossein;Saidijam, Massoud;Poorolajal, Jalal;Soltanian, Ali Reza
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권1호
    • /
    • pp.95-100
    • /
    • 2016
  • Background: Survival time of lymphoma patients can be estimated with the help of microarray technology. In this study, with the use of iterative Bayesian Model Averaging (BMA) method, survival time of Mantle Cell Lymphoma patients (MCL) was estimated and in reference to the findings, patients were divided into two high-risk and low-risk groups. Materials and Methods: In this study, gene expression data of MCL patients were used in order to select a subset of genes for survival analysis with microarray data, using the iterative BMA method. To evaluate the performance of the method, patients were divided into high-risk and low-risk based on their scores. Performance prediction was investigated using the log-rank test. The bioconductor package "iterativeBMAsurv" was applied with R statistical software for classification and survival analysis. Results: In this study, 25 genes associated with survival for MCL patients were identified across 132 selected models. The maximum likelihood estimate coefficients of the selected genes and the posterior probabilities of the selected models were obtained from training data. Using this method, patients could be separated into high-risk and low-risk groups with high significance (p<0.001). Conclusions: The iterative BMA algorithm has high precision and ability for survival analysis. This method is capable of identifying a few predictive variables associated with survival, among many variables in a set of microarray data. Therefore, it can be used as a low-cost diagnostic tool in clinical research.