• Title/Summary/Keyword: Clustering Problem

검색결과 708건 처리시간 0.021초

서픽스트리 클러스터링 방법과 블라스트를 통합한 유전자 서열의 클러스터링과 기능검색에 관한 연구 (A Study on Clustering and Identifying Gene Sequences using Suffix Tree Clustering Method and BLAST)

  • 한상일;이성근;김경훈;이주영;김영한;황규석
    • 제어로봇시스템학회논문지
    • /
    • 제11권10호
    • /
    • pp.851-856
    • /
    • 2005
  • The DNA and protein data of diverse species have been daily discovered and deposited in the public archives according to each established format. Database systems in the public archives provide not only an easy-to-use, flexible interface to the public, but also in silico analysis tools of unidentified sequence data. Of such in silico analysis tools, multiple sequence alignment [1] methods relying on pairwise alignment and Smith-Waterman algorithm [2] enable us to identify unknown DNA, protein sequences or phylogenetic relation among several species. However, in the existing multiple alignment method as the number of sequences increases, the runtime increases exponentially. In order to remedy this problem, we adopted a parallel processing suffix tree algorithm that is able to search for common subsequences at one time without pairwise alignment. Also, the cross-matching subsequences triggering inexact-matching among the searched common subsequences might be produced. So, the cross-matching masking process was suggested in this paper. To identify the function of the clusters generated by suffix tree clustering, BLAST was combined with a clustering tool. Our clustering and annotating tool is summarized as the following steps: (1) construction of suffix tree; (2) masking of cross-matching pairs; (3) clustering of gene sequences and (4) annotating gene clusters by BLAST search. The system was successfully evaluated with 22 gene sequences in the pyrubate pathway of bacteria, clustering 7 clusters and finding out representative common subsequences of each cluster

클러스터링 알고리즘기반의 상황인식 사용자 분석 (Context-awareness User Analysis based on Clustering Algorithm)

  • 이강환
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.942-948
    • /
    • 2020
  • 본 논문에서는 상황인식 속성정보를 이용하여 클러스터링내에서 보다 효율적인 사용자 구분이 가능한 군집적 알고리즘을 제안한다. 일반적으로 클러스터링 데이터를 처리함에 있어 군집 정보내에서 상호관계를 분류하기 위해 제공되는 데이터는 신규 또는 새롭게 입력되는 정보가 비교정보에서 오염된 정보로 처리될 경우, 기존 분류된 군집으로부터 벗어나게 되어 군집성을 저하시키는 요인으로 작용하게 된다. 본 논문에서는 이러한 문제를 해결하기 위해 K-means알고리즘을 이용함에 있어 사용자 인식 정보 추출이 가능한 사용자 군집 분석 방식을 제안하고자 한다. 제안하는 알고리즘은 시스템 내 누적된 정보를 이용하여 자율적인 사용자 군집 특징을 분석하고, 이를 통하여 사용자의 속성간에 따른 클러스터를 구성해 사용자를 구분하게 된다. 제안한 알고리즘은 적용한 모의실험 결과를 통해 다중 사용자를 군집단위로 분류하고 유지하는 측면에서 사용자 관리 시스템이 보다 향상된 적응성을 보여주었다.

통행시간 분포 기반의 전철역 클러스터링 (Metro Station Clustering based on Travel-Time Distributions)

  • 공인택;김동윤;민윤홍
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.193-204
    • /
    • 2022
  • 스마트교통카드 데이터는 대표적인 모빌리티 데이터로 이를 이용하여 대중교통 이용행태를 분석하고 정책 개발에 활용할 수 있다. 본 논문은 이러한 연구의 하나로 전철 이용패턴을 이용하여 전철역들을 분류하는 문제를 다룬다. 전철역의 클러스터링을 다룬 기존 논문들은 이용행태 중 통행량만을 고려하였기에 본 논문은 이에 대한 보완적인 방법의 하나로 통행시간을 고려한 클러스터링을 제안한다. 각 역의 승객들을 출근 시간 출발, 출근 시간 도착, 퇴근 시간 출발, 퇴근 시간 도착 승객들로 분류한 다음 각각의 통행시간을 와이블 분포로 모형화하여 추정한 형상모수를 역의 특성값으로 정의하였다. 그리고 특성 벡터들을 K-평균 클러스터링 기법을 사용하여 클러스터링하였다. 실험결과 통행시간을 고려하여 역의 클러스터링을 수행하면 기존 연구의 클러스터링 결과와 유사한 결과가 나올 뿐만 아니라 더 세분화 된 클러스터링이 가능함을 관찰하였다.

Min-Distance Hop Count based Multi-Hop Clustering In Non-uniform Wireless Sensor Networks

  • Kim, Eun-Ju;Kim, Dong-Joo;Park, Jun-Ho;Seong, Dong-Ook;Lee, Byung-Yup;Yoo, Jae-Soo
    • International Journal of Contents
    • /
    • 제8권2호
    • /
    • pp.13-18
    • /
    • 2012
  • In wireless sensor networks, an energy efficient data gathering scheme is one of core technologies to process a query. The cluster-based data gathering methods minimize the energy consumption of sensor nodes by maximizing the efficiency of data aggregation. However, since the existing clustering methods consider only uniform network environments, they are not suitable for the real world applications that sensor nodes can be distributed unevenly. To solve such a problem, we propose a balanced multi-hop clustering scheme in non-uniform wireless sensor networks. The proposed scheme constructs a cluster based on the logical distance to the cluster head using a min-distance hop count. To show the superiority of our proposed scheme, we compare it with the existing clustering schemes in sensor networks. Our experimental results show that our proposed scheme prolongs about 48% lifetime over the existing methods on average.

최적화에 기반 한 데이터 클러스터링 알고리즘 (New Optimization Algorithm for Data Clustering)

  • 김주미
    • 지능정보연구
    • /
    • 제13권3호
    • /
    • pp.31-45
    • /
    • 2007
  • 대용량의 데이터 처리에 관한 문제는 데이터 마이닝 내 중요한 이슈 중의 하나이다. 특히 데이터 클러스터링과 같이 컴퓨터 시뮬레이션으로 인한 부하가 큰 경우 더더욱 그러하다. 그러나 대개 이러한 문제는 Random sampling 으로 어느 정도 해결이 가능하다. 문제는 이런 샘플링을 통해서 발생하는 noise의 해결이다. 본 논문에서는 그러한 noise문제를 극복할 수 있도록 설계된 새로운 데이터클러스터링 알고리즘을 소개한다. 기존의 데이터 클러스팅 알고리즘과의 컴퓨터 비교 실험을 통해 본 알고리즘의 우수성을 밝혔으며 아울러 더 나아가 데이터 set의 일부만을 사용한 시뮬레이션 결과를 통해, 해의 정확도와 상관없이 실험 시간 또한 단축되었음을 보여주고 있다.

  • PDF

한글 위키피디아를 이용한 트위터 문서의 주제별 클러스터링 기법 (Topical Clustering Techniques of Twitter Documents Using Korean Wikipedia)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.189-196
    • /
    • 2014
  • 최근 들어 트위터와 같은 SNS 환경에서 검색의 필요성이 증가하고 있다. 트위터 검색을 지원하기 위해서는 다량으로 검색된 문서를 주제별로 분류하는 클러스터링 기법이 필요하다. 하지만 트위터의 특성상 단순한 클러스터링 기술을 그대로 적용하기에는 많은 제약이 따른다. 본 논문에서는 이를 극복하기 위해 트위터 환경에 적합한 클러스터링 기법을 제안한다. 제안된 기법에서는 한글 위키피디아를 이용하여 각 트위터 문서에 대한 특징 벡터를 보강하고 각 특징들의 가중치를 재계산하는 방법을 이용하였다. 또한 한글 트위터 문서를 대상으로 실험을 실시하고 기존 기법과의 성능 비교를 통해서 제안된 기법의 유용성을 증명하였다.

스케줄링 문제를 위한 멀티로봇 위치 기반 다목적 유전 알고리즘 (Multi-Objective Genetic Algorithm based on Multi-Robot Positions for Scheduling Problems)

  • 최종훈;김제석;정진한;김정민;박장현
    • 한국정밀공학회지
    • /
    • 제31권8호
    • /
    • pp.689-696
    • /
    • 2014
  • This paper presents a scheduling problem for a high-density robotic workcell using multi-objective genetic algorithm. We propose a new algorithm based on NSGA-II(Non-dominated Sorting Algorithm-II) which is the most popular algorithm to solve multi-objective optimization problems. To solve the problem efficiently, the proposed algorithm divides the problem into two processes: clustering and scheduling. In clustering process, we focus on multi-robot positions because they are fixed in manufacturing system and have a great effect on task distribution. We test the algorithm by changing multi-robot positions and compare it to previous work. Test results shows that the proposed algorithm is effective under various conditions.

A Fuzzy Clustering Method based on Genetic Algorithm

  • Jo, Jung-Bok;Do, Kyeong-Hoon;Linhu Zhao;Mitsuo Gen
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.1025-1028
    • /
    • 2000
  • In this paper, we apply to a genetic algorithm for fuzzy clustering. We propose initialization procedure and genetic operators such as selection, crossover and mutation, which are suitable for solving the problems. To illustrate the effectiveness of the proposed algorithm, we solve the manufacturing cell formation problem and present computational comparisons to generalized Fuzzy c-Means algorithm.

  • PDF

복수물류센터에 대한 VRP 및 GA-TSP의 개선모델개발 (Improved VRP & GA-TSP Model for Multi-Logistics Center)

  • 이상철;류정철
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1279-1288
    • /
    • 2007
  • 시간제한을 가지는 차량경로문제는 배송 및 물류에서 가장 중요한 문제 중의 하나이다. 실제적으로 고객의 서비스를 위하여 주어진 시간 안에 출발해서 배송을 끝마쳐야 한다. 본 연구는 복수 물류센터의 최적차량경로문제를 위하여 유전자 알고리즘을 이용한 2단계 접근방법을 사용한 VRP(Vehicle Routing Problem)모델의 개발이다. 1단계로 구역별로 Clustering한 것은 복수 물류센터의 문제를 쉽게 해결하기 위해 단일 물류센터의 문제로 전환하여 모델을 개발하였다. 2단계로 시간제한을 가지는 최적차량경로를 찾을 수 있는 개선된 유전자 알고리즘을 이용하여 GA-TSP(Genetic Algorithm-Traveling Salesman Problem)모델을 개발하였다. 따라서 본 연구에서 개발한 Network VRP는 ActiveX와 분산객체기술을 이용한 VRP문제의 해를 구하기 위한 전산프로그램을 개발한다.

  • PDF

IAFC 모델을 이용한 영상 대비 향상 기법 (An Image Contrast Enhancement Technique Using Integrated Adaptive Fuzzy Clustering Model)

  • 이금분;김용수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.279-282
    • /
    • 2001
  • This paper presents an image contrast enhancement technique for improving the low contrast images using the improved IAFC(Integrated Adaptive Fuzzy Clustering) Model. The low pictorial information of a low contrast image is due to the vagueness or fuzziness of the multivalued levels of brightness rather than randomness. Fuzzy image processing has three main stages, namely, image fuzzification, modification of membership values, and image defuzzification. Using a new model of automatic crossover point selection, optimal crossover point is selected automatically. The problem of crossover point selection can be considered as the two-category classification problem. The improved MEC can classify the image into two classes with unsupervised teaming rule. The proposed method is applied to some experimental images with 256 gray levels and the results are compared with those of the histogram equalization technique. We utilized the index of fuzziness as a measure of image quality. The results show that the proposed method is better than the histogram equalization technique.

  • PDF