• 제목/요약/키워드: 진화 클러스터링 알고리즘

검색결과 32건 처리시간 0.026초

휴리스틱 진화 알고리즘을 이용한 클러스터링 알고리즘 (A Clustering Algorithm based on Heuristic Evolution Algorithm)

  • 강명구;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.78-80
    • /
    • 2000
  • 클러스터링이란 주어진 데이터들을 유사한 성질을 가지는 군집으로 나누는 것으로 많은 분야에서 응용되고 있으며, 특히 최근 관심의 대상인 데이터 마이닝의 중요한 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 가지고 있다. 본 논문에서는 병렬 탐색을 통해 최적해를 찾는 진화알고리즘을 사용하여 지역적 최적해에 수렴되는 문제점을 개선하였으며, 자동으로 적절한 클러스터 개수를 결정할 수 있게 하였다. 또한 진화알고리즘의 단점인 탐색공간의 확대에 따른 탐색시간의 증가는 휴리스틱 연산을 정의하여 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 가우시안 분포 데이터를 사용하여 제안한 알고리즘의 성능이 우수함을 보였다.

  • PDF

진화 프로그램을 이용한 효율적인 퍼지 클러스터링 알고리즘 (Effective Fuzzy Clustering Algorithm Using Evolution Program)

  • 정창호;박주영;박대희
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.139-142
    • /
    • 1997
  • 본 논문에서는 기존 FCM(Fuzzy C-Means) 타입 클러스터링 알고리즘의 선은 향상을 위한 설계 방법을 제시한다. 우선 클러스터의 응집성(compactness)과 분리성(separation)을 동시에 고려한 성능 지수를 정의하고, 이를 진화 프로그램을 통하여 최적화 한다. 또한 실험을 통하여 기존 연구들과의 비교 및 제안된 방법론의 유효성을 보인다.

  • PDF

진화알고리즘을 이용한 클러스터링 알고리즘 (A Clustering Algorithm using the Genetic Algorithm)

  • 류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.313-315
    • /
    • 2000
  • 클러스터링에 있어서 K-means와 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최소 해에 수렴될 문제와 사전에 클러스터 개수를 결정해야 하는 문제점을 가지고 있다. 본 논문에서는 병렬 탐색을 통해 최적 해를 찾는 진화 알고리즘을 사용하여 지역적 최소 해에 수렴되는 문제점을 개선하였으며, 클러스터의 특성을 표준편차 벡터를 계산하여 중심으로부터 포함된 데이터가 얼마나 분포되어 있는지 알 수 있는 분산도와 임의의 데이터와 모든 중심들간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터간의 간격을 알 수 있는 분리도를 정의함으로써 자동으로 클러스터 개수를 결정할 수 있게 하였다. 실험데이터와 가우시안 분포에 의해 생성된 다차원 실험데이터를 사용하여 제안한 알고리즘이 이러한 문제점들을 해결하고 있음을 보인다.

  • PDF

유전자 발현 분석을 위한 공진화적 바이클러스터링 기법 (Gene Expression Analysis by Co-evolutionary Biclustering)

  • 정제균;김수진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.22-24
    • /
    • 2006
  • 마이크로어레이는 전체 유전체 수준의 mRNA 발현 여부에 대한 측정이 가능하다는 점에서 분자생물학의 실험 도구로서 가장 강력한 도구 중에 하나로 부각되어 있다. 현재까지 마이크로어래이의 결과로부터 유사한 발현 패턴을 찾기 위한 여러 가지 바이클러스터링 알고리즘들이 개발되어 왔다. 하지만 대다수의 알고리즘들이 최적의 바이클러스터들을 찾기보다는 일정 수준의 가능한 바이클러스터의 결과만을 제시하고 있다. 본 논문에서는 다른 개체집단들과 상호 진화하는 공진화적 학습에 의한 진화연산 기법을 통하여 유전자-조건의 매트릭스로부터 열과 행을 동시에 클러스터링하는 공진화적 바이클러스터링 알고리즘(co-evolutionary biclustering algorithm: CBA)을 제안하고자 한다. CBA는 유전자발현 데이터에서 유전자-조건의 상호의존적인 부성분들로 구성된 최적화 문제에 적합한 계산방식이라고 할 수 있다. 인간 유전자 발현 데이터에 대한 실험 결과. 제시한 알고리즘은 이전의 알고리즘에 비해 발견한 바이클러스터의 패턴 유사도에 있어서 우수한 성능을 보이고 있다.

  • PDF

다양한 클러스터 결과에 의해 진화적 접근법을 사용하는 이종 클러스터링 앙상블 기법 (Heterogeneous Clustering Ensemble Method using Evolutionary Approach with Different Cluster Results)

  • 윤혜성;안선영;이상호;조성범;김주한
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.16-18
    • /
    • 2006
  • 데이터마이닝 기법의 클러스터링 알고리즘은 생물정보학에서 데이터 셋의 사전 정보를 고려하지 않고 중요한 유전적, 생물학적 상호작용을 찾기 위하여 적용되고 있다. 그러나 다양한 형식의 수많은 알고리즘들은 바이오데이터의 다양한 특성들과 실험의 가정 때문에 다른 클러스터링 결과들을 만들 수 있다. 본 논문에서는 바이오 데이터 셋의 특성에도 적합하면서 양질의 클러스터링 결과를 만들기 위한 새로운 방법을 제안한다. 이 방법은 여러 가지 클러스터링 알고리즘의 결과들을 유전자 알고리즘의 기본 개념인 진화적 환경에서 가장 적합한 형질을 선택하는 문제와 결합하였다. 그리고 실제 데이터 셋을 이용하여 우리의 제안하는 방법을 증명하고 실험 결과로 최적의 클러스터 결과를 보인다.

  • PDF

물류 센터 위치 선정 및 대리점 할당 모형에 대한 휴리스틱 해법 (Meta-heuristic Method for the Single Source Capacitated Facility Location Problem)

  • 석상문;이상욱
    • 한국콘텐츠학회논문지
    • /
    • 제10권9호
    • /
    • pp.107-116
    • /
    • 2010
  • 시설물 입지 선정 문제(FLP)는 전통적인 최적화 문제중에 하나이다. FLP에 공급제약과 하나의 고객은 하나의 시설물에서만 제품을 공급받을 수 있다는 제약을 추가하면 단일 시설물 공급제약을 가지는 시설물 위치 설정 문제(SSFLP)가 된다. SSFLP는 NP-hard 문제로 알려져 있으며 진화 알고리즘과 같은 휴리스틱 알고리즘을 사용하여 해결하는 것이 일반적이다. 본 논문에서는 SSFLP를 위한 효율적인 진화 알고리즘을 제안한다. 제안하는 알고리즘은 적응형 링크 조절 진화 알고리즘과 3가지 휴리스틱 해 개선 방법을 조합하여 고안되었다. 제안하는 알고리즘을 벤치마크 문제에 적용하여 다른 알고리즘과 성능을 비교분석해 본 결과, 제안하는 알고리즘은 중간 크기의 문제에서 대부분 최적해를 찾았으며 큰 문제에서도 안정된 결과를 보여주었다.

진화론적으로 최적화된 Context-based RBF 뉴럴 네트워크 설계 (Design of Genetically Optimized Context-based RBFNN)

  • 박호성;오성권;김현기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2009년도 정보 및 제어 심포지움 논문집
    • /
    • pp.258-260
    • /
    • 2009
  • 본 논문에서는 최적화 알고리즘인 유전자 알고리즘과 context-based FCM 클러스터링 방법을 이용하여 새로운 형태의 RBF 뉴럴 네트워크의 포괄적인 설계 방법론을 소개한다. 제안된 구조는 클러스터링 기법을 기반하여 사용된 데이터의 특성에 효과적인 모델을 구축하고자 한다. 또한 유전자 알고리즘을 이용하여 모델의 최적화에 주요한 영향을 미치는 파리미터들(-은닉층에서의 contex의 수, contex에 포괄되는 노드의 수, 그리고 contex에 입력되는 입력변수)을 동조한다. 제안된 모델의 설계 공정은 1) K-means 클러스터링을 통한 context fuzzy set에 대한 정의와 설계, 2) context-based fuzzy clustering에 대한 모델의 적용과 이에 따른 모델 구축의 효율성, 3) 유전자 알고리즘을 통한 모델 최적화를 위한 파라미터들의 최적화와 같은 단계로 구성되어 있다. 구축된 RBF 뉴럴 네트워크의 후반부 다항식에 대한 parameter들은 성능지수를 최소화하기 위해 Least Square Method에 의해서 보정된다. 본 논문에서는 모델을 설계함에 있어서 체계적인 설계 알고리즘을 포괄적으로 설명하고 있으며, 더 나아가 제안된 모델의 성능을 다른 표준적인 모델들과 대조함으로써 제안된 모델의 우수성을 나타내고자 한다.

  • PDF

진보된 유전자 알고리즘 이용하여 센서 네트워크의 에너지 소모를 최소화하는 클러스터링 기법 (A Clustering Technique to Minimize Energy Consumption of Sensor networks by using Enhanced Genetic Algorithm)

  • 서현식;오세진;이채우
    • 대한전자공학회논문지TC
    • /
    • 제46권2호
    • /
    • pp.27-37
    • /
    • 2009
  • 센서 네트워크를 구성하는 센서 노드들은 제한된 배터리 용량을 가지고 있으며 한번 배치되면 추가적인 에너지 공급이 어렵기 때문에 노드의 소비 전력을 최소화하기 위한 연구가 중요하다. 많은 연구 중 클러스터링 기법은 센서 네트워크에서 에너지 소비를 줄이기 위한 효과적인 기법중의 하나로 각광 받아왔다. 하지만, 클러스터링 기법은 클러스터의 수와 크기, 데이터전송에 참여하는 노드간의 거리등에 따라 에너지 절감 효과가 달라진다. 따라서 이러한 요인들을 최적화해야 클러스터링에 의한 에너지 절감 효과를 최대화할 수 있다. 본 연구에서는 확률적 최적해 탐색 기법인 유전자 알고리즘을 사용하여 센서 노드의 에너지 소비를 줄일 수 있는 최적의 클러스터를 찾는 것을 목적으로 한다. 유전자 알고리즘은 클러스터를 구성할 수 있는 수많은 경우의 수중에서 최적의 클러스터를 찾기 위해 진화의 과정을 거쳐 탐색을 수행한다. 따라서 진화 과정이 없는 LEACH와 같은 클러스터링 알고리즘보다 효과적일 수 있다. 본 연구에서 제안하는 2차원 염색체 유전자 알고리즘은 염색체내에 존재하는 각 노드에게 고유한 위치정보를 부여함으로써 기존 유전자 알고리즘보다 효율적인 유전자 진화를 수행할 수 있다. 그 결과, 센서 네트워크의 수명을 최대화 할 수 있는 최적의 클러스터를 빠르고 효과적으로 찾을 수 있다.

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

제조 시계열 데이터를 위한 진화 연산 기반의 하이브리드 클러스터링 기법 (Evolutionary Computation-based Hybird Clustring Technique for Manufacuring Time Series Data)

  • 오상헌;안창욱
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.23-30
    • /
    • 2021
  • 제조 시계열 데이터 클러스터링 기법은 제조 대용량 데이터 기반 군집화를 통한 설비 및 공정 이상 탐지 분류를 위한 중요한 솔루션이지만 기존 정적 데이터 대상 클러스터링 기법을 시계열 데이터에 적용함에 있어 낮은 정확도를 가지는 단점이 있다. 본 논문에서는 진화 연산 기반 시계열 군집 분석 접근 방식을 제시하여 기존 클러스터링 기술에 대한 정합성 향상하고자 한다. 이를 위하여 먼저 제조 공정 결과 이미지 형상을 선형 스캐닝을 활용하여 1차원 시계열 데이터로 변환하고 해당 변환 데이터 대상으로 Pearson 거리 매트릭을 기반으로 계층적 군집 분석 및 분할 군집 분석에 대한 최적 하위클러스터를 도출한다. 해당 최적 하위클러스터 대상 유전 알고리즘을 활용하여 유사도가 최소화되는 최적의 군집 조합을 도출한다. 그리고 실제 제조 과정 이미지 대상으로 기존 클러스터링 기법과 성능 비교를 통하여 제안된 클러스터링 기법의 성능 우수성을 검증한다.