• 제목/요약/키워드: model-based cluster

검색결과 638건 처리시간 0.026초

이분산 상황 하에서 정규혼합모형 기반 군집분석의 변수선택 (Variable Selection in Normal Mixture Model Based Clustering under Heteroscedasticity)

  • 김승구
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1213-1224
    • /
    • 2011
  • 관측치의 개수보다 변량의 개수가 더 많은 다변수 상황에서 정규혼합모형을 이용하여 군집분석을 하기 위해서는 비정보적인 변수들을 제거하는 과정이 필수적으로 요구된다. 이와 같은 변수선택과 군집의 동시 처리를 위한 기존 연구의 대부분은 군집별 등분산 가정 하에서 이루어져 왔으며, 비정보적인 변수를 제거하기 위해 주로 벌점화 우도 기법이 이용되었다. 본 연구에서는 약간 변형된 정규혼합모형을 기반으로 비현실적인 등분산 가정을 탈피하면서 효율적으로 비정보적인 변수를 제거하는 새로운 방법을 제공한다. 이 모형에 대한 타당성을 설명하였고, 모수 추정을 위한 EM 알고리즘을 유도하였다. 그리고 모의실험 및 실자료 실험을 통해 제안된 방법의 유효성을 보였다.

Morphological Traits of Lotus japonicus (Regal) Ecotypes Collected in Japan

  • Hashiguchi, Masatsugu;Tsuruta, Shin-Ichi;Akashi, Ryo
    • Interdisciplinary Bio Central
    • /
    • 제3권1호
    • /
    • pp.4.1-4.7
    • /
    • 2011
  • Forty-seven wild accessions of Lotus japonicus Regal (Japanese trefoil) indigenous to Japan were investigated for nine morphological characters. Average temperature and annual precipitation were negatively correlated with stem color and seed weight. On the other hand, latitude was positively correlated with these traits. Consequently, accessions from sites at higher latitudes with low temperatures and precipitation tend to have dark red stems and heavy seeds. Cluster analysis based on nine morphological characters classified 47 wild accessions into six major groups. Cluster I included four accessions of tall and erect plants. These plants are phenotypically similar to commercial variety 'Empire'. Cluster II consisted of three accessions of creep plants with pale red stems. Cluster III contained 24 accessions that had average values for all morphological characters evaluated. Cluster IV included two accessions of erect plants with rounded leaflets and dark red stems. Cluster V included four accessions of small, creep plants with pale red stems. Cluster VI included seven accessions of small and erect plants, a phenotype that also applies to ?Gifu B-129?, which is used as experimental strain worldwide. These data were deposited into LegumeBase, an online database (http://www.legumebase.brc.miyazaki-u.ac.jp/) supported by the National BioResource Project (NBRP) in Japan.

사용편의성 모델수립을 위한 제품 설계 변수의 선별방법 : 유전자 알고리즘 접근방법 (A Method for Screening Product Design Variables for Building A Usability Model : Genetic Algorithm Approach)

  • 양희철;한성호
    • 대한인간공학회지
    • /
    • 제20권1호
    • /
    • pp.45-62
    • /
    • 2001
  • This study suggests a genetic algorithm-based partial least squares (GA-based PLS) method to select the design variables for building a usability model. The GA-based PLS uses a genetic algorithm to minimize the root-mean-squared error of a partial least square regression model. A multiple linear regression method is applied to build a usability model that contains the variables seleded by the GA-based PLS. The performance of the usability model turned out to be generally better than that of the previous usability models using other variable selection methods such as expert rating, principal component analysis, cluster analysis, and partial least squares. Furthermore, the model performance was drastically improved by supplementing the category type variables selected by the GA-based PLS in the usability model. It is recommended that the GA-based PLS be applied to the variable selection for developing a usability model.

  • PDF

6-도메인 스마트팩토리 성숙도 평가 모델 기반 도입기업 군집분석 (Cluster analysis of companies introducing smart factory based on 6-domain smart factory maturity assessment model)

  • 정도현;안정현;최상현
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.219-227
    • /
    • 2020
  • 스마트팩토리는 가장 빠르게 발전하고 변화하는 4차 산업혁명 분야 중 하나이다. 스마트팩토리에서 도입정도와 성숙도 수준 평가는 중요한 부분에 해당한다. 본 논문에서는 국내 스마트팩토리를 도입한 중소기업들을 대상으로 설문 조사를 진행한 데이터를 바탕으로 스마트팩토리 도입 현황과 새로운 성숙도 평가 모델 기반 군집분석을 진행하였다. 설문에 응한 스마트팩토리 도입 기업의 약 68% 기업들이 기초수준에 해당하였고, 21% 정도만이 중간1 수준이었다. 대다수 중소기업들이 중간1로 진입하지 못한 가장 큰 이유로 자금부족을 꼽았다. 군집분석 결과, 군집별 패턴은 유사하지만 정도의 차이에 따라 '상, 중, 하' 3개로 군집됨을 확인할 수 있었고, 6 도메인 중 프로세스가 상대적으로 성숙도가 가장 높았고, 데이터가 가장 낮은 수준을 보였다. 이를 통해 6개 도메인 기반 새로운 스마트팩토리 성숙도 평가 모델을 활용하여, 보다 구체적이고 정량적인 성숙도 수준 측정 및 분석이 가능함을 보였다.

서버 클러스터 환경에서 에너지 절약을 위한 향상된 서버 전력 소비 추정 모델 (An Improved Estimation Model of Server Power Consumption for Saving Energy in a Server Cluster Environment)

  • 김동준;곽후근;권희웅;김영종;정규식
    • 정보처리학회논문지A
    • /
    • 제19A권3호
    • /
    • pp.139-146
    • /
    • 2012
  • 서버 클러스터 환경에서 에너지 절약을 위한 방법 중 하나는 서버의 전원을 트래픽 상황에 맞게 제어하는 전원 제어 기술이다. 이는 현재 데이터 센터의 전체 에너지 사용량과 각 서버의 에너지 사용량을 파악하여 적절하게 ON/OFF 상태로 관리하는 기술이다. 이를 위해서 각 서버의 전력을 효과적으로 추정하는 방식이 필요한데, 본 논문에서는 비용 면과 에너지 면에서 효율적인 소프트웨어 방식의 추정 모델을 사용하여 전력을 추정한다. 또한 기존의 전력 추정 모델은 CPU의 유휴(idle) 사용량만을 사용함으로써 현재 서버의 세부적인 CPU 상태나 I/O 장치의 사용량을 정확히 파악하지 못하고, 이는 해당 서버의 전력을 효과적으로 추정하지 못하는 단점으로 이어진다. 본 논문에서는 CPU의 다양한 상태 필드를 활용하여 서버의 CPU 및 시스템의 전반적인 상태를 보다 정확히 파악하고, 이에 따라 서버의 전력을 기존의 두 소비전력 추정 모델(CPU/디스크/메모리 기반의 전력 소비 추정 모델 및 CPU 유휴값 기반의 전력 소비 추정 모델)보다 정확히 측정하는 CPU 필드(field) 기반의 전력 추정 모델을 제안한다. 2대의 서버를 사용하여 실험을 수행하였으며, 전력계를 통해 측정한 실제 전력과 각 추정 모델의 추정 값을 비교하여 평균 오차율을 계산하였다. 실험 결과 기존 소비전력 추정 모델이 평균 8-15%대의 오차율을 보이는 반면, 본 논문에서 제안하는 서버 전력 추정 모델은 2%대의 오차율을 보여 주었다.

PC 클러스터를 위한 정렬 중첩 격자의 병렬처리 (PARALLEL IMPROVEMENT IN STRUCTURED CHIMERA GRID ASSEMBLY FOR PC CLUSTER)

  • 김유진;권장혁
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2005년도 추계 학술대회논문집
    • /
    • pp.157-162
    • /
    • 2005
  • Parallel implementation and performance assessment of the grid assembly in a structured chimera grid approach is studied. The grid assembly process, involving hole cutting and searching donor, is parallelized on the PC cluster. A message passing programming model based on the MPI library is implemented using the single program multiple data(SPMD) paradigm. The coarse-grained communication is optimized with the minimized memory allocation because that the parallel grid assembly can access the decomposed geometry data in other processors by only message passing in the distributed memory system such as a PC cluster. The grid assembly workload is based on the static load balancing tied to flow solver. A goal of this work is a development of parallelized grid assembly that is suited for handling multiple moving body problems with large grid size.

  • PDF

섹터기반 무선전력 센서 네트워크를 위한 최적 클러스터 헤드 선택 방법 (Optimal Cluster Head Selection Method for Sectorized Wireless Powered Sensor Networks)

  • Choi, Hyun-Ho
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.176-179
    • /
    • 2022
  • In this paper, we consider a sectorized wireless powered sensor network (WPSN), wherein sensor nodes are clustered based on sectors and transmit data to the cluster head (CH) using energy harvested from a hybrid access point. We construct a system model for this sectorized WPSN and find optimal coordinates of CH that maximize the achievable transmission rate of sensing data. To obtain the optimal CH with low overhead, we perform an asymptotic geometric analysis (GA). Simulation results show that the proposed GA-based CH selection method is close to the optimal performance exhibited by exhaustive search with a low feedback overhead.

(n,k) 클러스터 웹서버 시스템의 작업전이를 고려한 소프트웨어 재활기법의 가용도 분석 (Availability Analysis of (n,k) Cluster Web Server System using Software Rejuvenation Method over Switchover)

  • 강창훈
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권2호
    • /
    • pp.227-234
    • /
    • 2002
  • 클러스터 웹서버 시스템에서는 다수 서버의 장애로 인해 발생하는 가용도 저하 문제와 소프트웨어의 노화로 인하여 높은 성능과 가용도를 제공하기 쉽지 않다. 본 연구에서는 n대의 주 서버와 k대의 여분서버로 구성되는 클러스터 웹 서버 시스템에 성능과 작업전이 시간을 고려한 소프트웨어 재활 모델을 제시하였고 다양한 시스템 운영 파라미터에 기초하여 소프트웨어의 재활정책에 대한 평가를 위해 평형 상태에서의 확률, 가용도, 손실비용 등을 계산하였다. 수학적 분석을 통해 다양한 시스템 운영 상태에 대한 실험을 통해 검증하였으며, 소프트웨어의 재활 정책에 의한 예방적 결함허용 기법이 시스템의 안정성에 중요한 요소임을 확인하였다.

  • PDF

클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링 (Data Modeling using Cluster Based Fuzzy Model Tree)

  • 이대종;박진일;박상영;정남정;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.608-615
    • /
    • 2006
  • 본 논문에서는 퍼지 클러스터 기법을 이용하여 구간 분할된 퍼지 모델트리의 제안과 이를 이용한 데이터 모델링 기법을 다룬다. 제안된 방법은 먼저 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 노드의 확장은 부모노드(parent node)에서 만들어진 모델에서 계산된 오차값과 자식노드(child node)에서 계산된 오차값을 비교하여 이루어진다. 출력값 예측 단계에서는 입력된 데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 선형모델을 선택하여 데이터에 대한 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 데이터를 대상으로 실험한 결과, 기존의 모델트리방식 및 뉴럴 네트워크 기반의 신경회로망 보다 향상된 성능을 보임을 알 수 있었다.

블랙박스 영상 기반 고속도로 사고유형 분류 및 사고 심각도 예측 평가 (Classification and Prediction of Highway Accident Characteristics Using Vehicle Black Box Data )

  • 조준한;이성준;박성민;박준영
    • 한국ITS학회 논문지
    • /
    • 제21권6호
    • /
    • pp.132-145
    • /
    • 2022
  • 본 연구는 고속도로에서 발생한 교통사고 블랙박스 영상을 기반으로 군집분석과 예측모형 비교를 수행하였다. 분석자료로 사고 직전의 도로 및 교통 상황을 파악할 수 있는 차량 주행행태, 노면 상태 등 사고 영상에서 추출이 가능한 항목을 설명변수로 활용하였다. 여러 요소에 의해 영향을 받는 교통사고 데이터의 특징을 고려하여 데이터의 이질성을 반영하는 군집분석을 활용하였다. 군집분석으로 분류된 각 군집을 사고 심각도 수준의 비율을 기준으로 나누고, 종속변수인 인명피해 수준을 반영하여 사고 예측 평가를 수행하였다. 사고 예측모형은 로짓 모형(Logit model)을 적용한 결과, 전체 데이터를 분석한 경우보다 군집분석에 의해 두 개의 사고 심각도 그룹을 분류하여 예측했을 때 우수한 예측 능력을 보여주었다. 이는 군집분석을 통한 그룹별 사고 특성과 사고 심각도를 반영하여 사고위험을 예측하는 것이 더 효과적인 것으로 판단된다. 또한 2차 사고와 같은 정차 중 추돌사고, 차로변경 중 측면 추돌사고 등이 중요한 주행행태변수로 작용하는 것으로 나타났다.