• 제목/요약/키워드: K Means Algorithm

검색결과 1,364건 처리시간 0.028초

주변 확률을 고려하지 않는 확률적 흥미도 측도 계열 유사성 측도의 서열화 (A study on the ordering of PIM family similarity measures without marginal probability)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.367-376
    • /
    • 2015
  • 데이터마이닝 기법 중의 하나인 군집분석은 다양한 특성을 지닌 관찰대상에 대해 유사성을 바탕으로 동질적인 군집으로 묶은 후, 동일 군집에 속해 있는 공통된 특성을 조사하는데 이용되는 기법이다. 본 논문에서는 주변 확률을 고려하지 않는 확률적 흥미도 측도 기반 유사성 측도인 Yule I과 II, Michael, Digby, Baulieu, 그리고 Dispersion 측도에 대해 상한 및 하한을 설정함으로써 이들의 대소관계를 규명하였다. 그 결과, 세 가지 유형의 대소 관계가 성립한다는 사실을 수식의 증명뿐만 아니라 실제 데이터 및 모의실험 데이터에 의해서도 확인할 수 있었다. 이들 측도들은 각 경계에 있는 측도와는 더욱 더 유사한 값을 가지므로 각 측도의 상한 및 하한은 여러 가지 측도들을 분류하는 도구가 되며, 실제 값의 관점에서 각 측도들의 관계를 알게 되면 주어진 알고리즘의 안정화에 도움이 될 수 있을 것이다.

성능향상을 위하여 개체속력을 적용한 박테리아 협동 최적화 (Bacteria Cooperative Optimization Applying Individual's Speed for Performance Improvements)

  • 정성훈
    • 전자공학회논문지CI
    • /
    • 제47권3호
    • /
    • pp.67-75
    • /
    • 2010
  • 본 논문에서는 성능향상을 위하여 개체속력 개념을 적용한 박테리아 협동 최적화 방법을 제안한다. 기존의 박테리아 협동 최적화 방법에서는 개체별로 속력이 일정해 모든 개체가 같은 시간에 똑 같은 거리를 움직인다. 이러한 방법은 개체의 적합도가 좋은 개체나 나쁜 개체가 같은 속력으로 움직임으로서 효과적으로 최적 해를 찾아가지 못하는 문제점이 있었다. 이러한 문제점을 개선하고자 개체의 적합도를 이용하여 개체별 등급을 매기고 등급에 따라서 한 번에 이동할 수 있는 거리를 다르게 하는 속력 개념을 적용하였다. 즉 적합도가 낮은 개체는 적합도가 높은 영역으로 빨리 이동하기위하여 속력을 높이고 적합도가 높은 개체는 주변에 최적 해가 있을 가능성이 있으므로 속력을 낮게 유지하였다. 4개의 함수 최적화 문제에 적용해본 결과 속력개념을 적용하지 않은 방법에 대하여 상당한 성능향상이 있음을 보았다. 특히 성능향상을 위하여 기존에 도입했던 등급별 교체방법보다도 더 좋은 성능을 보였다. 이는 박테리아 협동 최적화의 성능을 향상시키기 위한 방법으로 속력개념을 적용하는 것이 매우 유용함을 보여준다.

비디오 감시시스템을 위한 영역 기반의 움직이는 물체 분할 (Region-Based Moving Object Segmentation for Video Monitoring System)

  • 이경미;김종배;이창우;김항준
    • 전자공학회논문지CI
    • /
    • 제40권1호
    • /
    • pp.30-38
    • /
    • 2003
  • 본 논문은 비디오 영상에서 움직이는 물체를 분할하는 방법을 제안한다. 물체들의 크기가 작거나 서로 겹쳐있을 경우(occlusion), 또는 잡음이 많은 경우에도 안정적인 이 방법은 움직임 검출(motion detection)과 움직임 분할(motion segmentation) 두 단계로 구성되어 있다. 움직임 검출을 하기 위하여 인접 영상간의 차영상(difference image) 분석을 통해 움직임이 있는 부분을 추출하며, 이때 적응적 임계치 방법을 이용하여 빛의 변화나 노이즈가 포함된 환경에서도 안정적으로 추출한다. 움직임 분할 단계에서는 움직임이 검출된 부분을 초기영역으로 분할 한 뒤, 이 영역들의 모션정보에 따라 이웃 한 영역들을 병합함으로써 독립적으로 움직이는 물체를 분할한다. 이러한 방법은 검출된 영역에 대해서만 움직임 분할을 함으로 많은 계산효과를 얻을 수 있으며 실제 도로영상에서 제안된 방법을 실험해본 결과 비디오 감시시스템에 적합함을 알 수 있었다.

병렬 타부 탐색을 이용한 발전기 기동정지계획의 최적화 (Optimization of Unit Commitment Schedule using Parallel Tabu Search)

  • 이용환;황준하;류광렬;박준호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.645-653
    • /
    • 2002
  • 발전기 기동정지 계획은 하나의 전력시스템을 형성하는 다수의 발전기에 대해서 주어진 여러 제약을 따르는 일간 또는 주간의 기동 및 정지시간을 결정하는 작업으로 다양한 제약과 방대한 탐색공간으로 인해 최적의 경제적 계획 수립이 매우 어려운 대규모 최적화 문제이다. 타부 탐색은 보통의 지역적 탐색법에 비해 국지적 최적해에 빠질 위험이 적고 다른 전역적 탐색기법에 비해 대상문제에 관한 지식을 충분히 활용하기에 유리하여 많은 최적화 문제에 사용되고 있다. 그러나 규모가 방대하면서 많은 제약조건이 존재하는 대규모 최적화 문제들은 타부 탐색으로도 빠른 시간내에 최적의 해를 찾아내기 힘들다. 본 논문은 대규모 최적화 문제의 하나인 발전기 기동정지 계획 문제를 타부 탐색의 병렬화를 통해 해결함으로써 탐색 소요시간의 단축과 함께 해의 질 또한 향상시킬 수 있음을 보여준다.

효율적인 계획 수립을 위한 동작-기반의 휴리스틱 (A Action-based Heuristics for Effective Planning)

  • 김현식
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6290-6296
    • /
    • 2015
  • 정보력이 높은 휴리스틱들은 해 계획을 찾기 위한 탐색을 보다 효율적으로 유도할 수 있다. 하지만 일반적으로, 계획 문제 명세로부터 이러한 정보력이 높은 휴리스틱을 추출하는 것은 매우 많은 계산 노력을 요구한다. 이러한 문제점들에 효과적으로 대처하기 위해서, 본 논문에서는 계획문제로부터 계획 수립을 보다 효율적으로 풀 수 있는 상태-동작 기반 계획 그래프와 동작-기반 휴리스틱을 제안한다. 상태-동작 기반 계획그래프는 계획문제 풀이를 위한 휴리스틱 계산에 이용되는 간략화된 계획그래프를 부속 목표와 목표조건들 간의 상호작용을 찾는데 적용할 수 있도록 확장한 자료구조로써, 상태-동작 기반 계획그래프를 이용하는 동작 기반 휴리스틱은 보다 효과적인 방법으로 부속 목표와 목표조건들 간의 상호작용을 찾아내고, 이들을 목표 도달 거리 계산에 이용한다. 따라서 동작-기반 휴리스틱은 종래의 최대 휴리스틱, 합산 휴리스틱 보다 더 높은 정보력을 가지며 겹침 휴리스틱보다 더 적은 계산 노력을 통해 동일한 결과를 얻을 수 있다. 본 논문에서는 동작-기반 휴리스틱을 계산하는 알고리즘을 제시하고, 동작-기반 휴리스틱의 정확성과 효율성을 알아보기 위한 실험적 분석에 대해 설명한다.

Automated Training from Landsat Image for Classification of SPOT-5 and QuickBird Images

  • Kim, Yong-Min;Kim, Yong-Il;Park, Wan-Yong;Eo, Yang-Dam
    • 대한원격탐사학회지
    • /
    • 제26권3호
    • /
    • pp.317-324
    • /
    • 2010
  • In recent years, many automatic classification approaches have been employed. An automatic classification method can be effective, time-saving and can produce objective results due to the exclusion of operator intervention. This paper proposes a classification method based on automated training for high resolution multispectral images using ancillary data. Generally, it is problematic to automatically classify high resolution images using ancillary data, because of the scale difference between the high resolution image and the ancillary data. In order to overcome this problem, the proposed method utilizes the classification results of a Landsat image as a medium for automatic classification. For the classification of a Landsat image, a maximum likelihood classification is applied to the image, and the attributes of ancillary data are entered as the training data. In the case of a high resolution image, a K-means clustering algorithm, an unsupervised classification, was conducted and the result was compared to the classification results of the Landsat image. Subsequently, the training data of the high resolution image was automatically extracted using regular rules based on a RELATIONAL matrix that shows the relation between the two results. Finally, a high resolution image was classified and updated using the extracted training data. The proposed method was applied to QuickBird and SPOT-5 images of non-accessible areas. The result showed good performance in accuracy assessments. Therefore, we expect that the method can be effectively used to automatically construct thematic maps for non-accessible areas and update areas that do not have any attributes in geographic information system.

클러스터링 기법을 활용한 출발 여객 체류 시간 분석 (Analysis of Departing Passengers' Dwell Time using Clustering Techniques)

  • 안덕배;김휘양;백호종
    • 한국항행학회논문지
    • /
    • 제23권5호
    • /
    • pp.380-385
    • /
    • 2019
  • 본 연구는 실제 공항에서 수집되는 여객 데이터를 활용하여 공항 내 여객의 체류 시간을 분석한 연구이다. 여객의 체류 시간은 공항 터미널 설계, 공항의 수익성에 영향을 주어 중요한 여객 특성으로 간주되어 왔지만 실제 여객 데이터 수집의 어려움으로 그에 대한 분석이나 실시간 공항 운영에 활용하기가 어려웠다. 하지만 스마트 공항의 일환으로 세계 유수의 공항에서 방대한 양의 여객 데이터를 수집하고 있고, 축적된 데이터를 활용하여 공항 내 여객 체류 시간 분석이 가능해졌다. 본 연구에서는 인천 국제 공항에서 수집된 여객 데이터를 활용하여 여객 체류 시간 분석을 수행하였으며, 방대한 양의 자료를 효율적으로 처리하기 위해 데이터 마이닝 기법인 클러스터링을 활용하여 여객을 체류 시간에 따라 구분하였다. 분석 결과 인천 국제 공항 출발 여객은 체류 시간에 따라 1) 체류 시간이 짧고 대부분의 시간을 에어사이드에서 보내는 여객, 2) 평균 3 시간 정도의 체류 시간을 갖는 여객, 3) 총 체류 시간이 압도적으로 긴 여객 등 크게 3 개의 클러스터로 구분할 수 있는 것으로 나타났다.

Quantification of future climate uncertainty over South Korea using eather generator and GCM

  • Tanveer, Muhammad Ejaz;Bae, Deg-Hyo
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.154-154
    • /
    • 2018
  • To interpret the climate projections for the future as well as present, recognition of the consequences of the climate internal variability and quantification its uncertainty play a vital role. The Korean Peninsula belongs to the Far East Asian Monsoon region and its rainfall characteristics are very complex from time and space perspective. Its internal variability is expected to be large, but this variability has not been completely investigated to date especially using models of high temporal resolutions. Due to coarse spatial and temporal resolutions of General Circulation Models (GCM) projections, several studies adopted dynamic and statistical downscaling approaches to infer meterological forcing from climate change projections at local spatial scales and fine temporal resolutions. In this study, stochastic downscaling methodology was adopted to downscale daily GCM resolutions to hourly time scale using an hourly weather generator, the Advanced WEather GENerator (AWE-GEN). After extracting factors of change from the GCM realizations, these were applied to the climatic statistics inferred from historical observations to re-evaluate parameters of the weather generator. The re-parameterized generator yields hourly time series which can be considered to be representative of future climate conditions. Further, 30 ensemble members of hourly precipitation were generated for each selected station to quantify uncertainty. Spatial map was generated to visualize as separated zones formed through K-means cluster algorithm which region is more inconsistent as compared to the climatological norm or in which region the probability of occurrence of the extremes event is high. The results showed that the stations located near the coastal regions are more uncertain as compared to inland regions. Such information will be ultimately helpful for planning future adaptation and mitigation measures against extreme events.

  • PDF

스마트폰 과의존 판별을 위한 기계 학습 기법의 응용 (Application of Machine Learning Techniques for Problematic Smartphone Use)

  • 김우성;한준희
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.293-309
    • /
    • 2022
  • Purpose - The purpose of this study is to explore the possibility of predicting the degree of smartphone overdependence based on mobile phone usage patterns. Design/methodology/approach - In this study, a survey conducted by Korea Internet and Security Agency(KISA) called "problematic smartphone use survey" was analyzed. The survey consists of 180 questions, and data were collected from 29,712 participants. Based on the data on the smartphone usage pattern obtained through the questionnaire, the smartphone addiction level was predicted using machine learning techniques. k-NN, gradient boosting, XGBoost, CatBoost, AdaBoost and random forest algorithms were employed. Findings - First, while various factors together influence the smartphone overdependence level, the results show that all machine learning techniques perform well to predict the smartphone overdependence level. Especially, we focus on the features which can be obtained from the smartphone log data (without psychological factors). It means that our results can be a basis for diagnostic programs to detect problematic smartphone use. Second, the results show that information on users' age, marriage and smartphone usage patterns can be used as predictors to determine whether users are addicted to smartphones. Other demographic characteristics such as sex or region did not appear to significantly affect smartphone overdependence levels. Research implications or Originality - While there are some studies that predict smartphone overdependence level using machine learning techniques, but the studies only present algorithm performance based on survey data. In this study, based on the information gain measure, questions that have more influence on the smartphone overdependence level are presented, and the performance of algorithms according to the questions is compared. Through the results of this study, it is shown that smartphone overdependence level can be predicted with less information if questions about smartphone use are given appropriately.

Design and experimental characterization of a novel passive magnetic levitating platform

  • Alcover-Sanchez, R.;Soria, J.M.;Perez-Aracil, J.;Pereira, E.;Diez-Jimenez, E.
    • Smart Structures and Systems
    • /
    • 제29권3호
    • /
    • pp.499-512
    • /
    • 2022
  • This work proposes a novel contactless vibration damping and thermal isolation tripod platform based on Superconducting Magnetic Levitation (SML). This prototype is suitable for cryogenic environments, where classical passive, semi active and active vibration isolation techniques may present tribological problems due to the low temperatures and/or cannot guarantee an enough thermal isolation. The levitating platform consists of a Superconducting Magnetic Levitation (SML) with inherent passive static stabilization. In addition, the use of Operational Modal Analysis (OMA) technique is proposed to characterize the transmissibility function from the baseplate to the platform. The OMA is based on the Stochastic Subspace Identification (SSI) by using the Expectation Maximization (EM) algorithm. This paper contributes to the use of SSI-EM for SML applications by proposing a step-by-step experimental methodology to process the measured data, which are obtained with different unknown excitations: ambient excitation and impulse excitation. Thus, the performance of SSI-EM for SML applications can be improved, providing a good estimation of the natural frequency and damping ratio without any controlled excitation, which is the main obstacle to use an experimental modal analysis in cryogenic environments. The dynamic response of the 510 g levitating platform has been characterized by means of OMA in a cryogenic, 77 K, and high vacuum, 1E-5 mbar, environment. The measured vertical and radial stiffness are 9872.4 N/m and 21329 N/m, respectively, whilst the measured vertical and radial damping values are 0.5278 Nm/s and 0.8938 Nm/s. The first natural frequency in vertical direction has been identified to be 27.39 Hz, whilst a value of 40.26 Hz was identified for the radial direction. The determined damping values for both modes are 0.46% and 0.53%, respectively.