• 제목/요약/키워드: Multiple clustering

검색결과 357건 처리시간 0.025초

무선 센서네트워크에서 효율적인 라우팅 기법에 대한 연구 (Energy Efficient Routing Scheme for Wireless Sensor Networks)

  • 김동식;김승욱
    • 한국통신학회논문지
    • /
    • 제35권5A호
    • /
    • pp.417-422
    • /
    • 2010
  • 본 논문에서는 무선 센서 네트워크상에서 QoS를 보장하면서 노드들의 에너지 효율을 최대화하는 다중 계층 클러스터링 기법을 제안하였다. 제안된 방법의 가장 큰 특징은 지정된 시간 내 도착성과 데이터 전송의 신뢰성 등 요구되는 QoS를 만족시키면서 노드들의 분산된 에너지 소모를 통해 전체 네트워크 수명을 증가 시킨다는데 있다. 시뮬레이션을 통해 제안된 기법은 센서 네트워크상에서 가능한 에너지를 절감하면서 데이터 패킷들의 시간 내 도착을 보장할 수 있다는 것을 확인 하였다.

Estimating the Number of Clusters using Hotelling's

  • Choi, Kyung-Mee
    • Communications for Statistical Applications and Methods
    • /
    • 제12권2호
    • /
    • pp.305-312
    • /
    • 2005
  • In the cluster analysis, Hotelling's $T^2$ can be used to estimate the unknown number of clusters based on the idea of multiple comparison procedure. Especially, its threshold is obtained according to the probability of committing the type one error. Examples are used to compare Hotelling's $T^2$ with other classical location test statistics such as Sum-of-Squared Error and Wilks' $\Lambda$ The hierarchical clustering is used to reveal the underlying structure of the data. Also related criteria are reviewed in view of both the between variance and the within variance.

Integrative Multi-Omics Approaches in Cancer Research: From Biological Networks to Clinical Subtypes

  • Heo, Yong Jin;Hwa, Chanwoong;Lee, Gang-Hee;Park, Jae-Min;An, Joon-Yong
    • Molecules and Cells
    • /
    • 제44권7호
    • /
    • pp.433-443
    • /
    • 2021
  • Multi-omics approaches are novel frameworks that integrate multiple omics datasets generated from the same patients to better understand the molecular and clinical features of cancers. A wide range of emerging omics and multi-view clustering algorithms now provide unprecedented opportunities to further classify cancers into subtypes, improve the survival prediction and therapeutic outcome of these subtypes, and understand key pathophysiological processes through different molecular layers. In this review, we overview the concept and rationale of multi-omics approaches in cancer research. We also introduce recent advances in the development of multi-omics algorithms and integration methods for multiple-layered datasets from cancer patients. Finally, we summarize the latest findings from large-scale multi-omics studies of various cancers and their implications for patient subtyping and drug development.

지역별 혁신형태 유형화와 지역 기반 혁신 정책 (Classification of Regional Innovation Types and Region-based Innovation Policies)

  • 유광민;김동관;한성호
    • 기술혁신학회지
    • /
    • 제18권1호
    • /
    • pp.151-175
    • /
    • 2015
  • 지역 혁신정책의 중심이 중앙정부에서 지자체로 전환되고 있다. 하지만 지역별로 차별화된 지역혁신 전략을 수립, 추진하기에 어려움을 겪고 있다. 이는 국가 전체의 차원에서 뿐만 아니라 지역 차원에서도 비효율적이다. 국가내 지역간에 혁신 형태나 특성에 뚜렷한 차이가 있고, 이를 반영하지 못한 혁신 정책은 의도한 효과를 거두기 어렵다. 이러한 문제의식 하에 본 연구는 한국에서의 지역간 혁신 형태의 특성과 차이를 밝혀내고, 이를 유형화하여 적절한 정책적 시사점을 제시하고자 하였다. 기존 연구들에서 제시된 지역혁신 관련 지표들을 검토하고, 선정된 지역혁신지표들을 활용하여 다중인자분석과 군집 분석 방법을 통해 지역들을 혁신유형별로 구분하였다. 그리고 각 혁신유형별로 드러난 특징과 차이를 기초로 그에 맞는 정책적 방향을 예시하였다. 이러한 결과는 향후 지역별 특성에 적합한 혁신정책 수립에 기여할 것으로 기대된다.

고객관계관리의 시장 세분화를 위한 Self-Organizing Maps 재고찰 (Rethinking of Self-Organizing Maps for Market Segmentation in Customer Relationship Management)

  • 방정혜
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.17-34
    • /
    • 2007
  • 본 논문은 고객관계관리를 위한 시장 세분화를 하기 위해 자주 사용되는 SOM에 대하여 고찰한다. 일반적으로, SOM은 군집의 수를 미리 파악하기 위하여, 구체적인 군집 분석이 이루어지기 이전에 사용된다. 그러나 인터넷이 발달하고 수집 가능한 데이터의 종류와 양이 증가함에 따라 복합적인 분석이 필요하게 되었다. 또한, 그에 따라 한가지 주제만으로 군집을 파악하는 것보다는 여러 가지의 주제들을 대상으로 고객데이터의 군집을 파악해야 하는 경우가 많이 발생하게 된 것이다. 따라서 이 논문에서는 이렇게 한가지의 주제가 아닌 여러 가지의 주제로 군집분석을 할 경우 한번으로 이루어지는 SOM 어프로치가 과연 군집의 수를 파악할 수 있는지를 실험하였다. 이미 구조를 알고 있는 데이터를 생성하여 실험을 해본 결과, 전체 데이터를 대상으로 여러 주제를 한꺼번에 포함시킨 경우 (single SOM 방식) 에는 그 구조를 제대로 파악하지 못하였으며, 하나의 주제마다 각기 다른 SOM을 사용(multiple SOM 방식)한 결과, 미리 정해졌던 구조를 제대로 파악할 수 있었다. 따라서 이 논문은 군집분석을 하게 될 경우, 좀더 조심스러운 접근법이 필요하며, 여러가지 주제를 포함하고 있는 데이타를 다룰 경우, SOM 분석 방법에 대하여 논의하였다.

  • PDF

A Bibliometric Approach for Department-Level Disciplinary Analysis and Science Mapping of Research Output Using Multiple Classification Schemes

  • Gautam, Pitambar
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권1호
    • /
    • pp.7-29
    • /
    • 2019
  • This study describes an approach for comparative bibliometric analysis of scientific publications related to (i) individual or several departments comprising a university, and (ii) broader integrated subject areas using multiple disciplinary schemes. It uses a custom dataset of scientific publications (ca. 15,000 articles and reviews, published during 2009-2013, and recorded in the Web of Science Core Collections) with author affiliations to the research departments, dedicated to science, technology, engineering, mathematics, and medicine (STEMM), of a comprehensive university. The dataset was subjected, at first, to the department level and discipline level analyses using the newly available KAKEN-L3 classification (based on MEXT/JSPS Grants-in-Aid system), hierarchical clustering, correspondence analysis to decipher the major departmental and disciplinary clusters, and visualization of the department-discipline relationships using two-dimensional stacked bar diagrams. The next step involved the creation of subsets covering integrated subject areas and a comparative analysis of departmental contributions to a specific area (medical, health and life science) using several disciplinary schemes: Essential Science Indicators (ESI) 22 research fields, SCOPUS 27 subject areas, OECD Frascati 38 subordinate research fields, and KAKEN-L3 66 subject categories. To illustrate the effective use of the science mapping techniques, the same subset for medical, health and life science area was subjected to network analyses for co-occurrences of keywords, bibliographic coupling of the publication sources, and co-citation of sources in the reference lists. The science mapping approach demonstrates the ways to extract information on the prolific research themes, the most frequently used journals for publishing research findings, and the knowledge base underlying the research activities covered by the publications concerned.

Building Energy Time Series Data Mining for Behavior Analytics and Forecasting Energy consumption

  • Balachander, K;Paulraj, D
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.1957-1980
    • /
    • 2021
  • The significant aim of this research has always been to evaluate the mechanism for efficient and inherently aware usage of vitality in-home devices, thus improving the information of smart metering systems with regard to the usage of selected homes and the time of use. Advances in information processing are commonly used to quantify gigantic building activity data steps to boost the activity efficiency of the building energy systems. Here, some smart data mining models are offered to measure, and predict the time series for energy in order to expose different ephemeral principles for using energy. Such considerations illustrate the use of machines in relation to time, such as day hour, time of day, week, month and year relationships within a family unit, which are key components in gathering and separating the effect of consumers behaviors in the use of energy and their pattern of energy prediction. It is necessary to determine the multiple relations through the usage of different appliances from simultaneous information flows. In comparison, specific relations among interval-based instances where multiple appliances use continue for certain duration are difficult to determine. In order to resolve these difficulties, an unsupervised energy time-series data clustering and a frequent pattern mining study as well as a deep learning technique for estimating energy use were presented. A broad test using true data sets that are rich in smart meter data were conducted. The exact results of the appliance designs that were recognized by the proposed model were filled out by Deep Convolutional Neural Networks (CNN) and Recurrent Neural Networks (LSTM and GRU) at each stage, with consolidated accuracy of 94.79%, 97.99%, 99.61%, for 25%, 50%, and 75%, respectively.

Personalized Size Recommender System for Online Apparel Shopping: A Collaborative Filtering Approach

  • Dongwon Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.39-48
    • /
    • 2023
  • 본 연구는 의류의 디자인 간 치수의 불일치와 비표준화로 인해 온라인 구매 시 발생하는 치수 선택의 오류 문제를 해결할 수 있는 방안을 제시하기 위해 수행되었다. 본 논문은 구매자에게 개인화된 치수를 제시할 수 있는 기계 학습 기반 추천 시스템의 구현 방안을 다루고 있다. 온라인 상거래로부터 발생된 구매 데이터를 사용하여 비음수 행렬 분해(NMF), 특이값 행렬 분해(SVD), k-최근접 이웃(KNN), 공동 클러스터링(Co-Clustering) 등 여러 검증된 협업 필터링 알고리즘을 훈련하였고, 이들 간에 성능을 비교하였다. 연구 결과, 비음수 행렬 분해 (NMF) 알고리즘이 다른 알고리즘들보다 뛰어난 성능을 보임을 확인할 수 있었다. 동일한 계정을 사용하는 여러 구매자가 포함되는 구매 데이터의 특성에도 불구하고, 제안 모형은 충분한 정확도를 보였다. 본 연구의 결과는 치수 선택의 오류로 인한 반품률을 감소하고 전자상거래 플랫폼에서의 고객 경험을 향상시키는 데 기여할 것으로 기대된다.

컨조인트 분석을 이용한 휴대폰 속성 분석 (Attribute analysis for cellular phone using conjoint analysis)

  • 지혜영;조완현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권4호
    • /
    • pp.695-703
    • /
    • 2009
  • 현재 휴대폰 시장은 여러 가지 기능과 디자인을 갖춘 다양한 휴대폰 제품들이 출시되고 있으며, 각기업에선 이윤 극대화를 위해서 소비자의 선호도를 고려하여 제품을 개발하고 있다. 따라서, 본 연구에서는 SPSS 프로그램을 이용하여 휴대폰 속성에 대한 18개의 프로파일을 생성하였고, 휴대폰에 대한 선호를 분석하기 위해 대학생들을 대상으로 설문조사를 실시하였다. 또한, 컨조인트 분석을 이용하여 각 속성별 상대적 중요도를 파악하고, 비슷한 부분가치 유틸리티를 갖는 응답자들을 묶어 세분 시장을 구성하기 위해 군집분석을 실시하였다. 그리고 컨조인트 분석에 이용한 18개 가상제품에 대한 초이스 시뮬레이션을 통해 시장점유율을 예측해 보았다.

  • PDF

Analysis of forest types and stand structures over Korean peninsula Using NOAA/AVHRR data

  • Lee, Seung-Ho;Kim, Cheol-Min;Oh, Dong-Ha
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1999년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.386-389
    • /
    • 1999
  • In this study, visible and near infrared channels of NOAA/AVHRR data were used to classify land use and vegetation types over Korean peninsula. Analyzing forest stand structures and prediction of forest productivity using satellite data were also reviewed. Land use and land cover classification was made by unsupervised clustering methods. After monthly Normalized Difference Vegetation Index (NDVI) composite images were derived from April to November 1998, the derived composite images were used as temporal feature vector's in this clustering analysis. Visually interpreted, the classification result was satisfactory in overall for it matched well with the general land cover patterns. But subclassification of forests into coniferous, deciduous, and mixed forests were much confused due to the effects of low ground resolution of AVHRR data and without defined classification scheme. To investigate into the forest stand structures, digital forest type maps were used as an ancillary data. Forest type maps, which were compiled and digitalized by Forestry Research Institute, were registered to AVHRR image coordinates. Two data sets were compared and percent forest cover over whole region was estimated by multiple regression analysis. Using this method, other forest stand structure characteristics within the primary data pixels are expected to be extracted and estimated.

  • PDF