• Title/Summary/Keyword: 클러스터링 문제

Search Result 429, Processing Time 1.348 seconds

A Collaborative Recommendation Based on Neural Networks Using the Clustering (클러스터링을 이용한 신경망 기반 협력적 추천)

  • 김은주;류정우;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.343-345
    • /
    • 2002
  • 개인화를 위한 협력적 추천의 대표적인 방법인 최근접 이웃 방법은 적용이 쉽지만, 사용자의 선호도 정보가 적을 경우 회소성(sparsity)문제와 사용자 수가 많은 경우 수행 속도가 느려지는 범위성(Scalability)문제 그리고 사용자간의 가중치가 결여되었다는 점에서 추천의 정확성이 떨어진다. 신경망 기반 추천은 자료의 유형에 상관없이 데이터의 처리가 용이하고, 사용자간의 가중치를 학습할 수 있으며, 내용 정보, 인구통계학적 정보 등을 입력 노드에 추가함으로써 희소성 문제를 해결할 수 있으나. 범위성 문제는 존재한다. 따라서 본 논문에서는 최근접 이웃 방법으로 클러스터링 한 유사한 사용자 또는 항목들을 고려한 신경망 기반 추천 방법을 제안하여 범위성 문제를 최소화시킴으로써 추천의 성능을 향상시키고 있다. 제안한 추천 방법의 타당성을 보이기 위해 EachMovie데이터를 이용하여 기존 신경망 추천과 비교 실험하여 성능을 분석한다.

  • PDF

A Genetic Algorithm for Network Clustering in Underwater Acoustic Sensor Networks (해양 센서 네트워크에서 네트워크 클러스터링을 위한 유전 알고리즘)

  • Jang, Kil-Woong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.12
    • /
    • pp.2687-2696
    • /
    • 2011
  • A Clustering problem is one of the organizational problems to improve network lifetime and scalability in underwater acoustic sensor networks. This paper propose an algorithm to obtain an optimal clustering solution to be able to minimize a total transmission power for all deployed nodes to transmit data to the sink node through its clusterhead. In general, as the number of nodes increases, the amount of calculation for finding the solution would be too much increased. To obtain the optimal solution within a reasonable computation time, we propose a genetic algorithm to obtain the optimal solution of the cluster configuration. In order to make a search more efficient, we propose some efficient neighborhood generating operations of the genetic algorithm. We evaluate those performances through some experiments in terms of the total transmission power of nodes and the execution time of the proposed algorithm. The evaluation results show that the proposed algorithm is efficient for the cluster configuration in underwater acoustic sensor networks.

A Study on the Efficient TICC(Time Interval Clustering Control) Algorithm That Considering Attribute (노드의 속성을 고려한 효율적인 TICC(Time Interval Clustering Control) 알고리즘에 관한 연구)

  • Kim, Young-Sam;Doo, Kyoung-Min;Chi, Sam-Hyun;Lee, Kang-Whan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.05a
    • /
    • pp.499-502
    • /
    • 2008
  • 한정된 용량의 배터리에 의존하는 무선 Ad-hoc 네트워크(MANET)에서는 에너지 효율을 높이기 위한 다양한 클러스터링 기법과 라우팅 알고리즘이 연구되고 있다. 이러한 무선 Ad-hoc 네트워크에서는 에너지 효율이 높은 클러스터 기반의 라우팅 알고리즘이 많이 사용된다. 그러나 일반적인 클러스터 방식에 따른 라우팅 알고리즘에서는 클러스터 헤드 노드에 부하가 집중되어 에너지 소모가 많은 문제점을 가진다. 이 문제를 보완하기 위해서 클러스터 헤드 노드의 재 선출을 통해 에너지 소모를 분산하는 동적 클러스터링 방식이 사용되고 있다. 그러나 동적 클러스터링 방식 또한 높은 빈도의 클러스터 재형성 과정에서 많은 에너지를 소모하는 문제점이 있다. 즉, 지금까지 연구되어온 알고리즘은 클러스터 구성에 대한 효율적인 알고리즘을 제시하고 있지만 불필요한 에너지 소모를 최소화하는 최적의 헤드 노드 선정 방법과 클러스터 관리를 통하여 에너지 효율을 높일 수 있는 해결책을 제시하지 않았다. 따라서 본 논문에서는 위의 클러스터 문제를 해결하기 위해 TICC(Time Interval Clustering Control) 알고리즘 기법을 제안한다. 제안된 TICC은 각 노드의 에너지 속성 값에 따라 에너지 Level을 분류하고 분류된 에너지 Level에 따라 타이밍을 고려한 클러스터링 및 노드 관리방법이다. 이러한 TICC기법을 적용하여 실험을 하였고 결과적으로 클러스터 전체의 에너지 효율을 향상되고 Lifetime이 증가함을 보였다.

  • PDF

User Oriented clustering of news articles using Tweets Heterogeneous Information Network (트위트 이형 정보 망을 이용한 뉴스 기사의 사용자 지향적 클러스터링)

  • Shoaib, Muhammad;Song, Wang-Cheol
    • Journal of Internet Computing and Services
    • /
    • v.14 no.6
    • /
    • pp.85-94
    • /
    • 2013
  • With the emergence of world wide web, in particular web 2.0 the rapidly growing amount of news articles has created a problem for users in selection of news articles according to their requirements. To overcome this problem different clustering mechanism has been proposed to broadly categorize news articles. However these techniques are totally machine oriented techniques and lack users' participation in the process of decision making for membership of clustering. In order to overcome the issue of zero-participation in the process of clustering news articles in this paper we have proposed a framework for clustering news articles by combining users' judgments that they post on twitter with the news articles to cluster the objects. We have employed twitter hash-tags for this purpose. Furthermore we have computed the credibility of users' based on frequency of retweets for their tweets in order to enhance the accuracy of the clustering membership function. In order to test performance of proposed methodology, we performed experiments on tweets messages tweeted during general election 2013 in Pakistan. Our results proved over claim that using users' output better outcome can be achieved then ordinary clustering algorithms.

An Improved Clustering Method with Cluster Density Independence (클러스터 밀도에 무관한 향상된 클러스터링 기법)

  • Yoo, Byeong-Hyeon;Kim, Wan-Woo;Heo, Gyeongyong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.10a
    • /
    • pp.248-249
    • /
    • 2015
  • Clustering is one of the most important unsupervised learning methods that clusters data into homogeneous groups. However, cluster centers tend leaning to high density clusters because clustering is based on the distances between data points and cluster centers. In this paper, a modified clustering method forcing cluster centers to be apart by introducing a center-scattering term in the Fuzzy C-Means objective function is introduced. The proposed method converges more to real centers with small number of iterations compared to the original one. All the strengths can be verified with experimental results.

  • PDF

Improvement on Density-Independent Clustering Method (밀도에 무관한 클러스터링 기법의 개선)

  • Kim, Seong-Hoon;Heo, Gyeongyong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.5
    • /
    • pp.967-973
    • /
    • 2017
  • Clustering is one of the most well-known unsupervised learning methods that clusters data into homogeneous groups. Clustering has been used in various applications and FCM is one of the representative methods. In Fuzzy C-Means(FCM), however, cluster centers tend leaning to high density areas because the Euclidean distance measure forces high density clusters to make more contribution to clustering result. Previously proposed was density-independent clustering method, where cluster centers were made not to be close each other and relived the center deviation problem. Density-independent clustering method has a limitation that it is difficult to specify the position of the cluster centers. In this paper, an enhanced density-independent clustering method with an additional term that makes cluster centers to be placed around dense region is proposed. The proposed method converges more to real centers compared to FCM and density-independent clustering, which can be verified with experimental results.

Improved Density-Independent Fuzzy Clustering Using Regularization (레귤러라이제이션 기반 개선된 밀도 무관 퍼지 클러스터링)

  • Han, Soowhan;Heo, Gyeongyong
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.1
    • /
    • pp.1-7
    • /
    • 2020
  • Fuzzy clustering, represented by FCM(Fuzzy C-Means), is a simple and efficient clustering method. However, the object function in FCM makes clusters affect clustering results proportional to the density of clusters, which can distort clustering results due to density difference between clusters. One method to alleviate this density problem is EDI-FCM(Extended Density-Independent FCM), which adds additional terms to the objective function of FCM to compensate for the density difference. In this paper, proposed is an enhanced EDI-FCM using regularization, Regularized EDI-FCM. Regularization is commonly used to make a solution space smooth and an algorithm noise insensitive. In clustering, regularization can reduce the effect of a high-density cluster on clustering results. The proposed method converges quickly and accurately to real centers when compared with FCM and EDI-FCM, which can be verified with experimental results.

Metro Station Clustering based on Travel-Time Distributions (통행시간 분포 기반의 전철역 클러스터링)

  • Gong, InTaek;Kim, DongYun;Min, Yunhong
    • The Journal of Society for e-Business Studies
    • /
    • v.27 no.2
    • /
    • pp.193-204
    • /
    • 2022
  • Smart card data is representative mobility data and can be used for policy development by analyzing public transportation usage behavior. This paper deals with the problem of classifying metro stations using metro usage patterns as one of these studies. Since the previous papers dealing with clustering of metro stations only considered traffic among usage behaviors, this paper proposes clustering considering traffic time as one of the complementary methods. Passengers at each station were classified into passengers arriving at work time, arriving at quitting time, leaving at work time, and leaving at quitting time, and then the estimated shape parameter was defined as the characteristic value of the station by modeling each transit time to Weibull distribution. And the characteristic vectors were clustered using the K-means clustering technique. As a result of the experiment, it was observed that station clustering considering pass time is not only similar to the clustering results of previous studies, but also enables more granular clustering.

Gene Expression Analysis by Co-evolutionary Biclustering (유전자 발현 분석을 위한 공진화적 바이클러스터링 기법)

  • Joung Je-Gun;Kim Soo-Jin;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.22-24
    • /
    • 2006
  • 마이크로어레이는 전체 유전체 수준의 mRNA 발현 여부에 대한 측정이 가능하다는 점에서 분자생물학의 실험 도구로서 가장 강력한 도구 중에 하나로 부각되어 있다. 현재까지 마이크로어래이의 결과로부터 유사한 발현 패턴을 찾기 위한 여러 가지 바이클러스터링 알고리즘들이 개발되어 왔다. 하지만 대다수의 알고리즘들이 최적의 바이클러스터들을 찾기보다는 일정 수준의 가능한 바이클러스터의 결과만을 제시하고 있다. 본 논문에서는 다른 개체집단들과 상호 진화하는 공진화적 학습에 의한 진화연산 기법을 통하여 유전자-조건의 매트릭스로부터 열과 행을 동시에 클러스터링하는 공진화적 바이클러스터링 알고리즘(co-evolutionary biclustering algorithm: CBA)을 제안하고자 한다. CBA는 유전자발현 데이터에서 유전자-조건의 상호의존적인 부성분들로 구성된 최적화 문제에 적합한 계산방식이라고 할 수 있다. 인간 유전자 발현 데이터에 대한 실험 결과. 제시한 알고리즘은 이전의 알고리즘에 비해 발견한 바이클러스터의 패턴 유사도에 있어서 우수한 성능을 보이고 있다.

  • PDF

Gene ontology based semi-supervised clustering method (유전자 온톨로지를 활용한 반지도 클러스터링 기법)

  • Go, Song;Kim, Dae-Won
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.183-187
    • /
    • 2008
  • 본 논문은 유전자의 기능이 비슷한 정도에 따른 사전정보의 값을 부여하며, 클러스터링시 사전정보를 활용할 수 있는 방법을 제시한다. 실세계 문제인 유전자는 각기 다양한 기능을 하는 특징적인 것으로 사전정보의 형태를 1과 0등으로 구분하던 과거의 방식으로는 정의하기가 어렵다. 유전자간의 비슷한 정도에 따라 사전정보의 값이 정해져야 하는 것은 필요하며, 이는 생물학자가 구축해놓은 유전자 온톨로지의 분석을 통하여 산출한다. 유전자 온톨로지는 기능별 카테고리로 분류하며, 세부 기능은 하위의 카테고리로 형성된 거대한 트리 구조의 형태를 띤다. 온톨로지 분석을 통해 형성된 사전정보의 값은 0과 1사이의 연속적인 값으로 형성이 되며, 이 값은 클러스터링 과정 중 거리 계산에 활용함으로써, 그 결과의 성능이 우수함을 보인다.

  • PDF