• 제목/요약/키워드: clustering problem

검색결과 709건 처리시간 0.03초

The cluster-indexing collaborative filtering recommendation

  • Park, Tae-Hyup;Ingoo Han
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.400-409
    • /
    • 2003
  • Collaborative filtering (CF) recommendation is a knowledge sharing technology for distribution of opinions and facilitating contacts in network society between people with similar interests. The main concerns of the CF algorithm are about prediction accuracy, speed of response time, problem of data sparsity, and scalability. In general, the efforts of improving prediction algorithms and lessening response time are decoupled. We propose a three-step CF recommendation model which is composed of profiling, inferring, and predicting steps while considering prediction accuracy and computing speed simultaneously. This model combines a CF algorithm with two machine learning processes, SOM (Self-Organizing Map) and CBR (Case Based Reasoning) by changing an unsupervised clustering problem into a supervised user preference reasoning problem, which is a novel approach for the CF recommendation field. This paper demonstrates the utility of the CF recommendation based on SOM cluster-indexing CBR with validation against control algorithms through an open dataset of user preference.

  • PDF

개인화 추천 시스템에서 연관 관계 군집에 의한 아이템 기반의 협력적 필터링 기술 (An Item-based Collaborative Filtering Technique by Associative Relation Clustering in Personalized Recommender Systems)

  • 정경용;김진현;정헌만;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.467-477
    • /
    • 2004
  • 추천 시스템은 예전에는 몇몇 혁신적인 전자상거래(E-commerce) 사이트에서만 사용되어 왔으나 현재는 전자상거래를 새롭게 재구성하는 필수적인 비즈니스 도구가 되어가고 있다. 그리고 협력적 필터링은 이론과 실무 분야 모두에서 가장 성공적으로 평가받은 추천 기법 중 하나이다. 그러나 개인화 추천 시스템을 구축하기 위해서는 두 가지 문제를 동시에 고려해야 한다. 즉 초기 평가 문제와 희박성 문제이다. 본 논문에서는 연관 관계 군집과 연관 규칙의 향상도를 이용하여 이러한 문제를 해결하고자 한다. 사용자의 평가 데이타를 사용하여 아이템간의 향상도를 산출하고, a-cut에 의한 임계값을 아이템들간의 연관성에 적용한다. 연관 관계 군집의 효율성을 높이기 위해서 기존의 Hypergraph Clique Clustering 알고리즘과 본 연구에서 제안하는 Split Cluster Method를 이용하였다. 군집이 완성되면, 각 군집 내부에서 아이템간의 유사도를 산출하고 빠른 액세스를 위해 인덱스를 데이터베이스에 저장한다. 새로운 아이템들의 선호도 예측 시에 생성한 인덱스를 적용시킨다. 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다. 그 결과 기존의 협력적 필터링 기술의 문제점을 해결하여 예측의 정확도를 높이는데 효과적임을 확인하였다.

클러스터링 알고리즘의 후처리 방안과 분할된 영역들의 분류에 대한 연구 (A Study of Post-processing Methods of Clustering Algorithm and Classification of the Segmented Regions)

  • 오준택;김보람;김욱현
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.7-16
    • /
    • 2009
  • 클러스터링 알고리즘은 영역들간의 공간정보를 고려하지 않고 사전에 정의된 수만큼의 군집들로 분할하기 때문에 영상의 과분할을 유발하며, 이에 실제적인 응용분야에 적용하기에는 어려움이 존재한다. 본 논문에서는 클러스터링 알고리즘에 의해 획득한 군집들을 대상으로 보다 나은 분할결과를 획득하기 위한 후처리 방안으로, 비동질적인 군집의 재분류와 베이시안 알고리즘에 의한 유사영역의 합병알고리즘을 제안한다. 먼저, 클러스터링 알고리즘에 의해 분할된 영상의 군집들에 대해서 가장 비동질적인 군집을 선택하여 이를 나머지 군집들 중 하나로 재분류하며, 최소평균내부거리값에 의해 결정된 군집수만큼 반복적으로 수행된다. 그리고 여전히 존재하는 유사한 인접영역들을 제거하기 위해서 영역간의 Kullbeck-Leibler 거리값을 기반으로 베이시안 알고리즘을 이용한 영역 합병을 수행한다. 마지막으로, 제안한 방법의 유효함을 검증하기 위한 목적으로, 분할된 영역들의 우세컬러와 텍스처 정보를 기반으로 하는 SVM(support vector machine) 기반 영역분류시스템을 설계한다. 실험결과, 제안한 방법은 다양한 실험영상들에 대해서 단계별 더 나은 성능을 보였으며, 분할된 영역들의 분류에서도 효과적인 결과를 보여 제안방법의 유효함을 확인하였다.

명암도 응집성 강화 및 분류를 통한 3차원 뇌 영상 구조적 분할 (Structural Segmentation for 3-D Brain Image by Intensity Coherence Enhancement and Classification)

  • 김민정;이정민;김명희
    • 정보처리학회논문지A
    • /
    • 제13A권5호
    • /
    • pp.465-472
    • /
    • 2006
  • 최근 대용량 의료영상 데이터로부터 인체 기관 또는 질환 부위 추출을 위한 영상 분할 기법이 매우 다양하게 제안되고 있으나, 뇌와 같이 다중 구조를 가지면서 구조간 경계 구분이 어려운 영상의 구조적 분할에는 한계를 가진다. 이를 위해 주로 복셀을 유한 개의 군집으로 분류하는 군집화 (clustering) 기법이 이용되나 이는 개별 복셀 단위의 연산을 수행함으로 인해 잡음의 영향을 받는 제한점이 있다. 그러므로 잡음의 영상을 최소화하고 영상 경계를 강화시키는 향상기법을 적용함으로써 보다 견고한 구조적 분할을 수행할 수 있다. 본 연구에스는 뇌 자기공명영상에 대하여 백질(white matter), 회백질(gray matter), 뇌척수액(cerebrospinal fluid)의 내부 구조를 효율적으로 추출하기 위한 필터링 기반 군집화에 의한 구조적 분할 기법을 제안한다. 우선 구조간 경계를 강화하고 구조 내 잡음을 약화시키기 위해 응집성 향상 확산 필터링(coherence enhancing diffusiion filtering)을 적용한다. 또한 이 과정을 통해 강화된 영상에 퍼지 c-means 군집화 기법을 적용하여 각 복셀이 속하는 구조에 해당하는 군집의 인덱스를 할당함으로써 구조적 분할을 수행한다. 제안된 구조적 분할기법은 기존의 가우시안 또는 일반적인 비등방성 확산 필터링과 군집화 기법을 적용한 기법에 비해 전문가의 수동분할 결과와의 일치 비율에 의한 분할 정확도를 향상시킴을 보였다. 또한 경계 부분에 있어서의 세밀한 분할을 통해 재생산 가긍하고 사용자 수동후 처리를 최소화할 수 있는 결과를 제시함으로써 형태적 뇌 이상 진단을 위한 효율적인 보조 수단을 제공한다.

무선 센서 네트워크에서 에너지 효율적인 감시·정찰 응용의 클러스터링 알고리즘 연구 (Energy Efficient Clustering Algorithm for Surveillance and Reconnaissance Applications in Wireless Sensor Networks)

  • 공준익;이재호;강지헌;엄두섭
    • 한국통신학회논문지
    • /
    • 제37C권11호
    • /
    • pp.1170-1181
    • /
    • 2012
  • 다양한 응용에서 사용되고 있는 무선 센서 네트워크(WSN)는 저가의 센서 노드를 구성하기 위해 배터리, 메모리 크기, MCU, RF transceiver 등과 같은 하드웨어에서 제약을 갖고 있다. 특히, 센서 노드의 제한된 에너지는 네트워크 수명과 직접적인 관련이 있기 때문에 네트워크 수명을 연장하기 위한 효율적인 알고리즘이 요구된다. 군 환경에서 침입자를 탐지하기 위한 감시 정찰 응용은 이벤트 구동형(event-driven) 전송 모델로써, 이벤트 발생 빈도가 드물고(rare), 폭발적(bursty), 지역적(local)으로 발생하는 특징이 있다. 이와 같은 응용에서는 Data Aggregation의 장점이 있는 클러스터링 알고리즘을 이용하는 것이 각 노드가 개별적으로 데이터를 전송하는 것 보다 데이터 전송량을 줄여 에너지 효율을 높일 수 있다. 하지만 기존의 클러스터링 알고리즘은 감시 정찰 응용의 이벤트 발생에 대한 특징을 고려하고 있지 않기 때문에 여러 문제가 발생한다. 본 논문에서는 이러한 문제를 개선한 감시 정찰 응용에서의 에너지 효율적인 클러스터링 알고리즘을 제안한다. 이 알고리즘은 타깃을 탐지한 노드들이 각각 Cluster Head Election Window (CHEW)를 생성하여 지역적 경쟁 방식으로 클러스터를 구성하고, 타깃의 이동성을 고려하였다. 시뮬레이션 결과에서는 타깃의 이동에 따라 클러스터가 형성되는 자취를 분석하고, 에너지 효율이 증가되는 것을 증명하였다.

K-Means 클러스터링을 적용한 향상된 CS-RANSAC 알고리즘 (Improved CS-RANSAC Algorithm Using K-Means Clustering)

  • 고승현;윤의녕;;조근식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권6호
    • /
    • pp.315-320
    • /
    • 2017
  • 이미지를 기반으로 하는 증강현실 시스템에서 가상의 객체를 실제 영상에 저작할 때 생기는 이질감을 줄이기 위해서는 실제 영상에 저작된 가상객체의 방향과 위치에 대해 정확하게 추정을 해야 하며, 이때 호모그래피를 사용한다. 호모그래피를 추정하기 위해서는 SURF와 같은 특징점을 추출하고 추출된 특징점들을 통해 호모그래피 행렬을 추정한다. 호모그래피 행렬의 추정을 위해서 RANSAC 알고리즘이 주로 사용되고 있으며, 특히 RANSAC에 제약 조건 만족 문제(Constraint Satisfaction Problem)와 여기에 사용되는 제약조건을 동적으로 적용하여 속도와 정확도를 높인 DCS-RANSAC 알고리즘이 연구되었다. DCS-RANSAC 알고리즘에서 사용된 이미지 그룹 데이터는 수동적인 방법을 통해 직관적으로 분류되어 있지만 특징점 분포 패턴이 다양하지 않고, 이미지들을 정확하게 분류하기가 어려워서 이로 인해 알고리즘의 성능이 저하되는 경우가 있다. 따라서 본 논문에서는 K-means 클러스터링을 적용하여 이미지들을 자동으로 분류하고 각 이미지 그룹마다 각기 다른 제약조건을 적용하는 KCS-RANSAC 알고리즘을 제안한다. 제안하는 알고리즘은 머신러닝 기법인 K-means 클러스터링을 사용하여 전처리 단계에서 이미지를 특징점 분포 패턴에 따라 자동으로 분류하고, 분류된 이미지에 제약조건을 적용하여 알고리즘의 속도와 정확도를 향상시켰다. 실험 결과 본 논문에서 제안하는 KCS-RANSAC이 DCS-RANSAC 알고리즘에 비해 수행시간이 약 15% 단축되었고, 오차율은 약 35% 줄어들었으며, 참정보 비율은 약 14% 증가되었다.

사전 클러스터링을 이용한 LDA-확장법들의 최적화 (On Optimizing LDA-extentions Using a Pre-Clustering)

  • 김상운;구범용;최우영
    • 전자공학회논문지CI
    • /
    • 제44권3호
    • /
    • pp.98-107
    • /
    • 2007
  • 얼굴인식 등과 같은 고차원 패턴인식에서 학습패턴의 수가 패턴 차원에 비해 매우 적을 경우 희소성 문제(the Small Sample Size problem)가 발생한다. 최근 이 문제를 해결하기 위하여 LDA, PCA+LDA, Direct-LDA 등을 비롯한 다양한 LDA-확장 법이 제안되었다. 본 논문에서는 LDA-확장 법으로 차원을 축소하기 전에 학습 패턴을 사전 클러스터링하여 서브 클래스 수를 증가시키는 방법으로 LDA-확장에 기반을 둔 식별기의 성능을 향상시키는 방법을 제안한다. LDA (또는 Direct-LDA)에서 축소된 특징공간의 차원은 학습패턴의 클래스 수로 제한되기 때문에 LDA의 식별 성능을 향상시킬 수 있도록 학습패턴을 사전에 클러스터링하여 서브 클래스의 수를 증가시키는 방법이다. 즉, 학습패턴의 특성공간(the eigen space)은 레인지 공간(the range space)과 널 공간(the null space)으로 구성되며, 레인지 공간의 차원은 클래스 수의 증가에 따라 증가한다. 따라서 변환 행렬을 구성할 때 클래스의 수를 늘려 널 공간을 최소화하게 되면 이 공간에 기인한 정보의 손실을 최소화 할 수 있다. 제안 방법을 X-OR 형태의 인공데이터와 AT&T와 Yale 벤취마크 얼굴영상 데이터베이스를 대상으로 실험한 결과 본 방법의 효용성을 확인하였다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

모바일 환경에서 지하공간객체의 경량화를 위한 단순화 방법 (Simplification Method for Lightweighting of Underground Geospatial Objects in a Mobile Environment)

  • 김종훈;김용태;고훈준
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.195-202
    • /
    • 2022
  • 지하공간정보지도 관리 시스템은 지하공간의 다양한 지하시설물을 3D 메쉬 데이터로 통합하고, 모바일 환경에서 지하시설물의 3D 이미지와 위치를 확인할 수 있도록 지원한다. 그러나 모바일 환경에서 실행되는 일정 지역 안에는 다양한 지하시설물이 존재할 수 있고 층층히 겹쳐 보일 수 있어서 모바일 환경에서 실행하는데 시간이 오래 걸리는 문제가 있다. 본 논문에서는 가시성에서 문제가 되지 않는 범위 내에서 3D 메쉬 데이터의 정점의 개수를 줄여서 데이터의 크기를 줄임으로써 모바일 환경에서 실행 시간을 줄일 수 있는 방법으로 딥러닝 기반 K-means 정점 클러스터링 알고리즘을 제안한다. 첫번째로 우리가 제안하는 방법은 딥러닝 Encoder-Decoder 기반의 모델을 통하여 정재된 정점의 특징 정보를 얻고, 두번째로 특징 정보를 K-means 정점 클러스터링을 통하여 서로 비슷한 정점끼리 묶어서 단순화를 하였다. 실험결과 제안한 방법으로 다양한 지하시설물들의 정점을 30%까지 줄였을 때, 이미지 모형이 약간의 변형은 발생하였지만 사라지는 부분은 없어서 모바일 환경에서 확인하는데 문제가 없었다.

확장된 퍼지엔트로피 클러스터링을 이용한 카오스 시계열 데이터 예측 (Chaotic Time Series Prediction using Extended Fuzzy Entropy Clustering)

  • 박인규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.5-8
    • /
    • 2000
  • In this paper, we propose new algorithms for the partition of input space and the generation of fuzzy control rules. The one consists of Shannon and extended fuzzy entropy function, the other consists of adaptive fuzzy neural system with back propagation teaming rule. The focus of this scheme is to realize the optimal fuzzy rule base with the minimal number of the parameters of the rules, reducing the complexity of the system. The proposed algorithm is tested with the time series prediction problem using Mackey-Glass chaotic time series.

  • PDF