• 제목/요약/키워드: 군집지능

검색결과 261건 처리시간 0.025초

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of Continuous-Valued Attributes considering Data Distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권4호
    • /
    • pp.391-396
    • /
    • 2003
  • 본 논문에서는 특정 매개변수(parameter)의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(continuous) 속성 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화 하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

Infinite Relational Model 기반 Co-Clustering을 이용한 영화 추천 (Movie Recommendation Using Co-Clustering by Infinite Relational Models)

  • 김병희;장병탁
    • 한국지능시스템학회논문지
    • /
    • 제24권4호
    • /
    • pp.443-449
    • /
    • 2014
  • 사람의 영화에 대한 선호도에는 개인의 특성과 영화의 속성을 기반으로 하는 다양한 요인이 연관되어 있다. 영화 추천을 위한 사용자-영화-선호도 연관 관계의 분석 기법으로서, 다중 개념 탐색 기법의 특성을 지닌 infinite relational model (IRM)의 활용 가능성을 확인하고, 이를 기초로 영화 선호 유형에 따른 사용자-영화 군집을 탐색한다. 별점으로 표현되는 명시적인 선호도 데이터에 영화 컨텐츠 관련 메타데이터를 추가하여 학습 데이터를 구성하고, 이에 IRM을 적용하여 공군집화(co-clustering)를 수행한 결과, 해석 가능한 다양한 명시적 연관 관계를 발견하였다. 공군집화 결과를 기초로 개인화 추천에서의 다양한 활용 방안을 논의한다.

능동적 학습을 위한 군집화 기반의 다양한 복수 문의 예제 선정 방법 (Cluster-Based Selection of Diverse Query Examples for Active Learning)

  • 강재호;류광렬;권혁철
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.169-189
    • /
    • 2005
  • 능동적 학습은 훈련 예제의 수가 제한적일 때 효율적으로 분류기를 생성할 수 있는 학습 방법이다. 이 방법에서는 분류하기 모호한 예제에 카테고리를 부여하기 위한 문의 과정과 이렇게 얻어진 예제들을 추가해 가면서 분류기를 재생성 하는 과정을 반복적으로 수행한다. 특히 온라인 환경에서는 반복적으로 예제에 카테고리를 부여해야 하는 사용자의 부담을 줄이기 위해 문의 예제의 총 수뿐만이 아니라 문의 횟수 또한 최소화하여야 한다. 예제 수와 문의 횟수를 줄이면서도 좋은 분류기를 생성하기 위해서는 매 문의 시 사용자에게 다양하면서도 대표성이 높은 복수의 모호한 예제들을 선정하여 제시하는 것이 좋다. 본 논문에서는 다양하면서, 대표적이며, 또한 모호성이 높아 능동적 학습에 효과적인 복수의 문의 예제를 선별하기 위하여 군집화 기법을 활용하는 방안을 제안한다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과 모호성만을 기준으로 복수의 문의 예제를 선정하는 방법보다 우수한 분류기를 생성할 수 있음을 확인하였다.

  • PDF

Deformable Template과 GA를 이용한 얼굴 인식 및 아바타 자동 생성 (Face Detection for Automatic Avatar Creation by using Deformable Template and GA)

  • 박태영;권민수;강훈
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.110-115
    • /
    • 2005
  • 본 논문에서는 아바타를 자동으로 생성하기 위한 컬러 이미지 상에서의 얼굴, 눈, 입술 윤곽선 검출 기법을 제안하였다. 제안된 기법에서는 먼저 조명의 영향을 최대한 배제하기 위하여 HSI 색상 모델을 사용하였고 I 정보를 제외한 HS 평면상에서 피부색을 정의하고 이를 이용하여 입력된 이미지로부터 피부 영역을 검출하였다. 그리고 변형가능 템플릿과 유전자 알고리즘을 이용하여 얼굴, 눈, 입의 윤곽선을 검출하였다. 여기서 변형가능 템플릿은 B-spline 곡선과 컨트롤 포인트 벡터로 이루어지며, 이것은 다양한 얼굴, 눈, 입술 모양의 표현을 가능하게 한다. 또 유전자 알고리즘은 자연계의 진화와 선택원리를 응용한 매우 효율적인 탐색 알고리즘이다 다음으로, 검출된 얼굴과 각 요소들의 윤곽선과 퍼지 C-평균 군집화를 이용하여 아바타를 생성하게 된다. 퍼지 C-평균 군집화는 얼굴색을 일정한 수로 단순화하는 과정에서 사용하였다. 결과적으로, 이와 같은 기법을 이용하여 기존의 정해진 이미지를 가지고 표현하던 아바타와는 달리 사용자의 특성을 표현할 수 있는 아바타를 자동으로 생성할 수 있다.

Quantum-infusion 메커니즘을 이용한 분산형 입자군집최적화 알고리즘에 관한 연구 (A Study on Distributed Particle Swarm Optimization Algorithm with Quantum-infusion Mechanism)

  • 송동호;이영일;김태형
    • 한국지능시스템학회논문지
    • /
    • 제22권4호
    • /
    • pp.527-531
    • /
    • 2012
  • 본 논문에서는 종래의 PSO 알고리즘 성능저하의 주요 원인들 중 하나인 입자들의 조기수렴 현상을 개선한 DPSO-QI (Distributed PSO with quantum-infusion mechanism) 기법을 제안한다. DPSO-QI 알고리즘은 다음과 같은 두 가지 특징을 지닌다. 첫째, 분산형 구조의 PSO 기법을 도입한다. 이는 먼저 적절한 수의 입자들로 소그룹을 형성하고, 최적해 탐색에 필요한 다양한 정보의 교환이 각 소그룹 내에서만 이루어지도록 한 기법이다. 이러한 기법을 바탕으로 입자들의 탐색 다양성을 증대시킴으로서 조기수렴 현상을 감소시키는 효과를 달성할 수 있다. 둘째, 상기의 입자 소그룹에 Quantum-infusion (QI) 메커니즘에 기반 한 기법을 도입시킨다. 이를 통해 입자들의 전역 최적해 탐색 정밀도를 보다 향상시킬 수 있다. 끝으로 다양한 수치예제를 통하여 제안하는 새로운 PSO 기법이 종래의 방식들에 비해 매우 뛰어난 성능을 구현할 수 있음을 입증하고자 한다.

구조화된 연관맵을 이용한 연구개발 전략 수립 (A R&D strategies for development using structured association map)

  • 송원호;이준석;박상성
    • 한국지능시스템학회논문지
    • /
    • 제26권3호
    • /
    • pp.190-195
    • /
    • 2016
  • 급변하는 글로벌 시장 환경에서 기술은 계속해서 급속히 발전하고 있다. 이러한 급변하고 있는 환경을 반영한 연구개발은 기업에 있어서 필수가 되었다. 즉, 기업의 경쟁력 향상을 위해서는 자사가 보유한 기술에 대한 체계적인 분석이 필요하다. 최근에는 객관적이며 정량화된 기술분류를 위하여 특허문서의 IPC 코드를 이용하여 기술분류를 수행하고 있다. 국제특허분류인 IPC 코드는 국제적으로 규격화된 기술분류 코드이기 때문에, 이를 활용하면 객관적이고 정량화된 기술분석 수행이 가능하다. 본 논문에서는 C사의(社) 특허에 대하여 전수조사를 실시하고, IPC 코드기반 분석 Matrix를 구축한 후 해당특허들을 신뢰도 기반의 연관규칙 마이닝을 실시하며 구조화된 연관맵을 생성한다. 연관맵을 이용하면 해당회사의 특허 현황 파악에 유용하게 활용된다. 또한, 구조화된 연관맵을 이용하면 상호 연관있는 기술에 대하여 군집화를 가능하게 하기 때문에, 본 논문에서 제시한 C사(社)의 기술을 파악할 수 있으며 이를 기반으로 기술 흐름과 향후 기술 전략 수립을 가능하게 한다.

기계학습 알고리즘의 컴퓨팅시간 단축을 위한 새로운 통계적 샘플링 기법 (A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.171-177
    • /
    • 2011
  • 기계학습에서 모형의 정확도와 컴퓨팅시간은 중요하게 다루어지는 부분이다. 일반적으로 모형을 구축하는 데 사용되는 컴퓨팅시간은 분석에 사용되는 데이터의 크기에 비례하여 커진다. 따라서 컴퓨팅시간 단축을 위하여 분석에 사용되는 데이터의 크기를 줄이는 샘플링전략이 필요하다. 하지만 학습데이터의 크기가 작게 되면 구축된 모형의 정확도도 함께 떨어지게 된다. 본 논문에서는 이와 같은 문제를 해결하기 위하여 전체데이터를 분석하지 않아도 전체를 분석할 때와 비슷한 모형성능을 유지할 수 있는 새로운 통계적 샘플링방법을 제안한다. 주어진 데이터의 구조에 따라 최선의 통계적 샘플링기법을 선택할 수 있는 기준을 제시한다. 군집, 층화, 계통추출에 의한 통계적 샘플링기법을 사용하여 정확도를 최대한 유지하면서 컴퓨팅시간을 단축할 수 있는 방법을 보인다. 제안방법의 성능을 평가하기 위하여 객관적인 기계학습 데이터를 이용하여 전체데이터와 샘플데이터 간의 정확도와 컴퓨팅시간을 비교하였다.

군집분석과 베이지안 학습을 이용한 웹 도서 동적 추천 시스템 (Dynamic Recommendation System for a Web Library by Using Cluster Analysis and Bayesian Learning)

  • 최준혁;김대수;임기욱
    • 한국지능시스템학회논문지
    • /
    • 제12권5호
    • /
    • pp.385-392
    • /
    • 2002
  • 기존의 동적 추천 시스템에서 사용하는 개인화 기법은 주로 혈업 필터링 방식으로서 다른 사용자들에 대한 평가 정보를 이용하여 동적 링크를 제공하기 때문에 사용자가 고려하지 못한 아이템들을 추천한다는 장점을 갖고 있다. 그러나 협업필터링 과정은 현재 사용자와 가장 유사한 패턴을 보이는 사용자를 선택하기 위해 전체 사용자와의 유사도를 재 계산해야 한다는 계산의 복잡성과 사용자 프로화일의 정보가 현 사용자의 키워드 입력 시점에서 동적으로 갱신되지 않기 때문에 오류정보가 포함될 수 있다는 문제점이 있다. 보 논문에서는 유사한 선호도를 보이는 사용자를 대상으로 군집분석을 수행함으로서, 이웃 사용자를 선택하는 과정을 단순화할 수 있고 또한 베이지안 학습을 이용하여 사용자의 선호도를 동적으로 갱신할 수 있는 알고리즘을 설계하고 구현하였다. 사용자의 키워드가 입력되는 순간 사전 데이터와 사후 데이터가 선호도 확률에 동적으로 반영됨으로써 오류정보를 최소화한다. 이렇게 설계된 시스템은 실험을 통해 웹 도서 추천시스템에 적용되어 사용자의 만족도를 증가시킬 수 있음을 보인다.

C-Means 클러스터링 기반의 Type-2 퍼지 논리 시스템을 이용한 비선형 모델 설계 (Design of Nonlinear Model Using Type-2 Fuzzy Logic System by Means of C-Means Clustering)

  • 백진열;이영일;오성권
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.842-848
    • /
    • 2008
  • 본 논문에서는 비선형 모델의 설계를 위해 Type-2 퍼지 논리 집합을 이용하여 불확실성 문제를 다룬다. 제안된 모델은 규칙의 전 후반부가 Type-2 퍼지 집합으로 주어진 Type-2 퍼지 논리 시스템을 설계하고 불확실성의 변화에 대한 비선형 모델의 성능을 해석한다 여기서 규칙 전반부 멤버쉽 함수의 정점 선택은 C-means 클러스터링 알고리즘을 이용하고, 규칙 무반부 퍼지 집합의 정점 결정에는 경사 하강법(Gradient descent method)을 이용한 오류 역전파 알고리즘을 사용하여 학습한다. 또한, 제안된 모델에 관련된 파라미터는 입자 군집 최적화(Particle Swarm Optimization; PSO) 알고리즘으로 동조한다. 제안된 모델은 모의 데이터집합(Synthetic dadaset), Mackey-Glass 시계열 공정 데이터를 적용하여 논증되고, 기존 Type-1 퍼지 논리 시스템과의 근사화 및 일반화 능력에 대하여 비교 토의한다.

강수/비강수 사례 분류를 위한 RBFNN 기반 패턴분류기 설계 (Design of RBFNN-Based Pattern Classifier for the Classification of Precipitation/Non-Precipitation Cases)

  • 최우용;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.586-591
    • /
    • 2014
  • 본 연구에서는 인공 벌 군집(ABC: Artificial Bee Colony) 알고리즘을 이용하여 주어진 레이더 데이터로부터 강수 사례와 비강수 사례를 분류하는 방사형 기저함수 신경회로망(RBFNNs: Radial Basis Function Neural Networks)분류기를 소개한다. 기상청에서 사용하고 있는 기상 레이더 데이터의 특성 분석을 통해 입력 데이터를 구성한다. 방사형 기저함수 신경회로망의 조건부에서는 Fuzzy C-Means 클러스터링 방법을 이용하여 적합도를 계산하고, 결론부에서는 최소자승법(LSE: Least Square Method)을 이용하여 다항식 계수를 추정한다. 추론부에서 최종출력 값은 퍼지 추론 방법을 이용하여 얻어진다. 제안된 분류기의 성능은 기상청에서 사용하는 QC와 CZ 데이터를 고려하여 비교 및 분석되어진다.