• 제목/요약/키워드: SOM 알고리즘

검색결과 100건 처리시간 0.025초

시공간 데이터를 위한 클러스터링 기법의 성능 비교

  • 강주영;이봉재;송재주;신진호;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.49-51
    • /
    • 2004
  • 최근 GPS시스템, 감시 시스템, 기상 관측 시스템과 같은 다양한 응용 시스템으로부터 수집된 시공간 속성을 가진 데이터를 분석하고자 하는 시공간 데이터 마이닝에 대한 관심이 더욱 높아지고 있다. 기존의 시공간 데이터 마이닝에 대한 연구는 문자.숫자 데이터를 기반의 마이닝 기법을 그대로 적용하고 있기 때문에 데이터의 시공간 속성을 충분히 고려한 분석으로는 한계가 많은 것이 사실이다. 본 논문에서는 패턴 인식과 클러스터링 능력이 뛰어나다고 알려진 SOM을 기반으로 시공간 클러스터링 모듈을 개발하고, 개발된 모듈의 성능과 클러스터링 정확성에 대하여 K-means, 응집 계층 알고리즘(Average Linkage, Ward)과 비교함으로써 시공간 데이터 마이닝을 위한 각 알고리즘들의 성능을 분석하였다 또한 입력 데이터의 특성과 클러스터링 결과를 더욱 정확하게 나타내어 가시적인 분석을 도울 수 있도록 시공간 데이터 클러스터링을 위한 가시화 모듈을 개발하였다.

  • PDF

사용자 클러스터링을 통한 개선된 협력적 정보여과 (Improved Collaborative Information Filtering with User Clustering)

  • 김학균;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.75-77
    • /
    • 1999
  • 정보추천 시스템은 사용자가 어떤 정보를 선호하는지를 식별함으로써 산재한 정보 중에서 적절한 정보만을 제공하는 것을 목표로 한다. 이러한 정보추천 시스템에서 사용되는 정보여과 기술에는 내용기반 여과와 협력적 여과가 있다. 기존의 협력적 정보여과 기술은 선호도를 적게 제시한 사용자에게 정보를 추천하기 어렵고, 동일한 상품 정보에 대해서 사용자의 평가가 없을 경우 사용자간의 유사성을 판단하기 어려운 단점이 있다. 본 논문은 SVD (Singular Value Decomposition)를 통해 사용자 프로파일을 정량화함으로써 사용자 선호도 행렬로부터 숨어있는 의미정보를 추출하여 동일한 정보에 대해 선호도를 평가해야 한다는 단점을 극복한다. 이때, 사용자 프로파일 벡터를 비감독 학습 알고리즘인 SOM (Self0Organizing Map)으로 클러스터링하여 사용자를 분류하고, 정보추천은 사용자 그룹간에서 이루어지며 Pearson correlation 알고리즘을 이용한다. 기존의 방법과 비교한 결과, 제안한 방법이 새로운 사용자에 대해서도 적절한 정보를 추천할 수 있음을 볼 수 있었다.

  • PDF

균등 자세 지도를 이용한 귀납적 동작 편집 기법에 관한 연구 (A Study on an Inductive Motion Edit Methodology using a Uniform Posture Map)

  • 이범로;정진현
    • 한국통신학회논문지
    • /
    • 제28권2C호
    • /
    • pp.162-171
    • /
    • 2003
  • 키프레임 애니메이션 기법에 비해 보다 사실적이고 효율적인 작업을 가능하게 한 동작 포착 기법에 의한 동작데이터는 편집의 어려움으로 인해 재사용이 용이하지 못하다는 문제를 가진다. 본 논문에서는 효과적인 동작 포착데이터 편집 기법으로써 비감독 학습 기반의 균등 자세 지도(uniform posture map: UPM)를 이용한 동작 편집 기법을 제안한다. 다른 동작 편집 알고리즘들에 비하여 UPM 알고리즘은 상대적으로 적은 계산량을 요구하여 실시간 적용에 용이하며, 특히 자기 조직 지도(self-organizing map: SOM) 알고리즘을 이용한 동작 편집을 할 때, 실제로 존재하지 않은 자세가 포함될 수 있는 가능성을 학습 단계에서 제거함으로써 자세 생성에 있어서 안정성을 확보할 수 있다. 또한 제약조건이 많은 복잡한 대상체에 대한 적용에 있어서 제약조건의 수에 비례해서 계산량이 증가하는 기존 알고리즘의 약점을 보완한다. 본 논문에서는 UPM 알고리즘을 이용한 동작 편집 기법의 응용으로서 동작 전이 분야와 역운동학 분야에서의 적용 사례를 보였다. 본 논문의 제안 알고리즘은 가상 현실이나 컴퓨터 애니메이션, 게임들의 분야에 다양하게 적용될 수 있다.

u-City응용에서의 시간 패턴을 이용한 단기 전력 부하 예측 (Short-term Power Load Forecasting using Time Pattern for u-City Application)

  • 박성승;손호선;이동규;지은미;김희석;류근호
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권2호
    • /
    • pp.177-181
    • /
    • 2009
  • u-City 활용을 위한 u-공공시설의 개발은 첨단 건축기술과 유비쿼터스 컴퓨팅의 통합으로 새로운 형식의 공간계획과 공공시설물을 내외부에 설치하기 위해 건물의 기반 서비스 시설인 냉난방, 공조, 조명 그리고 전력 관련 시설들의 기반이 구축되어야 한다. 따라서 이 논문에서는 이러한 기반 서비스를 위한 가장 기본적인 것 중 하나인 단기 전력 시스템의 수요와 공급 문제를 해결하기 위하여 시계열 분석을 적용한 시간 패턴 분석을 통해 전력 수요 예측 기술을 제안한다. 시간 패턴 분석을 위해 SOM 알고리즘과 k-means 기법을 적용하여 요일별, 시간별 데이터를 군집화하고 그 자료를 이용하여 시간 패턴 분석 방법인 지수평활기법과 ARIMA 모형을 비교 분석하였다. 제안 시스템 성능 평가 결과 지수평활기법 보다 ARIMA 모형을 적용한 시스템이 더 좋은 결과를 보였다. 따라서, 이러한 전력 부하 예측 결과를 이용하여 전력 공급의 수요에 따른 계획이나 시스템 운영을 효과적으로 할 수 있다.

  • PDF

다중 클래스 아다부스트를 이용한 엘리베이터 내 군집 밀도 추정 (Crowd Density Estimation with Multi-class Adaboost in elevator)

  • 김대훈;이영현;구본화;고한석
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권7호
    • /
    • pp.45-52
    • /
    • 2012
  • 본 논문에서는 다중 클래스 아다부스트 기반의 분류기를 이용하여 엘리베이터 내 군집 밀도를 추정하는 방법을 제안한다. SOM을 사용하는 기존의 방법은 재현성이 떨어지며 충분한 성능을 내지 못한다. 제안한 방법은 GLDM(Grey-Level Dependency Matrix)과 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징과 다중 클래스 아다부스트 기반의 분류기를 통해 실내 군집 밀도를 추정한다. 다중 클래스를 분류하기 위해 기존의 아다부스트 알고리즘에서 웨이트 업데이트 식을 변형하여 더 높은 성능의 약한 분류기를 생성하도록 하였다. 군집 밀도는 인원수에 따라 0명, 1~2명, 3~4명, 5명 이상 등 네 가지 클래스로 구분하였다. 엘리베이터 내 영상을 이용한 모의 실험 결과 제안된 방법은 기존의 방법보다 약 20% 정도의 검출률 향상을 나타내었다.

LVQ를 이용한 퍼지 규칙 생성 (Fuzzy Rules Generation using the LVQ)

  • 이남일;장광규;신웅철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.394-399
    • /
    • 1998
  • 본 논문에서는 Kohonen SOM을 이용한 인식 학습 알고리즘인 LVQ를 이용하여 퍼지 규칙의 수를 줄이는 방안을 제안하였다. 많은 훈련 패턴을 입력하게 되면 그에 따른 퍼지 규칙 수가 증가하게 되고, 많은 기억용량과 분류에 긴 시간을 필요로 하는 문제점 있어 퍼지 규칙의 수를 줄이고자 한다. 그러나 퍼지 규칙의 수가 줄어듦으로서 발생하는 성능의 하락을 최소화하기 위하여 초기 참조 패턴이 입력 데이터에 근접하도록 훈련 된 후에 퍼지 규칙을 생성하였다. 생성된 퍼지 규칙은 LVQ를 이용하여 인식되기 바로 전에 가중치 벡터를 이용하여 근접하는 값 이내에 있는 가중치 벡터 값을 합하여 같은 퍼지 규칙을 부여하여 생성하였다. 그 결과로 5$\times$8 숫자 Gray scale를 이용하여 전체 146개의 가중치 벡터가 15개의 아주 적은 수의 퍼지 규칙으로 생성되었다.

  • PDF

NCEP 일기도 데이터 클러스터링을 위한 특징 벡터 추출 (Feature vector extraction for NCEP weather data clustering)

  • 이기범;이성환;정창성;황치정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.583-585
    • /
    • 2001
  • 방대한 양의 격자점 데이터 및 일기도 관련 데이터를 효율적으로 저장 및 검색 하기위해서는 데이터들의 유형을 찾아 서로 유형이 비슷한 데이터를 하나의 클러스터로 연관지어 놓으면 효율적인 저장과 검색을 할 수 있다. 클러스터링에서 데이터들의 어떤 특징 벡터를 추출하는가가 클러스터링의 결과에 가장 중요한 영향을 끼친다. 본 논문에서는 격자점, 기압값 데이터로부터 일기도의 특징을 표현할 수 있는 벡터로 변환 한반도도 중심의 8방향에 대한 고/저기압의 분포와 동아시아 지역을 24영역으로 나누어 각 영역별로 고/저기압의 분포 정보를 특징벡터로 추출하여 클러스터링하였다. 클러스터팅 알고리즘으로는 unsupervised mode인 SOM(Self Organizing Map) 기법을 사용하였다.

  • PDF

데이터 마이닝을 위한 신경망 클러스터링 기법에 관한 연구 (Hybrid Neural Network Clustering Using SOM and BP for DataMing)

  • 김만선;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.160-162
    • /
    • 2001
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 실제 응용분야에선 수집된 데이터는 시간이 지날수록 데이터의 양이 늘어나게 되고, 중복되는 속성과 잡음을 갖게 되어 마이닝 기법을 이용하는데 많은 시간과 비용이 소요된다. 또한 어느 속성이 중요한지 알 수 없어 중요한 속성이 중요하지 않은 속성에 의해 왜곡되거나 제대로 분석되지 않을 수 있다. 이 논문은 이러한 문제점들을 해결하기 위해, 대용량의 데이터에 적용할 수 있고 데이터에서 알려지지 않은 패턴을 발견할 뿐만 아니라, 사용자가 얻고자 하는 출력을 생성할 수 있는 혼합형 신경망 클러스터링 기법을 제안한다. 그리고 알고리즘의 타당성을 검증하기 위해 몇 가지 벤치마크데이터를 이용하여 본 논문의 타당성을 보인다.

  • PDF

신경회로망을 이용한 송전선로 보호용 방향 개전 및 고장상 선택 알고리즘 (A Fault Classification and Direction Estimation Algorithm by Neural Network)

  • 최창열;이명수;이재규;유석구
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 A
    • /
    • pp.332-334
    • /
    • 2003
  • The direction and the type of a fault on a transmission line needs to be identified rapidly and correctly. This paper presents a approach to identify fault direction and type with neural network on double circuit transmission line. A neural network based on self organization map(SOM) provides the ability to accurately classify the fault type and to select of a fault direction. In this paper, proposed algorithm uses different patterns of the associated voltages and currents in order to identify fault clusters.

  • PDF

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.