• 제목/요약/키워드: 퍼지 마이닝

검색결과 34건 처리시간 0.039초

Fuzzy Utility를 활용한 연관규칙 마이닝 시스템을 위한 알고리즘의 구현에 관한 연구 (A Study on the Implementation of an optimized Algorithm for association rule mining system using Fuzzy Utility)

  • 박인규;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.19-25
    • /
    • 2020
  • 빈발 패턴 마이닝에서 각 패턴이 가지는 불확실한 정보로 인하여 정보의 손실을 수반하기 마련이다. 또한 실제적인 환경에서는 패턴들의 중요도가 시간에 따라서 변하기 때문에 이러한 요구에 부합하기 위하여 퍼지논리를 적용하고 패턴이 가지는 중요도의 동적특성을 고려하여야 한다. 본 논문에서는 웹 로그 데이터베이스에서 퍼지 유틸리티 기반 웹페이지 집합 마이닝을 통해 웹 로그 데이터베이스에서 빈발 웹 페이지 집합의 추출을 위한 퍼지 유틸리티 마이닝 기법을 제안한다. 여기서 퍼지 집합의 하향 폐쇄 특성은 최소 퍼지 유틸리티 임계 값(MFUTV) 및 사용자 정의 백분위 수(UDP)에 의해 넓은 공간을 제거하기 위해 적용된다. 여러 실험을 통하여 제안하는 기법은 매우 효과이며 확장성이 좋은 것임을 보인다.

사용자의 피드백을 통한 퍼지 연관규칙의 웹 사용자 마이닝 (Web Usage Mining Using Fuzzy Association Rule Considering User Feedback)

  • 장재성;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.49-51
    • /
    • 2001
  • 데이터 마이닝은 KDD의 분야로서, 의미 있는 정보와 관심 있는 행동 패턴을 추출해 나가는 과정이다. WWW의 발전으로, 웹 데이터가 거대해지고 있다. 이러한 데이터 마이닝 분야에서도, 웹 사용 마이닝의 목적은 의미 있는 사용자 행동 패턴을 찾아내는 것이다. 특히 현재 전자상거래가 널리 활성화되고 있는 환경에서, 사용자의 특성을 발견해내는 것은 매우 중요한 부분이다. 사용자의 특성에 따라 사용자에게 상품을 추천하거나 메일을 보내는 것이나 사용자에게 적절하게 사이트를 구축하는 것이 가능하다. 전처리 과정을 통해서 추출된 트랜잭션 데이터를 모호한 사용자의 요구를 분석할 수 있는 퍼지 집합으로 변형시켜 Fuzzy Association Rule을 통해 분석한다. 그리고 분석된 결과에 대한 규칙을 사용자의 피드백을 통해서 다시 분석하는 과정을 거치게 된다. 사용자의 요구 사항을 적절히 반영할 수 있다.

  • PDF

다중 구조적응 자기구성지도의 퍼지결합을 이용한 웹 마이닝 (Web Mining Using Fuzzy Integration of Multiple Structure Adaptive Self-Organizing Maps)

  • 김경중;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.61-70
    • /
    • 2004
  • 폭발적으로 성장하고 있는 웹은 수백만 개의 웹 문서를 포함하고 있기 때문에, 적절한 웹사이트를 찾기 어렵다. 사용자 프로파일을 사용하여 적절한 웹사이트를 추천함으로써 웹의 탐색을 개인화 할 수도 있지만 웹 컨텐츠에 대한 사용자의 평가는 사용자의 성격에 관한 다양한 측면을 표현하므로 사용자의 선호도를 예측하기 위해서는 보다 효과적인 방법이 필요하다. 사용자 프로파일은 비선형적인 특성을 가지고 있으므로 분류기를 사용하여 예측하여야 하며 다양한 특성을 예측하기 위해 분류기의 결합이 필요하다. 패턴분류와 시각화에 유용한 구조적응 자기구성지도(SASOM)는 개선된 SOM 모델로서 웹 마이닝에 적절하다. 퍼지 적분은 주관적으로 정의된 분류기의 중요도를 이용하여 결합하는 방법이다. 본 논문에서는 독립적으로 학습된 SASOM의 퍼지적분(fuzzy integral)기반 결합을 이용하여 사용자의 프로파일을 예측하고 UCI 벤치마크 데이타인 Syskill & Webert 데이타를 사용하여 그 성능을 평가한다. 실험결과 제안한 방법이 기존의 naive Bayes 분류기뿐만 아니라 SASOM의 투표결합보다 우수한 성능을 보였다.

퍼지 결정트리를 이용한 패턴분류를 위한 데이터 마이닝 알고리즘 (Data Mining Algorithm Based on Fuzzy Decision Tree for Pattern Classification)

  • 이중근;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1314-1323
    • /
    • 1999
  • 컴퓨터의 사용이 일반화됨에 따라 데이타를 생성하고 수집하는 것이 용이해졌다. 이에 따라 데이타로부터 자동적으로 유용한 지식을 얻는 기술이 필요하게 되었다. 데이타 마이닝에서 얻어진 지식은 정확성과 이해성을 충족해야 한다. 본 논문에서는 데이타 마이닝을 위하여 퍼지 결정트리에 기반한 효율적인 퍼지 규칙을 생성하는 알고리즘을 제안한다. 퍼지 결정트리는 ID3와 C4.5의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법이다. 특히, 퍼지 규칙은 속성 축에 평행하게 판단 경계선을 결정하는 방법으로는 어려운 속성 축에 평행하지 않는 경계선을 갖는 패턴을 효율적으로 분류한다. 제안된 알고리즘은 첫째, 각 속성 데이타의 히스토그램 분석을 통해 적절한 소속함수를 생성한다. 둘째, 주어진 소속함수를 바탕으로 ID3와 C4.5와 유사한 방법으로 퍼지 결정트리를 생성한다. 또한, 유전자 알고리즘을 이용하여 소속함수를 조율한다. IRIS 데이타, Wisconsin breast cancer 데이타, credit screening 데이타 등 벤치마크 데이타들에 대한 실험 결과 제안된 방법이 C4.5 방법을 포함한 다른 방법보다 성능과 규칙의 이해성에서 보다 효율적임을 보인다.Abstract With an extended use of computers, we can easily generate and collect data. There is a need to acquire useful knowledge from data automatically. In data mining the acquired knowledge needs to be both accurate and comprehensible. In this paper, we propose an efficient fuzzy rule generation algorithm based on fuzzy decision tree for data mining. We combine the comprehensibility of rules generated based on decision tree such as ID3 and C4.5 and the expressive power of fuzzy sets. Particularly, fuzzy rules allow us to effectively classify patterns of non-axis-parallel decision boundaries, which are difficult to do using attribute-based classification methods.In our algorithm we first determine an appropriate set of membership functions for each attribute of data using histogram analysis. Given a set of membership functions then we construct a fuzzy decision tree in a similar way to that of ID3 and C4.5. We also apply genetic algorithm to tune the initial set of membership functions. We have experimented our algorithm with several benchmark data sets including the IRIS data, the Wisconsin breast cancer data, and the credit screening data. The experiment results show that our method is more efficient in performance and comprehensibility of rules compared with other methods including C4.5.

퍼지 개념 계층을 이용한 다중 수준 연관 규칙 마이닝의 상향식 접근 (A Bottom-Up Approach for Mining Multiple-Level Association Rules Using Fuzzy Concert Hierarchies)

  • 손봉기;한상훈;이건명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1445-1448
    • /
    • 2000
  • 이 논문에서는 개념간의 애매한 관계를 적절히 표현할 수 있는 퍼지 개념 계층을 참조하여 최하위 개념 수준에서부터 최상위 개념 수준까지 각 수준에서 연관 규칙을 추출하는 다중 수준 상향식 연관규칙 마이닝 방법을 제안한다. 상위 개념 수준에서 빈발 항목 집합을 구하는데 필요한 상위 개념 수준의 트랜잭션 데이터베이스를 생성하는 방법을 소개한다. 또한 제안한 방법의 응용성을 보이기 위해 실험 과정과 결과를 보인다.

  • PDF

데이터 마이닝을 이용한 단기 부하 예측 시스템 연구 (A Study of Short-Term Load Forecasting System Using Data Mining)

  • 주영훈;정근호;김도완;박진배
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.130-135
    • /
    • 2004
  • 본 논문에서는 데이터 마이닝을 이용한 단기 전력 부하 예측 시스템의 새로운 설계 기법을 제안한다. 제안된 단기 부하 예측시스템은 Takagj-Sugeno (T-S) 퍼지 모델 기반 예측기와 분류기로 구성된다. 또한, 제안된 T-S 퍼지 모델 기반 분류기는 전반부 가우시안 집합과 후반부 선형화된 베이지안 분류기로 구성된다 분류기의 파라미터들은 주어진 훈련 집합의 통계적 수치로 쉽게 얻어진다. 제안된 T-S 퍼지 모델 기반 예측기는 한 가지 입력에 대한 선형 시계열 예측기의 볼록 조합 형태를 가진다. 후반부 파라미터 추정 문제는 실제 전력 부하와 예측 전력 부하의 놈(norm)을 최소화하는 볼록 최적화 문제로 간주한다. 그 문제는 선형 행렬 부등식으로 설정됨으로써 후반부 파라미터는 추정된다. 전반부 파라미터 추정문제는 선형 시계열 예측기들이 모여진 전체 T-S 퍼지 시스템의 출력과 실제 전력 부하 사이의 에러를 최소화하는 문제이다. 이 문제는 경사치 하향 기법이 적용하여 해결되었다 제안된 기법의 유용성을 검증하기 위해 본 논문은 하루 후 24시간 전력 부하 예측과 하루 후 최고 전력부하를 예측 실험을 제공한다.

퍼지 연관규칙을 이용한 뉴스레터 시스템 설계 및 구현 (Design AND IMPLEMENTATION of A News letter system using fuzzy association rules)

  • 정연홍;박우수;박규석
    • 인터넷정보학회논문지
    • /
    • 제3권5호
    • /
    • pp.41-49
    • /
    • 2002
  • 웹 마이닝은 World Wide Web으로부터 유용한 정보를 발견하고 분석하는 일로 정의 할 수 있다. 본 논문에서는 이러한 웹 마이닝을 통하여, 사용자 접근 페이지(성향)를 분석하고, 사용자에게 유용한 정보를 제공할 수 있는 시스템을 구축 하였다. 제안 시스템은 웹 사이트를 방문한 사용자의 행동과 발송된 뉴스레터로부터의 행동에 따른 정보를 조사하고 필터링을 통해 카테고리별로 분류과정을 거친다. 이러한 과정을 통해 생성된 각 카테고리에 대해 최근에 접근한 사용자들에 퍼지 연관규칙 (fuzzy association rules)을 적용하며, 이렇게 생성된 집합과 각 사용자가 접근한 페이지들의 집합을 비교하여 각 사용자에게 적합한 뉴스레터를 발송할 수 있다.

  • PDF

데이터 마이닝과 지능 모델링에 기반한 에칭공정의 공정관리시스템 설계 (Design of Process Management System based on Data Mining and Artificial Modelling for the Etching Process)

  • Bae, Hyeon;Kim, Sung-shin;Woo, Kwang-Bang
    • 한국지능시스템학회논문지
    • /
    • 제14권4호
    • /
    • pp.390-395
    • /
    • 2004
  • 반도체 공정은 많은 단위 공정으로 이루어진 복잡하고 동적인 공정이다. 그 중 에칭공정은 반도체 생산에서 중요한 공정중 하나이다. 본 논문에서는 데이터 마이닝과 지식 획득을 통한 의사지원시스템으로 생산성과 수율을 높일 수 있는 시스템을 구성하고자 하였다. 제안된 방법은 퍼지 논리와 신경망으로 구성되는데, 신경망으로 에칭공정의 품질을 나타내는 품질에 대한 결과를 예측하고, 예측된 결과를 퍼지 추론 시스템으로 분류하는 과정으로 수행된다. 퍼지 논리에 사용된 규칙은 전문가의 지식에 기반 하여 도출되거나 데이터로부터 도출된다. 본 시스템을 통해 공정의 최적 조건을 찾아 효율을 높이는 것이 본 연구의 주요 목표이다.

개선된 밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병 (Cluster Merging Using Enhanced Density based Fuzzy C-Means Clustering Algorithm)

  • 한진우;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제14권5호
    • /
    • pp.517-524
    • /
    • 2004
  • 1960년대 퍼지 이론이 소개된 이후 데이터 마이닝을 포함한 기계 학습 분야의 군집화 작업에서 퍼지 이론이 폭넓게 사용되었다. 퍼지 C-평균 알고리즘은 가장 많이 사용되는 퍼지 군집화 알고리즘이다. 이 알고리즘은 하나의 데이터 개체가 서로 다른 소속 정도를 가지고 각 군집에 할당될 수 있도록 한다. 퍼지 C-평균 알고리즘도 K-평균 알고리즘과 같은 일반적인 군집화 알고리즘과 마찬가지로 초기 군집수와 군집 중심의 위치에 의해 최종 군집 결과의 성능 차이가 나타난다. 군집화를 위한 이러한 초기 설정은 주관적이며 이 때문에 적절치 못한 결과를 얻게 될 수도 있다. 본 논문에서는 이 문제를 해결할 수 있는 방법으로 주어진 학습 데이터의 속성을 기반으로 한 초기 군집수와 군집 중심을 결정하는 개선된 밀도 기반의 퍼지 C-평균 알고리즘을 제안하였다. 제안 방법은 격자를 사용하여 초기 군집 중심의 위치와 군집수를 결정하였다. 기존에 많이 이용되었던 객관적인 기계 학습 데이터를 이용하여 제안 알고리즘의 성능비교를 수행하였다.

벤 다이어그램 기반 퍼지 집합 시각화 (Visualizing Fuzzy Set Based on Venn Diagram)

  • 박예슬;박진아
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.15-20
    • /
    • 2009
  • 퍼지 정보 시스템이 요구되는 다량의 데이터들은 퍼지 집합 시각화를 통한 다양한 분석을 필요로 한다. 따라서 본 연구는 퍼지 데이터 집합을 벤 다이어그램을 이용하여 시각화하는 방법을 제안하였다. 여러 주제에 관련되고 관련순위를 갖는 퍼지 데이터를 대상으로 여러 주제를 동시에 갖고 있는 데이터 집합과 여러 주제를 갖고 있는 모든 데이터들의 집합, 그리고 한 주제와 관련되지 않은 데이터 집합을 효과적으로 시각화하여 사용자가 원하는 결과를 제공할 수 있도록 하였다. 또한 서로 다른 주제 클러스터를 겹치거나 포개어서 결과 데이터를 표현하므로 사용자 중심의 정보 검색을 도모한다. 이러한 방법은 웹 검색 엔진 사용자와 웹 개발자에게 원하는 웹 문서를 보다 빠르게 전달 할 수 있는 장점을 갖으며 그 외, 정보 추출과 관련된 여러 목적으로 유용하게 쓰일 수 있는 발전 가능성이 있다.

  • PDF