DOI QR코드

DOI QR Code

클러스터 기반 퍼지 모델트리를 이용한 데이터 모델링

Data Modeling using Cluster Based Fuzzy Model Tree

  • 이대종 (충북대학교 BK21 충북정보기술사업단) ;
  • 박진일 (충북대학교 전기전자컴퓨터공학부) ;
  • 박상영 (한국 수자원공사 수자원연구원) ;
  • 정남정 (한국 수자원공사 수자원연구원) ;
  • 전명근 (충북대학교 전기전자컴퓨터공학부)
  • 발행 : 2006.10.25

초록

본 논문에서는 퍼지 클러스터 기법을 이용하여 구간 분할된 퍼지 모델트리의 제안과 이를 이용한 데이터 모델링 기법을 다룬다. 제안된 방법은 먼저 입력과 출력변수의 속성을 고려한 퍼지 클러스터링에 의해 중심벡터를 계산한 후, 중심벡터들과 입력속성간의 소속도를 이용하여 구간 분할된 영역별로 각각의 선형모델을 구축한다. 노드의 확장은 부모노드(parent node)에서 만들어진 모델에서 계산된 오차값과 자식노드(child node)에서 계산된 오차값을 비교하여 이루어진다. 출력값 예측 단계에서는 입력된 데이터와 잎노드에서 계산된 클러스터 중심값과 비교하여 소속도가 높은 선형모델을 선택하여 데이터에 대한 출력값을 예측하게 된다. 제안된 방법의 우수성을 보이기 위해 다양한 데이터를 대상으로 실험한 결과, 기존의 모델트리방식 및 뉴럴 네트워크 기반의 신경회로망 보다 향상된 성능을 보임을 알 수 있었다.

This paper proposes a fuzzy model tree consisting of local linear models using fuzzy cluster for data modeling. First, cluster centers are calculated by fuzzy clustering method using all input and output attributes. And then, linear models are constructed at internal nodes with fuzzy membership values between centers and input attributes. The expansion of internal node is determined by comparing errors calculated in parent node with ones in child node, respectively. As a final step, data prediction is performed with a linear model having the highest fuzzy membership value between input attributes and cluster centers in leaf nodes. To show the effectiveness of the proposed method, we have applied our method to various dataset. Under various experiments, our proposed method shows better performance than conventional model tree and artificial neural networks.

키워드

참고문헌

  1. Jiawei Han, Micheline Kamber, 'Data Mining : Concepts and Techniques', MORGAN KAUFMANN, pp550, 2001
  2. Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, Willy Interscience, 2000
  3. Kass, Chi-squard Automatic Interaction Detection, Magidson and SPSS inc., 1980
  4. Breiman, L., Friedman, J.H., Olshen, R.A. and Stone, C.J., 'Classification and regression tree', Belmont CA:Wadsworth, 1984
  5. Quilan, J.R., 'C4.5: Programs for machine learning', Morgan Kaufmann, 1993
  6. Donato Malerbe, and et al, 'Stepwise Indcution of Model Trees, LNAI 1275, pp.20-32m 2001
  7. Quinlan J.R. 'Learning with continuous classes' in Proceedings AI'92, Adams & Sterling (Eds.), World Scientific, pp. 343-348, 1992
  8. Karalic A, 'Linear regression in regression tree leaves, in Proceedings of ISSEK'92, Bled, Solvenia, 1992
  9. Wang Y., Witten I.H., 'Inducing Model Trees for Continuous Classes', in Poster Paper of the 9th European Conference on Machine Learning (ECML 97)., M. van Someren, & G. Widmer (Eds.), Prague, Czech Republic, pp. 128-137, 1997
  10. Lanubile A., Malerba D, 'Induction of regression trees with Regtree', in Book of Short Paper on Classification and Data Analysis', Pescara, Italy, pp.253-260, 1997
  11. Torgo L, 'Kernel Regression Trees', in Poster paper of 9th European Conference on Machine Learning (ECML 97), M. van Someren, & G. Widmer (Eds.), Prague, Czech Republic, pp. 118-127, 1997
  12. Torgo L, 'Functional Models for Regression Tree Leaves', in Proceedings of the Fourteenth International Conference (ICML '97), D. Fisher (Ed.), Nashville, Tennessee, pp.385-393, 1997
  13. Witold Pedrycz, 'C-Fuzzy Decision Trees', IEEE Trans. on System, Man, and Cybernetics, Part C, Vol. 35, No.4, pp. 498-511, 2005 https://doi.org/10.1109/TSMCC.2004.843205
  14. J.C. Bezdk, Pattern Recognition with Fuzzy Objective Algorithms, Plenum Press, New York, 1981
  15. http://www.sgi.com/tech/mlc/db
  16. Guang-Bin Huang and et al, Extreme learning machine:Theory and applications', Avaiable online at www.sciencedirect.com, 2006
  17. http://www.cs.waikato.ac.nz/~ml/wek/iindex.html