DOI QR코드

DOI QR Code

Clustering Analysis of Effective Health Spending Cost based on Kernel Filtering Techniques

커널필터링 기법을 이용한 건강비용의 효과적인 지출에 관한 군집화 분석

  • 정용규 (을지대학교 의료IT마케팅학과) ;
  • 최영진 (을지대학교 의료경영학과) ;
  • 차병헌 (을지대학교 임상병리학과)
  • Received : 2015.08.11
  • Accepted : 2015.09.23
  • Published : 2015.09.30

Abstract

As Data mining is a method of extracting the information based on the large data, the technique has been used in many application areas to deal with data in particular. However, the status of the algorithm that can deal with the healthcare data are not fully developed. In this paper, One of clustering algorithm, the EM and DBSCAN are used for performance comparison. It could be analyzed using by the same data. To do this, EM and DBSACN algorithm are changing performance according to the variables in Health expenditure database. Based on the results of the experimental data, We analyze more precise and accurate results using by Kernel Filtering. In this study, we tried comparison of the performance for the algorithm as well as attempt to improve the performance. Through this work, we were analyzed the comparison result of the application of the experimental data and of performance change according to expansion algorithm. Especially, Collects data from the various cluster using the medical record, it could be recommended the effective spending on medical services.

데이터마이닝은 방대한 데이터를 기반으로 정보를 추출하는 방법으로 많은 분야에 적용하고 있으며 특히 보건의료 데이터를 다루는 기법으로 많이 활용 되고 있다. 하지만 데이터가 다양하고 방대해짐에 따라 데이터들을 완벽하게 다룰 수 있는 알고리즘이 개발되지 못한 현황이다. 따라서 본 논문에서는 군집화 알고리즘 중의 하나인 DBSCAN 알고리즘과 EM 알고리즘의 성능을 동일한 데이터에 대하여 분석을 시도하였다. 이를 위하여 DBSACN과 EM 알고리즘에 따른 변화를 Health expenditure 실험데이터의 결과를 기반으로 분석 하였고 더욱 정확한 실험과 더욱 정확한 결과를 알아내기 위하여 Kernel Filtering을 통하여 정확한 데이터분석을 시도하였다. 본 연구에서는 알고리즘의 기술적 성능을 비교한 것을 물론이고 성능을 높이기 위한 시도를 하였다. 이를 통하여 확장한 알고리즘에 따른 성능의 변화와 실험데이터의 적용결과를 기반으로 비교하고 이를 분석하게 되었다. 특히 의료기관을 이용하는 다양한 군집으로부터 데이터 레코드를 수집하여 의료 서비스에 대한 효과적인 비용 지출을 권장할 수 있도록 실험하였다.

Keywords

References

  1. Doddi, S., Achla Marathe, Ravi, S. S., and Torney, D. C. (2001), "Discovery of association rules in medical data", Informatics for Health and Social Care, 26(1), 25-33. https://doi.org/10.1080/14639230117529
  2. Hosking, J. R. M. and Wallis, J. R. (2005), Regional frequency analysis: an approach based on Lmoments, Cambridge University Press.
  3. Kirchhoff, W. H. (2012), "LOGISTIC FUNCTION PROFILE FIT: A least-squares program for fitting interface profiles to an extended logistic functiona)", Journal of Vacuum Science and Technology, A 30.5, 051101. https://doi.org/10.1116/1.4736865
  4. Malefaki, S., Trevezas, S., and Limnios, N. (2010), "An EM and a stochastic version of the EM algorithm for nonparametric Hidden semi-Markov models", Communications in Statistics-Simulation and Computation(R), 39(2), 240-261. https://doi.org/10.1080/03610910903411185
  5. Palaniappan, S. and Awang, R. (2008), "Intelligent heart disease prediction system using data mining techniques", 108-115.
  6. Witten, I. H. and Frank, E. (2005), Data Mining: Practical machine learning tools and techniques, Morgan Kaufmann.