Abstract
Various statistical classification methods have been used to establish prediction model of underground cultural assets in our country. Among them, linear discriminant analysis, logistic regression, decision tree, neural network, and support vector machines are used in this paper. We introduced the basic concepts of above-mentioned classification methods and applied these to the analyses of real data of I city. As a results, five different prediction models are suggested. And also model comparisons are executed by suggesting correct classification rates of the fitted models. To see the applicability of the suggested models for a new data set, simulations are carried out. R packages and programs are used in real data analyses and simulations. Especially, the detailed executing processes by R are provided for the other analyser of related area.
본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 국내 I시 자료를 사용하여 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형에 대한 성능비교와 함께, 새로운 자료에 대한 적용성 평가를 위해 모의실험을 수행하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R 언어를 사용하였으며, 구체적 분석과정을 제시하였다.