• 제목/요약/키워드: 의사결정 나무모형

검색결과 228건 처리시간 0.028초

생명보험사의 개인연금 보험예측 사례를 통해서 본 의사결정나무 분석의 설명변수 축소에 관한 비교 연구 (A study on the comparison of descriptive variables reduction methods in decision tree induction: A case of prediction models of pension insurance in life insurance company)

  • 이용구;허준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권1호
    • /
    • pp.179-190
    • /
    • 2009
  • 금융 산업에서, 의사결정나무 분석은 분류분석을 위해서 널리 사용되는 분석기법이다. 그러나 금융 산업에서 실제로 의사결정나무 분석을 적용할 때, 발생하는 문제점 중 하나는 설명변수의 수가 너무 많다는 점이다. 따라서 모형의 결과에 별 영향을 미치지 않으면서 설명변수의 수를 줄이는 효과적인 방법을 연구할 필요가 있다. 본 연구에서는 의사결정 나무 분석에서 모형의 정확성에 근거한 최선의 변수 선택 방법을 구하기 위하여 다양한 변수 선택방법들을 비교 분석 하였다. 이를 위하여 본 연구에서는 한 보험회사의 연금 보험 상품 자료에 다양한 설명변수 축소방법을 적용하여, 가장 적은 수의 설명변수를 가지고 가장 높은 정확도를 제공하여 주는 설명변수 축소방법을 구하는 실증적인 연구를 시행하였다. 이러한 실험결과, 신경망의 민감도 분석을 이용하여 변수를 축소하고, 그 축소된 변수를 이용하여 의사결정나무 분석 모델을 생성하는 경우가 가장 효율적인 설명변수 축소방법임을 알 수 있었다.

  • PDF

의사결정나무와 신경망 모형 결합에 의한 운전자 우회결정요인 분석 (Drivers Detour Decision Factor Analysis with Combined Method of Decision Tree and Neural Network Algorithm)

  • 강진웅;금기정;손승녀
    • 한국도로학회논문집
    • /
    • 제13권3호
    • /
    • pp.167-176
    • /
    • 2011
  • 본 연구는 불특정 다수의 도로이용자들이 경로우회 시 갖는 의사결정과정속에 내포된 비선형성과 불확실성을 고려한 정도 있는 모형구축으로 주요 우회결정요인을 분석하는 것이 주요 목적이다. 이를 위하여 고속도로 및 국도를 이용하는 운전자를 대상으로 우회여부에 관련된 SP조사를 실시하였고, 조사결과에 대하여 의사결정나무와 신경망이론의 결합된 모형을 구축하여 운전자 우회결정요인을 분석하였다. 분석결과 운전자 우회여부결정에 영향을 미치는 요인은 우회도로 인지여부, 교통정보 신뢰도 및 이용빈도, 경로전환빈도, 나이순으로 나타났다. 또한 오분류표를 통한 기존 모형과의 예측력의 비교결과 결합된 모형의 오분류율이 8.7%로 기존 모형인 로짓모형 12.8%, 의사결정나무 단독 모형 13.8%와 비교했을 때 가장 예측력이 높은 것으로 나타나 운전자 우회결정요인 분석에 관한 모형의 적용 타당성을 확인할 수 있었다. 본 연구의 결과는 향후 교통량 분산효과와 도로망 효율 증대를 위한 효과적인 우회관리전략 수립 시 기초 자료로 활용가능하리라 사료된다.

의사결정나무를 이용한 개인휴대통신 해지자 분석

  • 최종후;서두성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1998년도 추계학술대회 논문집
    • /
    • pp.377-380
    • /
    • 1998
  • 본 논문에서는 최근 데이터마이닝의 도구로 활발하게 소개되고 있는 의사결정나무 분석을 이용하여 개인휴대통신의 해지자 분석을 실시한다. 또한 로지스틱 회귀모형을 이용하여 가입고객의 해지 가능성에 대한 점수화를 시도한다.

  • PDF

기계학습 기반의 영화흥행예측 방법 비교: 인공신경망과 의사결정나무를 중심으로 (A Comparison of Predicting Movie Success between Artificial Neural Network and Decision Tree)

  • 권신혜;박경우;장병희
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권4호
    • /
    • pp.593-601
    • /
    • 2017
  • 본 연구는 영화산업의 가치사슬단계에 따라 각 단계에서 고려할 수 있는 변인을 활용하여 제작/투자, 배급, 상영단계별 모형을 구성하였다. 모형의 예측력을 높이기 위해 회귀분석으로 유의미한 변인을 도출하여 모형을 추가로 설정하였다. 주어진 변인을 바탕으로 기계학습 분석방법인 인공신경망과 의사결정나무 분석방법 간의 예측력 차이를 비교하였다. 분석 결과, 제작/투자 모형과 배급 모형에서 모든 변인을 투입했을 때는 인공신경망의 정확도가 의사결정나무보다 높았으나, 회귀분석결과에 따라 선정된 변인을 투입하였을 때는 의사결정나무의 정확도가 더 높았다. 상영 모형에서는 회귀분석결과의 반영여부와 관계없이 인공신경망의 정확도가 의사결정나무의 정확도보다 높게 나타났다. 본 논문은 영화흥행 예측연구에 기계학습기법을 적용하여 예측성과가 향상됨을 확인하였다는데 의의가 있다. 선형회귀분석 결과를 기계학습기법에 반영함으로써 기존의 선형적 분석방법의 한계를 극복하고자 하였다.

로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구 (Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree)

  • 김수진;김보영
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.829-839
    • /
    • 2013
  • 본 연구는 로지스틱 회귀분석과 의사결정나무 분석을 활용하여 일 대도시 주민의 우울에 영향을 주는 요인을 예측하고 비교하고자 시도된 서술적 조사연구이다. 연구대상은 20세에서 65세 미만의 일 대도시 주민 462명이었다. 자료 수집은 2011년 10월 7일부터 10월 21일까지이었으며, 자료 분석은 SPSS 18.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 로지스틱 회귀분석, roc curve, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었다. 로지스틱 회귀분석에서 특이도 93.8%, 민감도 42.5%이었고, 본 연구의 모형 적합도를 roc curve 검증 한 결과 AUC=.84으로 본 연구 모형은 적합(p=<.001)하다고 할 수 있다. 우울예측에 대한 의사결정나무 분석은 분류에 대한 예측 정확도에서 특이도 98.3%, 민감도 20.8%이었고, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5% 이었다. 본 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 사료된다.

의사결정나무의 분기법 변화가 예측력에 미치는 영향 (The impact of the change in the splitting method of decision trees on the prediction power)

  • 장영재
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.517-525
    • /
    • 2022
  • 빅데이터 시대에 이르러 다양한 데이터 마이닝 기법이 주요 분석 방법론으로 제안되었다. 복잡 다양한 데이터가 양산되면서 데이터 마이닝 기법은 데이터 과학의 토대를 이루는 방법으로 부각되었다. 본고에서는 해석의 유용성과 예측력 향상의 측면 모두에 초점을 맞추어 다양한 실험 연구를 시행하였다. 구체적인 모형으로는 의사결정나무를 선택하였는데, 이는 실무적 사용 빈도가 높은 방법으로서 활용 폭이 넓을 뿐만 아니라 이해가 쉽고 성능평가가 용이한 방법론이기 때문이다. 의사결정나무모형을 대상으로 이 모형의 구조를 크게 변형시키지 않으면서도 예측력 향상의 목적을 이룰 수 있는 방법을 살펴보았으며 분기변수의 선택 방법이 모형의 성능에 미치는 영향을 분석하였다. 이 효과를 측정하기 위해서 다양한 모의실험 모델을 생성하고 분기법의 변화에 따른 예측력을 비교하였다. 비선형성을 지니면서 단일 분할을 통해서 하위 집합으로 명확하게 구분하기 어려운 복잡한 데이터의 경우에는 선형결합 분기방법이 예측력 제고에 도움을 주는 것으로 나타났다.

데이터마이닝기법상에서 적합된 예측모형의 평가 -4개분류예측모형의 오분류율 및 훈련시간 비교평가 중심으로 (Evaluations of predicted models fitted for data mining - comparisons of classification accuracy and training time for 4 algorithms)

  • 이상복
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권2호
    • /
    • pp.113-124
    • /
    • 2001
  • 의사결정나무모형 가운데 하나인 CHAID, 로지스틱 회귀모형, 이들을 이용한 각각의 베깅모형 등 4가지 예측분류모형에 대한 오분류율과 훈련시간을 표본크기별로 계산하고, 이들 모형에 대한 모의실험 비교를 통하여 주어진 알고리즘들의 효율성을 평가하였다. 베깅 의사결정나무모형은 오분류율은 낮았으나 상대적으로 훈련시간이 가장 길었다.

  • PDF

데이터마이닝 기법을 활용한 맞춤형 고혈압 사후관리 모형 개발 (A Development of a Tailored Follow up Management Model Using the Data Mining Technique on Hypertension)

  • 박일수;용왕식;김유미;강성홍;한준태
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.639-647
    • /
    • 2008
  • 본 연구는 국민건강보험공단의 건강검진데이터, 자격 및 보험료 그리고 진료비 데이터를 활용하여 고혈압 관리를 위한 맞춤형 고혈압 사후관리모형(고혈압 진료예측모형 및 고혈압 진료순응도세분화모형)을 개발하고자 하였다. 모형 개발에는 데이터마이닝의 로지스틱 회귀모형, 의사결정나무 그리고 앙상블 모형을 활용하였다. 고혈압 진료예측모형에서는 3가지 모형 중 로지스틱 회귀모형이 가장 우수한 모형으로 채택되었으며, 고혈압 진료순응도세분화모형은 의사결정나무모형을 통해 개발되었다. 본 연구는 전국 규모의 수년간 축적된 자료를 데이터마이닝을 활용함으로써 고혈압의 진료 및 진료순응도에 이르는 고혈압 사후관리 프로세스 전반에 걸친 결과를 도출함으로써 우리나라 고혈압 사후관리체계 구축에 기여할 것으로 사료된다.

데이터마이닝을 이용한 국민연금 부정수급 예측모형 개발 - 손해배상금 불성실 신고를 대상으로 - (An Application of Data-Mining Tool in Fraud Pension Payment Prediction)

  • 차경엽
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 최근 사회복지분야에서 부정수급, 횡령 등이 빈번히 발생함에 따라 비리를 방지하기 위한 체계적인 관리 방안이 요구되고 있다. 데이터마이닝은 다수의 이해관계자와 많은 예산이 투입되는 사업을 관리하는데 효과적인 방법이다. 본 연구는 국민연금의 부정 수급자 관리방안으로 데이터마이닝을 이용한 예측모형을 개발하였다. 분석결과, 수급자의 급여, 연금 가입, 사고내역 정보가 부정수급의 특성 요인으로 나타났으며 이를 의사결정나무 모형, 로지스틱 회귀모형, 인공신경망 모형에 적용한 결과 의사결정나무 모형의 예측력이 가장 우수한 것으로 분석되었다.

의사결정나무모형을 이용한 편마암 지역에서의 급경사지재해 예측기법 개발 (Development to Prediction Technique of Slope Hazards in Gneiss Area using Decision Tree Model)

  • 송영석;채병곤
    • 지질공학
    • /
    • 제18권1호
    • /
    • pp.45-54
    • /
    • 2008
  • 본 연구에서는 기 조사된 편마암 지역에서의 급경사지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토질시험자료를 토대로 통계적인 분석방법인 의사결정나무모형을 이용하여 급경사지재해 예측기법을 개발하였다. 편마암 지역에서의 조사된 급경사지재해 자료는 서울 및 경기지역에서 1998년 집중호우로 발생된 104개소구간이다. 이 가운데 예측모델 개발에 활용된 자료수는 결측치를 제외한 61개소로서, 급경사지재해 발생구간 34개소와 미발생구간 27개소이다. 의사결정나무모형을 이용한 통계적인 분석은 카이제곱 통계량, 지니 지수 및 엔트로피 지수를 적용하여 실시하였다. 분석결과 사면경사, 포화도 및 사면고도가 분리기준으로 선택되었으며, 엔트로피 지수를 이용한 의사결정나무모형 예측모델이 정확도가 가장 높은 것으로 나타났다. 선정된 급경사지재해 예측모델의 분리기준은 최상위부터 사면경사, 포화도 및 사면고도의 순서로 선택되었으며, 각각의 분리기준치는 사면경사의 경우 $17.9^{\circ}$, 포화도의 경우 52.1%, 사면고도의 경우 320m로 결정되었다.