• Title/Summary/Keyword: 의사결정나무회귀분석

Search Result 124, Processing Time 0.029 seconds

교육만족도를 통한 대학생들의 대학 충성도에 영향을 미치는 요인에 대한 연구 (A Study of Factors Influencing University Royalty through Education Satisfaction)

  • 강민채
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.365-374
    • /
    • 2017
  • 본 연구는 대학생들의 대학 충성도에 영향을 미치는 요인을 알아보기 위해 지방 소재의 J대학의 재학생 전체를 대상으로 한 대학 만족도 설문조사 결과를 분석하였다. 학생의 대학 충성도는 학생들의 학업중단 의도와 더불어 대학에서 관리하고자 하는 주요한 지표로 학업중단 의도와는 반대로 긍정적인 측면을 담고 있다는 데에 그 의의가 있다. 만족도 설문 분석 결과, 첫째, 학년 별, 학점 구간별 각 만족도의 차이가 있는 것으로 검증되었다. 둘째, 학생들의 만족도의 변인 중 학생들의 대학충성도에 영향을 미치는 요인을 알아 보기위해 로지스틱 회귀분석을 수행한 결과 교수강의, 학업지도, 취업지도, 교육환경, 학생자신에 대한 만족도가 대학에 대한 충성도에 유의하게 영향을 미치는 것으로 나타났다. 또한 의사결정나무(decision tree) 분석 결과에서 대학의 충성도를 결정하는 최상위의 결정 요인은 학생 자신의 학교생활에 대한 만족도인 것으로 나타났다.

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

다년도 자료를 이용한 고혈압 유병률의 지역간 변이 분석 (Analysis on Geographical Variations of the Prevalence of Hypertension Using Multi-year Data)

  • 김유미;조대곤;홍성옥;김은주;강성홍
    • 대한지리학회지
    • /
    • 제49권6호
    • /
    • pp.935-948
    • /
    • 2014
  • 고혈압과 같은 만성 질환의 관리는 국가보건정책에서 중요한 사업이다. 본 연구는 지역사회 특성이 고혈압의 유병률에 어떻게 영향을 주는지를 분석하였다. 분석을 위해 237개 시군구 소지역의 건강상태 및 건강 행태를 포함한 다년간의 자료를 수집하였다. 지표는 2009~2011년 질병관리본부의 지역사회건강조사와 국민건강보험공단 등의 자료를 사용하였다. 지역간 변이 분석을 위해 지리적 가중회귀분석과 의사결정나무 모형을 이용하였다. 연구결과 다년간 자료를 이용하는 것이 단년간 자료를 이용하는 것보다 더 적합도가 높았는데 이것은 대부분의 변수에서 연도별 유의한 차이가 있었기 때문이다. 또 고혈압 유병률은 당뇨병 및 비만 유병률과 양의 관련성이 있었으며 인구밀도와는 음의 상관관계를 보였다. 특히 이러한 요인들의 지역적 변이는 지리적 가중회귀분석 결과에서 더욱 뚜렷하였다. 이상의 결과를 바탕으로 분석한 의사결정나무 모형에서는 고혈압 유병률에 영향을 미치는 중요한 변수가 지역별로 매우 상이하다는 것을 확인할 수 있었다. 지역주민의 건강상태, 건강행태, 사회경제적 요인의 지역간 차이를 규명하는 것은 고혈압 유병률을 감소시키기 위한 지역별 맞춤형 보건정책을 수립하는데 매우 중요하다. 본 연구의 결과는 만성질환 관리를 위한 맞춤형 지역보건정책을 수립하는데 기초자료를 제공할 수 있다는 데 의의가 있다.

  • PDF

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

교육만족도 관점에서 학생의 학업중단 의도에 대한 연구 (Investigating Factors Influencing University Students' Intention to Dropout based on Education Satisfaction)

  • 한동욱;강민채
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.63-71
    • /
    • 2016
  • 본 연구는 교육만족도가 대학생의 학업중단에 미치는 영향을 알아보기 위한 연구로 교육만족도 조사를 위해 지방 소재 J대학의 재학생 전체 대상으로 설문조사를 수행하였으며 이중 설문 작성의 충실도가 높은 7,248명의 설문을 분석하였다. 학년 별, 학점구간 별 만족도의 차이가 있는지를 분석하기 위하여 분산분석을 수행하였다. 분석결과 학년 별, 학점 구간 별로 만족도의 차이가 있는 것으로 나타났으며 특히 1학년의 만족도가 다른 학년에 비해 높은 것으로 나타났다. 학생들의 학업중단 의도와 만족도와의 관계를 알아보기 위해 로지스틱 회귀분석을 수행하였으며 학업지도, 취업지도, 교육환경, 학생자신에 대한 만족도가 학업중단 의도에 영향을 미치는 것으로 나타났다. 또한 의사결정나무 분석을 통해 학생자신의 대학 생활 만족도가 학업중단 의도를 결정하는 데 가장 중요한 변수로 나타났다.

데이터마이닝기법을 활용한 강남구 중소형 오피스빌딩의 매매가격 결정요인 분석 (An Analysis for Price Determinants of Small and Medium-sized Office Buildings Using Data Mining Method in Gangnam-gu)

  • 문근식;최재규;이현석
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.414-427
    • /
    • 2015
  • 본 연구는 오피스시장의 흐름을 고려하여 대형오피스빌딩 중심의 기존연구에서 벗어나, 중소형오피스빌딩에 대한 다양한 분석을 통해 모형별 중요변수 도출 및 예측력을 검증하여, 중소형 오피스를 대상으로 투자를 하고자 하는 투자자들에게 정보를 제공함이 목적이다. 중소형오피스빌딩은 대형오피스빌딩과 달리 규모에 대한 기준이 불명확하고, 주거용과 상업용이 혼재되어 있는 경우가 많기 때문에 자료수집의 한계가 있기 때문에 기존 연구는 대형오피스빌딩을 대상으로 변수간의 인과관계 추정에 탁월한 회귀모형에 편중되었다. 본 연구에서는 강남구 중소형오피스빌딩을 직접 전수조사하고 최종 1,056개의 자료를 추출하여 인과관계 과정을 추정하는 선형회귀모형외에, 반복학습을 통해 최적의 결과를 만들어내는 신경망모형 및 의사결정나무모형을 통해 매매가격 결정요인을 추가로 분석하였으며, 이를 통해 대형오피스빌딩과의 차별점을 비교하였다.

데이터마이닝을 활용한 이탈고객 스코어링 모델 개발

  • 한상태;이성건;강현철;유동균
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.155-161
    • /
    • 2001
  • 최근의 많은 기업에서는 방대한 고객 데이터베이스를 활용하여 자사의 경쟁력을 갖추는 방안으로써 데이터마이닝을 선택하고 있다. 본 연구에서는 데이터마이닝을 활용해 손해보험사의 데이터베이스를 분석하여 자동차보험 고객의 이탈을 방지하는 이탈고객 스코어링 모델을 개발하였다. 분석방법론으로는 의사결정나무와 로지스틱 회귀분석을 사용하였으며 기업에서의 데이터마이닝을 위한 일련의 과정을 상세히 기술하고 기업의 데이터베이스가 가지고 있는 문제점을 지적하였다.

  • PDF

매장문화재 예측을 위한 통계적 분류 분석 (Classification Analysis for the Prediction of Underground Cultural Assets)

  • 유혜경;이진영;나종화
    • 한국산업정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.106-113
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 국내 I시 자료를 사용하여 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형에 대한 성능비교와 함께, 새로운 자료에 대한 적용성 평가를 위해 모의실험을 수행하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R 언어를 사용하였으며, 구체적 분석과정을 제시하였다.

보행자-차량 충돌사고 특성분석 방법론 비교 연구 (Comparison of Methodologies for Characterizing Pedestrian-Vehicle Collisions)

  • 최새로나;정은비;오철
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.53-66
    • /
    • 2013
  • 최근 운전자의 보행자-차량 충돌사고 감소를 목적으로 한 다양한 연구가 수행되고 있으며, 본 연구에서는 보행자-차량 사고 발생 특성 및 심각도 영향요인 분석을 위하여 다양한 분석방법론을 활용한 보행자 교통사고 분석을 수행하였다. 통계모형과 휴리스틱모형 적용시 각 기법에 따른 결과를 도출함으로써 보행자 사고분석시 분석목적에 적합한 방법론을 제시하는 것을 목적으로 하였다. 이를 위하여 최근 3년간 발생한 경기도 교통사고자료(2008-2010년)를 활용하여 보행자 교통사고의 발생특성을 분석하였다. 또한, 통계모형인 이항 로지스틱 회귀분석, 순서형 프로빗 모형을 이용하여 보행자 교통사고 심각도 증가에 통계적으로 유의한 영향을 미치는 변수를 도출하였으며, 휴리스틱모형인 서포트 벡터 머신, 의사결정나무를 적용하여 교통사고 심각도 분류를 위한 모형을 개발하고 그 결과를 비교분석 하였다. 본 연구의 분석결과는 보행자 교통안전분석의 기초자료로 활용할 수 있으며 향후 국내 보행자-차량 충돌사고 분석시 유용하게 활용될 수 있을 것으로 기대된다.

데이터마이닝을 통한 고객관리데이터의 분석 (아파트고객 세분화를 중심으로) (Ananlyzing Customer Management Data by Datamining (Focused on Apartment Customer Classification))

  • 백신정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2004
  • 기업간의 경쟁이 심화되고 정보의 중요성에 대한 인식이 확대되어 가는 상황에서 다량의 데이터로부터 가치 있는 데이터를 추출하는 CRM 데이터 마이닝은 중대한 관심사가 아닐 수 없다. 본 연구는 데이터마이닝의 여러 활용 분야 중 고객세분화를 위해 최근 많이 사용되고 있는 데이터마이닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망 알고리즘 기법들을 비교하며, 이를 실제 아파트 고객의 데이터를 이용하여 검증하고자 한다. 따라서, 아파트 고객 세분화를 위한 데이터마이닝 수행시 기법 선택의 기준과 비교 평가의 기준을 제시하는 데 연구목적 있다.

  • PDF