• 제목/요약/키워드: 의사결정나무 모형

검색결과 228건 처리시간 0.026초

데이터 마이닝 기법을 활용한 근로자의 고용유지 강화 방안 개발 (Enhancing Workers' Job Tenure Using Directions Derived from Data Mining Techniques)

  • 안민욱;김태운;유동희
    • 한국콘텐츠학회논문지
    • /
    • 제18권5호
    • /
    • pp.265-279
    • /
    • 2018
  • 본 연구에서는 데이터 마이닝 기법을 활용하여 근로자의 이직준비 여부에 관한 예측모형을 구축하는 실험을 진행하였다. 이를 위해, 한국고용정보원 주관으로 수집된 "2015년 대졸자 직업 이동경로조사" 데이터를 사용하였다. 이직준비 여부 예측모형에는 의사결정나무, 베이즈넷, 인공신경망 알고리즘이 사용되었다. 전체 직종을 대상으로 한 분석에서는 의사결정나무 기반 예측모형에서 최고 예측률을 기록하였으며, 이직준비 여부에 영향을 주는 요인은 '근로시간 형태', '종사상 지위', '정규직 여부', '주당 정규 근로시간', '주당 정규 근로일', '개인의 발전가능성'으로 나타났다. 의사결정나무 기반 예측모형의 결과를 활용하여 근로자 전반에 관한 12개의 이직준비 여부 규칙을 최종 도출하였고, 도출된 규칙을 바탕으로 근로자의 고용유지 강화에 도움을 주는 방안들을 제안하였다. 또한 직종별 영향 요인을 분석하기 위해 직종을 사무, 문화예술, 건설, 정보기술 분야로 구분하여 실험을 진행하였다. 그 결과 사무 분야는 10개, 문화예술 분야는 9개, 건설 분야는 4개, 그리고 정보기술 분야는 6개의 이직준비 규칙이 도출되었고 이를 토대로 직종별 맞춤화된 고용유지 강화 방안을 제시하였다.

의사결정나무기법을 활용한 장기요양 복지용구 권고모형 개발 (A recommendation system for assisting devices in long-term care insurance)

  • 한은정;박상희;이정석;김동건
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.693-706
    • /
    • 2018
  • 노인의 신체기능에 부합하는 복지용구를 제공하는 것은 노인이 가능한 한 오랫동안 자신의 집과 지역사회에서 자립하여 생활할 수 있도록 돕기 위해 매우 중요하다. 본 연구는 수급자의 신체 및 인지 기능 상태를 고려하여 개개인에게 적합한 복지용구 품목을 권고할 수 있는 과학적인 복지용구 표준급여모형 알고리즘을 개발하고자 수행되었다. 모형개발에는 데이터마이닝기법인 의사결정나무를 활용하였다. 수급자 8,084명의 장기요양인정조사자료와 파워어세서가 작성한 표준급여계획, 수급자 특성 자료를 이용하여 데이터를 구축하였고, 15개 복지용구 품목별로 표준급여모형을 개발하였다. 본 연구는 노인장기요양보험의 복지용구 급여계획의 객관성 및 과학성을 확보하고 수급자의 자립생활과 안전을 향상시키는 데에 기여할 것으로 기대된다.

ANFIS 기반 분류모형의 설계 및 성능평가 (Design and Evaluation of ANFIS-based Classification Model)

  • 송희석;김재경
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.151-165
    • /
    • 2009
  • 퍼지신경망 모형은 인공신경망의 네트워크 구조 표현방법 및 학습알고리듬과 퍼지시스템의 추론방법을 통합한 모형으로 제어 및 예측분야에 성공적으로 적용되고 있다. 본 연구에서는 퍼지신경망 모형 중 우수한 예측정확도로 인해 최근 각광받고 있는ANFIS (Adaptive Network-based Fuzzy Inference System)모형을 기반으로 하는 분류모형을 설계하고 기존의 분류기법(C5.0 의사결정나무)과 비교하여 분류 정확성 관점에서 평가한다. ANFIS 추론의 경우, 최종 결과값이 계급값이 아닌 연속형 변수값을 취하게 되므로 산출된 결과값을 이용하여 적절한 계급값을 할당하는 과정이 필요하다. 본 연구에서는 의사결정나무기법을 이용하여 계급값을 할당하는 방식과 군집분석을 이용하여 계급값을 할당하는 두 가지 방식을 제안하고 두 가지 데이터 세트에 적용하여 ANFIS를 기반으로 한 분류모형의 정확도를 평가하였다.

  • PDF

의사결정나무모형을 이용한 유역내 구조적 홍수방어 대안 도출 (Flood Mitigation Planing for a Basin Using a Decision Tree Model)

  • 변성호;강현직;한정우;김태웅
    • 대한토목학회논문집
    • /
    • 제28권1B호
    • /
    • pp.33-40
    • /
    • 2008
  • 우리나라는 6월부터 9월까지의 우기에 강우가 집중 발생하는 기상특성으로 인해 자연재해의 95% 이상이 집중호우와 태풍에 의한 풍수해로 집계되고 있을 만큼 홍수피해에 취약하며, 오래전부터 홍수방어에 대한 구조적 대책이 시행되어왔다. 본 연구의 목적은 의사결정기법중의 하나인 의사결정나무를 이용하여 유역내 홍수방어를 위한 기본적인 후보대안을 제시하는데 있다. 이러한 후보대안은 유역이 가지고 있는 치수적 기능을 최대한 살리고 상 하류의 유기적인 홍수방어기능을 효율적으로 증대시키는 다수의 조합으로 제시되었다. 또한 본 연구에서는 유역종합치수계획 수립시 적용가능한 홍수방어 대안 조합 지침을 제시하였다.

머신러닝 기반의 재해 강도 단계 분류모형에 관한 연구 (On classification model of disaster severity level based on machine learning)

  • 이승민;왕원준;강유진;신성철;김형수;김수전
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.239-239
    • /
    • 2023
  • 최근 도시화 및 기후변화에 따른 재난의 피해가 증가하고 있다. 국내 기상청에서는 호우 및 태풍에 대한 예·경보(주의보, 경보)를 전국적으로 통일된 기준(3시간, 12시간 누적강우량)에 따라 발령하고 있다. 이에 따라 현재 예·경보 기준에는 피해가 발생한 사상에 대한 지역별 특성이 고려되지 않는 문제점이 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 서울특별시, 인천광역시, 경기도의 호우 및 태풍에 대한 재해사상별 발생한 피해액 및 누적강우량을 활용하여 재해강도의 단계별 기준을 수립하고, 입력자료로 관측된 강우값을 활용하여 발생할 수 있는 재해의 발생 강도를 분류하는 모형을 개발하고자 하였다. 본 연구에서는 호우 및 태풍에 의한 재해 피해액의 분위별로 재해강도 단계(관심, 주의, 경계, 심각)를 분류하였고, 재해강도 단계에 따른 누적강우량 기준을 지자체별로 제시하였으며, 분류한 재해의 강도 단계를 모형의 종속변수로 활용하였다. 재해피해가 발생하지 않은 무강우 지속시간을 산정하여 호우 사상을 분류하였다. 지자체별로 재해 발생강도 분류 모형 개발을 위하여 머신러닝 모형 4가지(의사결정나무, 서포트 벡터 머신, 랜덤 포레스트, XGBoost)를 활용하였다. 본 연구에서 분류한 피해가 발생하지 않은 호우사상 및 피해가 발생한 사상별로 강우량, 지속시간 최대 강우량(3시간, 12시간), 선행강우량, 누적강우량을 독립변수로 입력하여 종속변수인 재해 발생 강도를 분류하였다. 각 모형별로 F1 Score를 이용한 정확도 평가 결과, 의사결정나무의 F1 Score가 평균 0.56으로 가장 우수한 정확도를 가지는 것으로 평가되었다. 본 연구에서 제시하는 머신러닝 기반 재해 발생 강도 분류모형을 활용하면 호우 및 태풍에 의한 재해에 대하여 지자체별로 재해 발생 강도를 단계별로 파악할 수 있어, 재난 담당자들의 의사결정을 위한 참고 자료로 활용될 수 있을 것으로 판단된다.

  • PDF

단측 순수성에 의한 나무모형의 성장에 대하여 (On the Tree Model grown by esse-sided purity)

  • 김용대;최대우
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.341-348
    • /
    • 2000
  • 의사결정 나무라고 불리우기도 하는 나무모형은 결과 해석의 용이성으로 데이터마이닝의 분류예측 모형으로써 큰 각광을 받고 있다. 현재 나무모형으로 가장 많이 사용되는 Breiman et. al의 CART나 Quinlan의 C4.5 모두 생성된 노드들의 자료 구성이 목표변수를 기준으로 수준 구성비 측면에서 순수해지도록 진행된다. 그러나 CRM에 있어 가장 흔한 주제인 해지예측을 위한 모델링을 실시하는 경우 관심의 대상인 해지자가 전체 자료에 극히 일부를 차지하여, 기존의 분할 방법에서와 같이 모든 노드의 순수성을 고려하기란 불가능하다. Buja와 Lee는 이와 같이 소수의 관심에 대상이 되는 부류를 찾아내기 위한 나무모형 생성방법을 소개하였다 즉, 해지자 관리가 중요한 경우 해지자와 비해지자 구분을 진행하는 기존의 방법과는 달리 전체 자료 중 해지자를 집중적으로 찾아가는 탐색적 분할 기준인 단측 순수성(one-sided purity)을 제안하였다. 본 연구에서는 단측 순수성에 의한 나무모델링을 모 PC통신 회사의 해지자 자료에 적용하며 기존의 방법과 비교하였고 몇 가지 시뮬레이션 자료를 통해 단측 순수성의 문제점과 앞으로 해결하여야 할 과제에 대하여 살펴보았다.

  • PDF

의사결정나무 분석에서 불균형 자료의 분석 연구 : 종합병원의 건강보험료 청구 심사 사례 (An Study on Decision Tree Analysis with Imbalanced Data Set : A Case of Health Insurance Bill Audit in General Hospital)

  • 허준;김종우
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1667-1676
    • /
    • 2006
  • 다른 산업과 달리 병원/의료 산업에서는 건강 보험료 심사 평가라는 독특한 검증 과정이 필수적으로 있게 된다. 건강 보험료 심사 평가는 병원의 수익 문제 뿐 아니라 적정한 진료행위를 하는 병원이라는 이미지와도 맞물려 매우 중요한 분야이며, 특히 대형 종합병원일수록 이 부분에 많은 심사관련 인력들을 투입하여, 병원의 수익과 명예를 위해서 업무를 수행하고 있다. 본 논문은 이러한 건강보험료 청구 심사 과정에서, 사전에 수많은 진료 청구 건 중 심사 평가에서 삭감이 될 수 있는 진료 청구 건을 데이터 마이닝을 통해서 발견하여, 사전의 대비를 철저히 하고자 하는 한 국내의 대형 종합병원의 사례를 소개하고자 한다. 데이터 마이닝을 적용함에 있어, 주요한 문제점 중의 하나는 바로 지도학습 기법을 적용하기에 곤란한 데이터 불균형 문제가 발생하는 것이다. 이런 불균형 문제를 해소하고, 비교 조건 중에 가장 효율적인 삭감 예상 진료 건 탐지 모형을 만들어 내기 위하여 데이터 불균형 문제의 기본 해법인 과, Sampling 오분류 비용의 다양하고 혼합적인 적용을 통하여, 적합한 조건을 가지는 의사결정 나무 모형을 도출하였다.

  • PDF

데이터마이닝을 이용한 건강보험 상해요인 조사 대상 선정 모형 개발 -건강보험 지역가입자 상해상병 진료건을 중심으로- (Development of the Fraud Detection Model for Injury in National Health Insurance using Data Mining -Focusing on Injury Claims of Self-employed Insured of National Health Insurance)

  • 박일수;박소정;한준태;강성홍
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.593-608
    • /
    • 2013
  • 상해상병으로 청구되는 건수가 증가함에 따라 조사 대상을 보다 정교하게 선정하여 상해요인 조사 대상을 줄이면서 환수율 및 환수금액을 올릴 수 있는 방안을 마련할 필요가 있다. 이를 위해서 2006~2011년까지의 상해요인 조사자료를 수집하여 의사결정나무 모형을 활용하여 지역가입자 상해상병 진료건에 대한 부당환수 조사대상 선정모형을 개발하였다. 최종 개발된 모형결과에 따르면, 조사대상 유형은 18개로 분류되었고, 이러한 분류결과는 실제 조사가 시행될 시, 모형을 적용하지 않았을 때 보다 최고 12.8배 높은 부당환수결정율을 나타낼 수 있을 것으로 분석되었다. 또한, 본 연구에서 개발된 조사 대상자 선정 모형을 실제 업무에 적용하기 위해서는 조사물량 대비 국민건강보험공단의 조사인력 및 운영 계획을 보다 면밀히 검토해야만 모형 적용의 효과성이 극대화 될 수 있을 것으로 판단된다.

의사결정나무 분석을 사용한 고가의료장비의 다빈도 사용 특성 분석 (The diffusion and policy options of the diagnostic imaging technologies in Korea)

  • 최윤정;곽민정;윤민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.179-185
    • /
    • 2015
  • 최근 고가의료장비의 도입으로 진단기술이 빠르게 발전하고 있으나 이에 따른 건강보험 재정의 부담이 크게 늘어 이에 대한 적절한 관리와 효율적 운영에 대한 정책이 필요하다. 이에 따라 본 연구에서는 의사결정나무분석 모형을 사용하여 CT 의료장비의 검사빈도에 영향을 미치는 요인을 파악하여 효율적 운영에 대한 방안을 제시한다.

데이터마이닝과 다중모형조합기법을 이용한 온라인상점 상품추천시스템 개발

  • 이연경;김경재
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2004년도 추계학술대회
    • /
    • pp.340-348
    • /
    • 2004
  • 온라인상점의 상품추천시스템은 일대일마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 대부분의 상품추천시스템은 시시각각 변화하는 소비자의 기호에 따라 상품을 어떻게 추천할 것인가에 대한 문제에 직면해 있다. 본 연구에서는 급변하는 온라인상점 환경에 탄력적으로 대응하기 위하여 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 제안하는 상품추천시스템은 현재 운영중인 온라인상점 데이터로 프로토타입을 구축하고 실제 소비자에 대한 적용가능성을 검증하였으며, 그 결과 실제 유용할 것으로 확인되었다.

  • PDF