• 제목/요약/키워드: 나무모형

검색결과 342건 처리시간 0.042초

단측 순수성에 의한 나무모형의 성장에 대하여 (On the Tree Model grown by esse-sided purity)

  • 김용대;최대우
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.341-348
    • /
    • 2000
  • 의사결정 나무라고 불리우기도 하는 나무모형은 결과 해석의 용이성으로 데이터마이닝의 분류예측 모형으로써 큰 각광을 받고 있다. 현재 나무모형으로 가장 많이 사용되는 Breiman et. al의 CART나 Quinlan의 C4.5 모두 생성된 노드들의 자료 구성이 목표변수를 기준으로 수준 구성비 측면에서 순수해지도록 진행된다. 그러나 CRM에 있어 가장 흔한 주제인 해지예측을 위한 모델링을 실시하는 경우 관심의 대상인 해지자가 전체 자료에 극히 일부를 차지하여, 기존의 분할 방법에서와 같이 모든 노드의 순수성을 고려하기란 불가능하다. Buja와 Lee는 이와 같이 소수의 관심에 대상이 되는 부류를 찾아내기 위한 나무모형 생성방법을 소개하였다 즉, 해지자 관리가 중요한 경우 해지자와 비해지자 구분을 진행하는 기존의 방법과는 달리 전체 자료 중 해지자를 집중적으로 찾아가는 탐색적 분할 기준인 단측 순수성(one-sided purity)을 제안하였다. 본 연구에서는 단측 순수성에 의한 나무모델링을 모 PC통신 회사의 해지자 자료에 적용하며 기존의 방법과 비교하였고 몇 가지 시뮬레이션 자료를 통해 단측 순수성의 문제점과 앞으로 해결하여야 할 과제에 대하여 살펴보았다.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

의사결정나무모형을 이용한 교통사고 유형 분석

  • 김유진;최종후;이의용
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.257-260
    • /
    • 2000
  • 본 연구에서는 의사결정나무모형을 이용하여 교통사고 유형 분석을 시도한다. 분석에 이용된 자료는 도로교통안전관리공단에서 수집한 교통사고 정밀조사 자료이다. 본 연구에서 목표변수는 '사고내용'이며, 설명변수는 '인적 요인', '차량적 요인', '도로 환경적 요인' 관련 변수이다. 목표변수에 주요한 기여를 하는 주요 설명변수를 도출하였으며, 얻어진 의사결정나무모형을 토대로 하여 교통사고를 유형화하였다.

  • PDF

단측 순수성에 의한 나무모형의 성장에 대하여 (On the Tree Model grown by one-sided purity)

  • 김용대;최대우
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.17-25
    • /
    • 2001
  • 의사결정 나무라고 불리우기도 하는 나무모형은 결과 해석의 용이성으로 데이터마이닝의 분류예측 모형으로서 큰 각광을 받고 있다. 현재 나무모형으로 가장 많이 사용되는 CART(Breiman et al., 1984)나 C4.5(Quinlan, 1993) 모두 생성된 노드들의 자료 구성이 목표변수(target variable)를 기준으로 각 수준 구성비 측면에서 순수해지도록 진행된다. 그러나 CRM(Customer Relationship Management)에 있어 가장 흔한 주제인 해지예측을 위한 모델링을 실시하는 경우 관심의 대상인 해지자가 전체 자료에 극히 일부를 차지하여, 기존의 분할 방법에서와 같이 분할되어 생성되는 모든 노드의 순수성을 동시에 고려하기란 불가능하다 Buja와 Lee(1999)는 목표변수 중 소수의 관심에 대상이 되는 부류를 찾아내기 위한 나무모형 생성방법을 소개하였다. 즉, 해지자 관리가 중요한 경우 해지자와 비해지자 구분을 진행하는 기존의 방법과는 달리 전체 자료 중 해지자를 집중적으로 찾아가는 탐색적 분할 기준인 단측 순수성(one-sided purity)을 제안하였다. 본 연구에서는 단측 순수성에 의한 나무모형을 모 PC통신 회사의 해지자 자료에 적용하여 기존의 방법과 비교하였고 몇 가지 시뮬레이션 자료를 통해 단측 순수성의 문제점과 앞으로 해결하여야 할 과제에 대하여 살펴보았다.

  • PDF

하천의 일열 수목에 의한 흐름 변화 수리모형실험 (Hydraulic Model Experiment for Flow Changes due to Trees on One Line)

  • 이남주;김지현
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.461-462
    • /
    • 2011
  • 하천에 침입한 식생이 흐름에 미치는 영향은 현장조사와 수리모형실험을 통해 다양한 연구가 진행되고 있지만 하천의 흐름이 식생에 미치는 영향이나 상호작용에 대해서는 아직 초보적인 수준에 머물러 있다. 국내의 하천에서 버드나무는 일열로 흐름방향에 평행하게 이입되어 활착되는 현상이 두드러지게 나타나고 있고 있으며, 이 연구는 실험실 개수로에 모형 나무를 일렬로 배열하여 식생이 완전히 잠긴 경우와 부분적으로 잠긴 경우에 대하여 수리모형실험을 수행하였다. 수리모형 실험결과 나무의 개수에 따라 수위의 변화가 나타남을 확인할 수 있으며, 빈 공간의 존재를 나타내는 나무의 간격에 따라서도 영향을 받음을 알 수 있었다. 이 연구는 수리모형실험을 통하여 식생의 개수, 잠긴 정도, 흐름 상태에 따른 유속과 수위 분포의 변화를 분석하고자 연구를 수행하였으며 이 결과는 식생저항모형 개발과 이차원 흐름모형의 검보정에 활용할 수 있다.

  • PDF

인체측정조사에서 측정곤란부위 예측을 위한 의사결정나무 추천 모형 탐지에 관한 연구 (A Study on Exploration of the Recommended Model of Decision Tree to Predict a Hard-to-Measure Mesurement in Anthropometric Survey)

  • 최종후;김선경
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.923-935
    • /
    • 2009
  • 본 연구는 의사결정나무의 추천 모형 선택을 위한 비교실험에 초점을 두고 있다. 의사결정나무 모형은 구축된 모형에 기반을 두고 미래 관측치에 대한 예측 기능을 수행하게 될 것이므로 구축된 모형이 아무리 정치(精緻)하다고 하더라도 일반화의 성질을 충족시키지 못하면 실제성이 없게 된다. 따라서 본 연구는 교차타당성 검토를 통해 일반화의 성질을 충족시키면서 우수한 예측력을 갖는 추천 모형을 탐지하는 절차를 연구하는 데에 초점을 맞추고 있다. 사례 연구로 인체측정자료를 사용하여 측정곤란부위 예측을 위한 의사결정나무 추천 모형을 탐지한다. 그 결과 CART 모형 이 추천 모형으로 탐지되었다.

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

의사결정나무를 이용한 화물자동차 투어유형 선택행태 분석 (An Analysis of Choice Behavior for Tour Type of Commercial Vehicle using Decision Tree)

  • 김한수;박동주;김찬성;최창호;김경수
    • 대한교통학회지
    • /
    • 제28권6호
    • /
    • pp.43-54
    • /
    • 2010
  • 최근 화물수요모형에 화물자동차 투어행태를 반영하기 위한 접근방법이 제시되었다. 화물자동차 이동을 투어기반 접근방법으로 모형화 하기 위해서는 화물자동차 투어와 투어유형에 대한 이해가 필요하다. 본 연구는 화물자동차 투어유형을 왕복형 투어와 체인형 투어로 구분하여 이들 투어유형 선택행태를 분석하였다. 투어유형 선택행태를 분석하기 위한 방법으로는 의사결정나무(decision tree)와 로짓모형(logit model)을 이용하였다. 분석결과 화물자동차 투어유형을 분류하는 설명변수로 화물적재율, 평균화물량, 총화물량이 선정되었으며, 의사결정나무와 로짓모형이 유사한 결과를 도출하였다. 또한 소형과 중형 화물자동차의 투어유형을 분류하는 설명변수가 큰 차이를 보이지 않음에 따라 화물자동차 투어를 계획함에 있어 화물을 어떻게 적재할 것인지가 가장 중요한 것으로 나타났다. 의사결정나무와 로짓모형의 예측력을 비교한 결과는 의사결정나무가 로짓모형에 비해 상대적으로 우수한 결과를 보였는데, 이는 화물자동차 투어유형을 분류함에 있어 로짓모형과 같이 설명변수의 선형적 결합에 의한 분류 보다는 의사결정나무와 같이 다수 설명변수들의 규칙조합으로 분류하는 것이 효과적임을 나타낸다.

주변조건부 변수를 이용한 의사결정나무모형 생성에 관한 연구 (A study on decision tree creation using marginally conditional variables)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.299-307
    • /
    • 2012
  • 데이터마이닝은 주어진 데이터베이스에서 항목간의 흥미로운 관계를 찾아내는 기법으로서 의사결정나무는 데이터마이닝의 대표적인 알고리즘이라고 할 수 있다. 의사결정나무는 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 연구자가 의사결정나무 모형을 생성 할 때 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 한다. 특히 의사결정나무 모형에서 입력 변수의 수가 많을 경우 생성된 모형은 복잡한 형태가 될 수 있고, 모형 분석이 어려울 수도 있다. 만일 입력변수에서 주변조건부 변수 (매개변수, 외적변수)가 존재한다면 이 입력변수는 직접적인 관련성이 없는 것으로 판단한다. 이에 본 논문에서는 주변조건부 변수를 고려하여 의사결정나무모형을 생성하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

다중회귀와 회귀나무를 활용한 군인 우울 요인 분석 (Identifying Influencing Factors of Soldiers' Depression using Multiple Regression and CART)

  • 우정희;박주영;이유정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.171-172
    • /
    • 2013
  • 우울은 군대 내 발생되는 극단적인 사고 중 하나인 자살의 주요 원인으로 제시되어 왔다. 본 연구는 군인들의 우울, 불안 및 자아존중감의 수준을 파악하고, 우울의 영향요인을 탐색하고 이들을 예측하는데 주로 사용해 왔던 다중회귀분석 방법과 효과적인 의사결정방법으로 알려진 회귀나무모형의 효과성을 비교해보고자 하였다. 방법: 횡단적 조사연구이며, 우울측정에는 CES-D, 불안측정은 SAI, 자아존중감은 Rosenberg(1965)의 도구를 사용하였다. 연구대상자는 강원도 전방 부대 근무 중인 군인이며, 534부가 회수되었다. SPSS/WIN 18.0을 이용하여 위계적 다중회귀분석과 회귀나무모형을 실시하였다. 결과: 대상자들의 우울, 불안 및 자아존중감의 정도는 각각 $10.7({\pm}9.8)$, $38.5({\pm}10.2)$$31.7({\pm}5.2)$이었다. 대상자의 23.6%(126명)가 경한 우울을 나타내었다. 다중회귀분석에 의한 우울 영향요인은 불안, 자아존중감과 복무기간이었으며, 우울에 대하여 62.0%의 설명력을 가지고 있었다. 또한 회귀나무모형에서는 높은 불안과 불안이 다소 낮더라도 전역 후 진로가 불확실한 집단이 우울 위험군일 것으로 예측되었다. 결론: 본 연구 대상자들의 우울의 주요 영향요인은 불안으로 나타났다. 군대 내에서 적용할 수 있는 불안 조절 방법 개발이 필요할 것으로 보인다. 또한 일부 요인에서 차이가 있어, 반복 연구가 필요하지만, 주요 변인인 불안을 예측했다는 점에서 보면 다중회귀분석과 회귀나무모형은 군인들의 우울을 예측에 유용한 방법으로 보인다.

  • PDF