• 제목/요약/키워드: Decision Variable

검색결과 751건 처리시간 0.03초

Exploration of CHAID Algorithm by Sampling Proportion

  • 박희창;조광현
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 추계학술대회
    • /
    • pp.215-228
    • /
    • 2003
  • Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, fraud dection, data reduction and variable screening, interaction effect identification, category merging and discretizing continuous variable, etc. CHAID(Chi-square Automatic Interaction Detector), is an exploratory method used to study the relationship between a dependent variable and a series of predictor variables. CHAID modeling selects a set of predictors and their interactions that optimally predict the dependent measure. In this paper we explore CHAID algorithm in view of accuracy and speed by sampling proportion.

  • PDF

가변 동심원 도법을 이용한 축구로봇의 최단시간 경로설정에 관한 연구 (A study on the Minimum-Time Path Decision of a Soccer Robot using the Variable Concentric Circle Method)

  • 이동욱;이귀형
    • 한국정밀공학회지
    • /
    • 제19권9호
    • /
    • pp.142-150
    • /
    • 2002
  • This study describes a method of finding an optimal path of a soccer robot by using a concentric circle method with different radii of rotation. Comparing with conventional algorithms which try to find the shortest path length, the variable concentric circle method find the shortest moving time. The radius fur the shortest moving time for a given ball location depends on the relative location between a shooting robot and a ball. Practically it is difficult to find an analytical solution due to many unknowns. Assuming a radius of rotation within a possible range, total path moving time can be calculated by adding the times needed for straight path and circular path. Among these times the shortest time is obtained. In this paper, a graphical solution is presented such that the game ground is divided into 3 regions with a minimum, medium, and maximum radius of rotation.

주변조건부 변수를 이용한 의사결정나무모형 생성에 관한 연구 (A study on decision tree creation using marginally conditional variables)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.299-307
    • /
    • 2012
  • 데이터마이닝은 주어진 데이터베이스에서 항목간의 흥미로운 관계를 찾아내는 기법으로서 의사결정나무는 데이터마이닝의 대표적인 알고리즘이라고 할 수 있다. 의사결정나무는 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 방법이다. 일반적으로 연구자가 의사결정나무 모형을 생성 할 때 모형 생성의 기준 및 입력 변수의 수에 따라 복잡한 모형이 생성되기도 한다. 특히 의사결정나무 모형에서 입력 변수의 수가 많을 경우 생성된 모형은 복잡한 형태가 될 수 있고, 모형 분석이 어려울 수도 있다. 만일 입력변수에서 주변조건부 변수 (매개변수, 외적변수)가 존재한다면 이 입력변수는 직접적인 관련성이 없는 것으로 판단한다. 이에 본 논문에서는 주변조건부 변수를 고려하여 의사결정나무모형을 생성하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하고자 한다.

Waste Database Analysis Joined with Local Information Using Decision Tree Techniques

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2005년도 춘계학술대회
    • /
    • pp.164-173
    • /
    • 2005
  • Data mining is the method to find useful information for large amounts of data in database. It is used to find hidden knowledge by massive data, unexpectedly pattern, relation to new rule. The methods of data mining are decision tree, association rules, clustering, neural network and so on. The decision tree approach is most useful in classification problems and to divide the search space into rectangular regions. Decision tree algorithms are used extensively for data mining in many domains such as retail target marketing, fraud detection, data reduction and variable screening, category merging, etc. We analyze waste database united with local information using decision tree techniques for environmental information. We can use these decision tree outputs for environmental preservation and improvement.

  • PDF

Multiobjective Decision-Making applied to Ship Optimal Design

  • Wang, Li-Zheng;Xi, Rong-Fei;Bao, Cong-Xi
    • Journal of Ship and Ocean Technology
    • /
    • 제5권1호
    • /
    • pp.30-37
    • /
    • 2001
  • Ship optimal design is a multi-objective decision-making process and its optimal solution does not exit in general. It is a problem in which the decision-maker is very interested that an effective solution is how to be found which has good characteristic and is substituted for optimal solution in a sense. In the previous methods of multi-objective decision-making, the weighting coefficients are decided from the point of view of individuals which have a bit sub-jective an unilateral behavior. in order to fairly and objectively decide the weighting coeffi-cients, which are considered to be optimal in all system of multi-objective decision-making and satisfactory solution to the decision-maker, the pater presents a method of applying the Technology of the Biggest Entropy. It is proved that the method described in the paper is very feasible and effective be means of a practical example of ship optimal design.

  • PDF

CART 방법론을 사용한 클라우드 컴퓨팅 도입 의사 결정 모델링 (Cloud Computing Adoption Decision-Making Modeling Using CART)

  • 백승현;장병윤
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.189-195
    • /
    • 2014
  • 본 논문에서는 장소와 시간의 제약을 받지 않는 클라우드 컴퓨팅 도입 의사 결정 모델링에 대한 연구를 진행하였다. 연구에서는 65명의 응답자에게 수집 된 패널데이터와 데이터마이닝 방법 중 하나인 CART(회귀분류나무)를 사용하여 의사결정 모델을 구축하였다. 모델링에는 2단계로 진행되는데 첫 번째 단계에서는 패널데이터를 사용하여 도입 의사를 결정하는데 영향을 미치는 문항들을 선택하고 2 번째 단계에서는 선택된 문항을 사용하여 도입 의사 결정 모델을 구축하였다. 문항 선택을 통하여 설문지 수집 문항수를 25개에서 5개로 줄일 수 있어 응답자에게 빠른 답변을 얻을 수 있고 데이터의 사이즈가 작기 때문에 모델 구축 시간을 줄일 수 있는 장점을 보여주었다.

A Recursive Partitioning Rule for Binary Decision Trees

  • Kim, Sang-Guin
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.471-478
    • /
    • 2003
  • In this paper, we reconsider the Kolmogorov-Smirnoff distance as a split criterion for binary decision trees and suggest an algorithm to obtain the Kolmogorov-Smirnoff distance more efficiently when the input variable have more than three categories. The Kolmogorov-Smirnoff distance is shown to have the property of exclusive preference. Empirical results, comparing the Kolmogorov-Smirnoff distance to the Gini index, show that the Kolmogorov-Smirnoff distance grows more accurate trees in terms of misclassification rate.

A General Decision-Theoretic Model for a Couple's Family Building Process

  • Abel, Volker
    • 한국경영과학회지
    • /
    • 제7권1호
    • /
    • pp.51-57
    • /
    • 1982
  • During the course of history, more and more reliable birth control methods have become available. Hence, to a certain degree, the possibility of avoiding any or additional children, and of spacing the family building process has arisen. The advancement of six predetermination technology, whereby couples can influence the sex of their children, gives couples, another decision variable. Assuming a rational acting couple, we present a general decision-theoretic model which describes the family building process and its optimization through maximizing the expected utility concerning the spacing, ordering, sex, and number of their children.

  • PDF

멀티리드 심전도의 정확한 판독 알고리즘 (Algorithm for Accuracy Interpretation of Multilead ECG)

  • 김민수;조영창;서희돈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(5)
    • /
    • pp.265-268
    • /
    • 2002
  • For accurate interpretation, ECG signal is measured by using 12 leads method. We look shape of Measured ECG signal and decide whether interpretation is accurate or not. In this paper, we propose new effective fuzzy decision system which uses fuzzy rules and membership functions for more accurate of ECG wave. We used PR interval, QRS interval and QRS axis as conditional variables for designing fuzzy rules. And decision rule of conclusion variable is determined by (sinus rhythm), (sinus rhythm+left deviation), (sinus rhythm+right deviation) and (sinus rhythm+negative axis). Experimental results showed our system made numerically easy decision possible and had advantage of simple design method.

  • PDF

빅 데이터 기반의 체납 수용가 예측 모델 (Prediction Model for Unpaid Customers Using Big Data)

  • 정재안;이규환;정회경
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.827-833
    • /
    • 2020
  • 본 논문에서는 지자체의 요금 체납을 줄이기 위해 특정 지자체를 대상으로 검침원의 면담 등을 통해 지방상수도 통합정보시스템에서 체납에 영향을 미치는 내부 데이터 요소를 찾았다. 또한 국가 통계 데이터 중에서 체납에 영향을 미치는 후보 데이터를 도출하였다. 독립변수가 종속변수에 미치는 영향도는 정보이득이라는 데이터 집합에서 종속변수에 대한 무질서도를 조사하여 표본 데이터를 수집하였다. 그리고 빅 데이터 분석 알고리즘인 의사결정트리와 로지스틱 회귀기법 중 어느 알고리즘이 더 높은 예측율을 나타내는지 n-fold cross-validation 방법을 사용하여 평가하였다. 이를 통해 지자체의 데이터를 기초로 알고리즘의 성능을 비교한 결과 의사결정트리가 로지스틱회귀보다 더 정확한 수용가 납부 패턴을 찾을 수 있음을 확인하였다. 머신러닝을 이용한 분석 알고리즘 모델 개발의 과정에서는 알고리즘의 정확성 향상을 위해 의사결정트리의 복잡성과 정확성에 직접적인 영향을 주는 최소 데이터 개수와 최대 순도라는 두 개의 환경변수의 최적값을 도출하였다.