• Title/Summary/Keyword: Variable Bias

Search Result 238, Processing Time 0.022 seconds

A Study on Split Variable Selection Using Transformation of Variables in Decision Trees

  • Chung, Sung-S.;Lee, Ki-H.;Lee, Seung-S.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권2호
    • /
    • pp.195-205
    • /
    • 2005
  • In decision tree analysis, C4.5 and CART algorithm have some problems of computational complexity and bias on variable selection. But QUEST algorithm solves these problems by dividing the step of variable selection and split point selection. When input variables are continuous, QUEST algorithm uses ANOVA F-test under the assumption of normality and homogeneity of variances. In this paper, we investigate the influence of violation of normality assumption and effect of the transformation of variables in the QUEST algorithm. In the simulation study, we obtained the empirical powers of variable selection and the empirical bias of variable selection after transformation of variables having various type of underlying distributions.

  • PDF

데이터마이닝 패키지에서 변수선택 편의에 관한 연구 (A Study on Variable Selection Bias in Data Mining Software Packages)

  • 송문섭;윤영주
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.475-486
    • /
    • 2001
  • 데이터마이닝 패키지에 구현된 분류나무 알고리즘 가운데 CART, CHAID, QUEST, C4.5에서 변수 선택법을 비교하였다. CART의 전체탐색법이 편의를 갖는다는 사실은 잘알려졌으며, 여기서는 상품화된 패키지들에서 이들 알고리즘의 편의와 선택력을 모의실험 연구를 통하여 비교하였다. 상용 패키지로는 CART, Enterprise Miner, AnswerTree, Clementine을 사용하였다. 본 논문의 제한된 모의실험 연구 결과에 의하면 C4.5와 CART는 모두 변수선택에서 심각한 편의를 갖고 있으며, CHAID와 QUEST는 비교적 안정된 결과를 보여주고 있었다.

  • PDF

Robust Variable Selection in Classification Tree

  • 장정이;정광모
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.89-94
    • /
    • 2001
  • In this study we focus on variable selection in decision tree growing structure. Some of the splitting rules and variable selection algorithms are discussed. We propose a competitive variable selection method based on Kruskal-Wallis test, which is a nonparametric version of ANOVA F-test. Through a Monte Carlo study we note that CART has serious bias in variable selection towards categorical variables having many values, and also QUEST using F-test is not so powerful to select informative variables under heavy tailed distributions.

  • PDF

랜덤포레스트를 위한 상관예측변수 중요도 (Correlated variable importance for random forests)

  • 신승범;조형준
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.177-190
    • /
    • 2021
  • 랜덤포레스트는 여러 의사결정나무 모형들을 융합하여 안정성과 예측력을 높여주기 때문에 종종 사용되는 방법이다. 예측력을 증가시키는 반면 해석의 용이성을 희생하기 때문에 이를 보상하기 위해 변수의 중요도를 제공한다. 변수의 중요도는 랜덤포레스트를 구축할 때 변수가 얼마나 중요한 역할을 하는지를 알려 준다. 그러나 어떤 예측변수가 다른 예측변수들과 상관되어 있을 때 기존 알고리즘의 변수중요도는 왜곡될 수 있다. 상관된 예측변수들의 하향 편향은 예측변수의 중요도를 실제 중요도보다 낮게 측정하게 한다. 우리는 기존 알고리즘을 수정하여 상관 예측변수의 하향 편향을 회복하는 새로운 알고리즘을 제안한다. 제안된 알고리즘의 성능은 모의 자료에 의해 증명되고 실제 자료에 의해 설명된다.

Identifying the Actual Impact of Online Social Interactions on Demand

  • Dong Soo Kim
    • Asia Marketing Journal
    • /
    • 제26권1호
    • /
    • pp.23-30
    • /
    • 2024
  • Firms often engage in manipulating online reviews as a promotional activity to influence consumers' evaluation on their products. With the prevalence of the promotional activities, consumers may notice and discount the reviews generated by the promotional activities. Discounting the firm-generating reviews may cause systematic measurement errors in the valence variable and lead to a negative bias when estimating the effect of consumers' organic reviews on demand. To correct the bias, this study proposes including product-specific bias-correction terms representing the proportion of extreme reviews in analysis. For illustration, the proposed method is applied to a demand model for data of movies released in South Korea. The results confirm a negative bias in the estimate of the valence sensitivity of demand. The negative bias potentially leads to an underestimation of the magnitude of the contagion effect through social interactions, a key component of evaluating the value of a satisfied consumer.

The Bias of the Least Squares Estimator of Variance, the Autocorrelation of the Regressor Matrix, and the Autocorrelation of Disturbances

  • Jeong, Ki-Jun
    • Journal of the Korean Statistical Society
    • /
    • 제12권2호
    • /
    • pp.81-90
    • /
    • 1983
  • The least squares estimator of disturbance variance in a regression model is biased under a serial correlation. Under the assumption of an AR(I), Theil(1971) crudely related the bias with the autocorrelation of the disturbances and the autocorrelation of the explanatory variable for a simple regression. In this paper we derive a relation which relates the bias with the autocorrelation of disturbances and the autocorrelation of explanatory variables for a multiple regression with improved precision.

  • PDF

오차간의 상관관계를 이용하는 체계명중률 예측에 관한 연구 (A Study on Delivery Accuracy Using the Correlation between Errors)

  • 김현수;김건인;강환일
    • 문화기술의 융합
    • /
    • 제4권3호
    • /
    • pp.299-303
    • /
    • 2018
  • 일반적으로 대공화기의 체계 명중률을 예측할 때 오차를 각각 고정편기, 가변편기 및 랜덤오차로 분류한 후 가변편기와 랜덤오차는 각 오차의 값의 제곱의 합의 제곱근으로 나타내고 고정편기의 경우는 오차의 합으로 나타낸다. 이때 각 오차의 단위 값의 변화에 관한 고각방향과 방위각 방향의 변위를 나타내는 변수가 가중치로 작용한다. 그리고 이 오차들을 이용하여 정규분포식의 적분을 통하여 체계 명중률을 예측한다. 본 논문에서는 오차의 상관관계를 고려하여 체계 명중률을 예측하는 방법을 제시한다. 본 접근법이 정밀한 체계 명중률을 예측하는데 도움이 된다는 것을 보인다.

COVID 19 방역행동에 있어서 낙관적 편견과 통제성 편향의 영향에 관한 연구 (The Study on the impact of optimistic bias and control illusion in COVID 19 Preventive Behavior)

  • 정현주
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.223-233
    • /
    • 2022
  • 본 연구는 지각된 취약성(Perceived Susceptibility)에 있어서 왜곡현상이라고 할 수 있는 낙관적 편견 외에, 지각된 통제성(Percived Controllbility)에 있어서의 왜곡현상인 통제성 편향(Illusion of Control)을 포함하여 이들 두 변인이 COVID 19 관련 개인방역행동 및 사회적 거리두기 실천과 어떠한 영향관계를 가지는지 검증하고자 하였다.이를 위해 마크로밀 엠브레인의 온라인 패널을 활용하여 설문조사를 실시하였으며, 마스크 착용, 손씻기, 손소독제 사용 등의 개인방역행동을 독립변인으로 하여, 통제성 편향과 낙관적 편견에 어떻게 영향을 주는지를 분석하고, 아울러 낙관적 편견이 사회적 거리두기에 어떠한 영향을 주는지를 회귀분석방법을 통해 분석하였다. 분석 결과, COVID 19 개인방역행동 중 손씻기 실천을 제외하고는 통제성 편향에 유의적인 영향을 주고 있지 않았다. 본 연구에서는 통제성 편향이 낙관적 편견에 영향을 주는 변인인 것으로 나타났으며, 특히 성별과 연령 등 인구학적 변인에 따라 개인방역행동이 통제성 편향에 주는 영향, 통제성 편향이 낙관적 편향에 주는 영향, 그리고 낙관적 편향이 사회적 거리두기에 주는 영향이 다르게 나타났다. 이는 향후 사회적 거리두기 촉진을 위한 개입 프로그램을 마련하는 과정에서 타겟별 차별화된 전략 및 메시지를 마련할 수 있는 근거를 제시해 줄 수 있을 것으로 보인다.

3D 가변 선회 모델 및 기구학적 구속조건을 사용한 기동표적 추적 (Maneuvering Target Tracking With 3D Variable Turn Model and Kinematic Constraint)

  • 김남수;이동우;방효충
    • 한국항공우주학회지
    • /
    • 제48권11호
    • /
    • pp.881-888
    • /
    • 2020
  • 본 논문에서는 관측자가 얻을 수 있는 시선각(LOS) 측정값을 사용하여 관심표적의 상태변수를 추정하는 연구를 수행하였다. 관심상태변수는 표적의 위치, 속도 및 가속도로 설정하였다. 시선각 측정값은 필터에 표적운동모델 적용을 어렵게 하는 비선형성이 강한 측정값이다. 이러한 문제해결을 위해 가측정치 공식(Pseudomeasurement equation)을 사용하여 시선각 측정값 수식을 변경한 후 3D 가변선회(3D Variable Turn) 표적운동모델을 적용하였다. 또한 필터의 성능을 위해 기구학적구속조건(Kinematic Constraint)을 적용하였다. 필터는 초기조건에 강건한 특성을 가진 Bias Compensation Pseudomeasurement Filter (BCPMF)를 사용하였다. 병렬 계산의 이점을 위해 Two Stage Kalman Filter 형태를 추가적으로 적용하였다. 이 기법들을 사용하여 TBCPMF 3DVT-KC 필터를 제안하였고 시뮬레이션을 통해 성능을 확인하였다.

Compact Metamaterial-Based Tunable Phase Shifter at 2.4 GHz

  • Jung, Youn-Kwon;Lee, Bomson
    • Journal of electromagnetic engineering and science
    • /
    • 제13권2호
    • /
    • pp.137-139
    • /
    • 2013
  • A compact metamaterial (MTM)-based tunable phase shifter consisting of four unit cells with a simple DC bias circuit has been designed at 2.4 GHz. The variable series capacitors and shunt inductors that are required to be loaded periodically onto a host transmission line are realized employing only chip variable capacitors (varactors). In addition, the proposed phase shifter requires only one DC bias source to control the varactors, with the matching condition of the MTM line automatically satisfied. The measured phase shifting range is $285.2^{\circ}$ (from $-74.2^{\circ}$ to $211^{\circ}$). The measured insertion loss is approximately 1.5 dB. The circuit/electromagnetic-simulated and measured results are in good agreement.