• 제목/요약/키워드: Variable Statistics

검색결과 1,333건 처리시간 0.023초

SAMPLE-SPACING 방법에 의한 상호정보의 추정 (Sample-spacing Approach for the Estimation of Mutual Information)

  • 허문열;차운옥
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.301-312
    • /
    • 2008
  • 상호정보(mutual information: MI)는 설명변수의 목적변수에 대한 예측정도를 나타내는 척도로서, 목적변수에 대한 설명 변수의 중요도 순위를 구하거나 목적 변수를 잘 설명해주는 설명변수의 집합을 구하는 변수선택문제에 유용하게 사용된다. 본 논문에서는 연속형 설명변수와 범주형 목적변수로 구성된 데이터로부터 결합확률분포를 추정하지 않고도 MI 추정량을 구할 수 있는 Sample-spacing 방법에 대한 연구를 수행하였다. 몬테 칼로 모의 실험과 실제데이터에 대한 실험결과, MI 추정을 위해 Sample-spacing 방법을 사용할 때 m = 1을 사용하면 충분히 신뢰할만한 결과를 얻을 수 있다는 것을 알 수 있었다.

Discretization Method Based on Quantiles for Variable Selection Using Mutual Information

  • CHa, Woon-Ock;Huh, Moon-Yul
    • Communications for Statistical Applications and Methods
    • /
    • 제12권3호
    • /
    • pp.659-672
    • /
    • 2005
  • This paper evaluates discretization of continuous variables to select relevant variables for supervised learning using mutual information. Three discretization methods, MDL, Histogram and 4-Intervals are considered. The process of discretization and variable subset selection is evaluated according to the classification accuracies with the 6 real data sets of UCI databases. Results show that 4-Interval discretization method based on quantiles, is robust and efficient for variable selection process. We also visually evaluate the appropriateness of the selected subset of variables.

A Combining Dynamic Graph of Added Variable Plot and Component plus Residual Plot

  • Park, Chong-sun
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.119-128
    • /
    • 1997
  • Added variable plot and component-plus-residual plot are very useful for studying the role of a predictor in classical regression analysis. The former is usually used to check the effect of adding a new variable to existing model. The latter has been suggested as computationally convenient substitutes for the added variable plots, however, this plot is found to be better in detecting nonlinear relationships of a new predictor. By combining these two plots dynamically, we can take advantages of two plots simultaneously. And even further, we can get some knowledge of collinearity between a new predictor and predictors already in the model, and more accurate information about the possible outliers.

  • PDF

On the Categorical Variable Clustering

  • Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권2호
    • /
    • pp.219-226
    • /
    • 1996
  • Basic objective in cluster analysis is to discover natural groupings of items or variables. In general, variable clustering was conducted based on some similarity measures between variables which have binary characteristics. We propose a variable clustering method when variables have more categories ordered in some sense. We also consider some measures of association as a similarity between variables. Numerical example is included.

  • PDF

DUALITIES OF VARIABLE ANISOTROPIC HARDY SPACES AND BOUNDEDNESS OF SINGULAR INTEGRAL OPERATORS

  • Wang, Wenhua
    • 대한수학회보
    • /
    • 제58권2호
    • /
    • pp.365-384
    • /
    • 2021
  • Let A be an expansive dilation on ℝn, and p(·) : ℝn → (0, ∞) be a variable exponent function satisfying the globally log-Hölder continuous condition. Let Hp(·)A (ℝn) be the variable anisotropic Hardy space defined via the non-tangential grand maximal function. In this paper, the author obtains the boundedness of anisotropic convolutional ��-type Calderón-Zygmund operators from Hp(·)A (ℝn) to Lp(·) (ℝn) or from Hp(·)A (ℝn) to itself. In addition, the author also obtains the duality between Hp(·)A (ℝn) and the anisotropic Campanato spaces with variable exponents.

THE BOUNDEDNESS OF BILINEAR PSEUDODIFFERENTIAL OPERATORS IN TRIEBEL-LIZORKIN AND BESOV SPACES WITH VARIABLE EXPONENTS

  • Yin Liu;Lushun Wang
    • 대한수학회보
    • /
    • 제61권2호
    • /
    • pp.529-540
    • /
    • 2024
  • In this paper, using the Fourier transform, inverse Fourier transform and Littlewood-Paley decomposition technique, we prove the boundedness of bilinear pseudodifferential operators with symbols in the bilinear Hörmander class $BS^{m}_{1,1}$ in variable Triebel-Lizorkin spaces and variable Besov spaces.

WAVELET CHARACTERIZATIONS OF VARIABLE HARDY-LORENTZ SPACES

  • Yao He
    • 대한수학회보
    • /
    • 제61권2호
    • /
    • pp.489-509
    • /
    • 2024
  • In this paper, let q ∈ (0, 1]. We establish the boundedness of intrinsic g-functions from the Hardy-Lorentz spaces with variable exponent Hp(·),q(ℝn) into Lorentz spaces with variable exponent Lp(·),q(ℝn). Then, for any q ∈ (0, 1], via some estimates on a discrete Littlewood-Paley g-function and a Peetre-type maximal function, we obtain several equivalent characterizations of Hp(·),q(ℝn) in terms of wavelets.

일반화가법모형에서 축소방법의 적용연구 (A Study on Applying Shrinkage Method in Generalized Additive Model)

  • 기승도;강기훈
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.207-218
    • /
    • 2010
  • 일반화가법모형은 기존 선형회귀모형의 문제점을 대부분 해결한 통계모형이지만 의미있는 독립변수의 수를 줄이는 방법이 적용되지 않을 경우 과대적합 문제가 발생할 수 있다. 그러므로 일반화가법모형에서 변수 축소방법을 적용하는 연구가 필요하다. 회귀분석에서 변수 축소방법으로 최근에는 Lasso 계열의 접근법이 연구되고 있다. 본 연구에서는 활용성이 높은 통계모형인 일반화가법모형에 Lasso 계열의 모형 중에서 Group Lasso와 Elastic net 모형을 적용하는 방법을 제시하고 이들의 해를 구하는 절차를 제안하였다. 그리고 제안된 방법을 모의실험과 실제자료인 회계년도 2005년 자동차보혐 자료에 적용을 통해 비교하여 보았다. 그 결과 본 논문에서 제안한 Group Lasso와 Elastic net을 이용하여 변수 축소를 통한 일반화가법모형이 기존의 방법보다 더 나은 결과를 제공하는 것으로 분석 되었다.

벌점화 분위수 회귀나무모형에 대한 연구 (Penalized quantile regression tree)

  • 김재오;조형준;방성완
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1361-1371
    • /
    • 2016
  • 분위수 회귀모형은 설명변수가 반응변수의 조건부 분위수 함수에 어떻게 관계되는지 탐색함으로서 많은 유용한 정보를 제공한다. 그러나 설명변수와 반응변수가 비선형 관계를 갖는다면 선형형태를 가정하는 전통적인 분위수 회귀모형은 적합하지 않다. 또한 고차원 자료 또는 설명변수간 상관관계가 높은 자료에 대해서 변수선택의 방법이 필요하다. 이러한 이유로 본 연구에서는 벌점화 분위수 회귀나무모형을 제안하였다. 한편 제안한 방법의 분할규칙은 과도한 계산시간과 분할변수 선택편향 문제를 극복한 잔차 분석을 기반으로 하였다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.