• 제목/요약/키워드: Selection bias

검색결과 330건 처리시간 0.029초

A Study on the Bias Reduction in Split Variable Selection in CART

  • Song, Hyo-Im;Song, Eun-Tae;Song, Moon Sup
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.553-562
    • /
    • 2004
  • In this short communication we discuss the bias problems of CART in split variable selection and suggest a method to reduce the variable selection bias. Penalties proportional to the number of categories or distinct values are applied to the splitting criteria of CART. The results of empirical comparisons show that the proposed modification of CART reduces the bias in variable selection.

Bayesian estimation for finite population proportion under selection bias via surrogate samples

  • Choi, Seong Mi;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1543-1550
    • /
    • 2013
  • In this paper, we study Bayesian estimation for the finite population proportion in binary data under selection bias. We use a Bayesian nonignorable selection model to accommodate the selection mechanism. We compare four possible estimators of the finite population proportions based on data analysis as well as Monte Carlo simulation. It turns out that nonignorable selection model might be useful for weekly biased samples.

메타분석의 선택 편향 보정을 위한 쌍별 유사가능도 접근법 (Pairwise pseudolikelihood approach for adjusting selection bias in meta-analysis)

  • 국성희;이우주
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.439-449
    • /
    • 2020
  • 메타 분석은 여러 연구 결과들을 종합시켜주는 분석 방법 중 하나이다. 이 때 수집되는 연구 문헌들은 소규모 연구인 경우 통계적으로 유의한 결과를 보이는 연구가 출간될 확률이 높기 때문에, 선택 편향의 특수한 경우인 출판 편향이 종종 발생한다. 선택 편향을 보정하는 방법에는 조건부 가능도와 가중 추정 방정식이 있는데 이 방법들은 실제 얻기 힘든 정확한 선택 확률 모형을 필요로한다. 반면 쌍별 유사가능도 접근법은 선택 확률 모형을 정확히 알 수 없는 경우에도 선택 편향을 보정할 수 있는 방법으로 제안되었다. 본 논문은 메타분석에서 쌍별 유사가능도 접근법의 성능과 문제점을 수치적으로 연구한다.

대졸청년층의 취업지역에 대한 자기선택을 고려한 임금함수 추정 (Estimation of Wage Equation for College Graduates with Correction for Selection Bias upon Working State)

  • 이치호
    • 노동경제논집
    • /
    • 제42권3호
    • /
    • pp.39-74
    • /
    • 2019
  • 본 논문에서는 2007~2013년 "대졸자직업이동경로조사" 데이터와 Dahl(2002)의 준모수적 방법론을 사용하여 선택편의를 보정한 대졸자들의 취업 초기 임금함수를 추정하고, 각 계수의 지역 간 차이가 선택편의에 기인한 것인지 검증하고자 하였다. 분석 결과, 선택편의를 보정하더라도 성별에 따른 임금 프리미엄의 지역 간 차이는 큰 변화가 없으며, 학력, 전공에 따른 임금 프리미엄의 지역 간 차이는 각각 약 18%, 11% 감소하여 여전히 지역 간에 큰 차이가 존재하는 것으로 나타났다. 한편, 서울 및 경기 지역에 대해서는 선택 편의가 미미한 것으로 나타나 대졸청년층의 수도권 선호 경향은 성별, 학력, 전공 등 노동자들의 특성에 별다른 관계없이 일반적인 것으로 보인다.

  • PDF

Bias Reduction in Split Variable Selection in C4.5

  • Shin, Sung-Chul;Jeong, Yeon-Joo;Song, Moon Sup
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.627-635
    • /
    • 2003
  • In this short communication we discuss the bias problem of C4.5 in split variable selection and suggest a method to reduce the variable selection bias among categorical predictor variables. A penalty proportional to the number of categories is applied to the splitting criterion gain of C4.5. The results of empirical comparisons show that the proposed modification of C4.5 reduces the size of classification trees.

표본선택 편의를 반영한 임금결정요인 분석 (The wage determinants applying sample selection bias)

  • 박성익;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1317-1325
    • /
    • 2016
  • 본 연구에서는 한국고용정보원에서 실시한 "2013 고졸자 취업진로조사" 자료를 활용하여 특성화고 졸업자의 임금결정요인을 분석하였다. 일반적으로 임금은 개인의 취업여부와 임금의 크기에 대한 두 가지의 복합적인 정보를 담고 있다. 그러나 임금 결정요인분석의 많은 선행연구에서는 후자의 정보만을 대상으로 최소제곱법에 기초한 선형 회귀분석을 수행함으로써 표본선택에 의한 편의 (sample selection bias) 문제가 발생하게 된다. 본 연구에서는 임금결정요인분석에서 표본선택에 의한 편의 문제를 극복하기 위해 Tobit 모형과 Heckman의 표본선택 모형을 분석에 활용하였다. 주요 분석 결과를 요약하면 다음과 같다. 먼저 Tobit 모형과 Heckman의 표본선택 모형에 대한 타당성은 통계적으로 유의함을 알 수 있었다. 성별은 취업확률과 임금의 크기에서 모두 통계적으로 유의한 것으로 나타났다. 마이스터고 졸업생은 취업확률과 임금의 크기 모두 기타고 졸업생에 비해서 높은 것을 알 수 있었으며, 부모소득이 높을수록 취업확률과 임금의 크기가 모두 통계적으로 유의하게 증가하였다. 부모학력이 고졸이하에 비해서 대졸이상이 취업확률은 통계적으로 유의하게 낮지만, 임금의 크기는 높게 나타났다. 고교성적은 높을수록, 고교 만족도가 높을수록, 그리고 자격증 수가 많을수록 취업확률과 임금의 크기 모두 통계적으로 유의하게 높은 것을 알 수 있다.

Codon Usage Patterns of Tyrosinase Genes in Clonorchis sinensis

  • Bae, Young-An
    • Parasites, Hosts and Diseases
    • /
    • 제55권2호
    • /
    • pp.175-183
    • /
    • 2017
  • Codon usage bias (CUB) is a unique property of genomes and has contributed to the better understanding of the molecular features and the evolution processes of particular gene. In this study, genetic indices associated with CUB, including relative synonymous codon usage and effective numbers of codons, as well as the nucleotide composition, were investigated in the Clonorchis sinensis tyrosinase genes and their platyhelminth orthologs, which play an important role in the eggshell formation. The relative synonymous codon usage patterns substantially differed among tyrosinase genes examined. In a neutrality analysis, the correlation between $GC_{12}$ and $GC_3$ was statistically significant, and the regression line had a relatively gradual slope (0.218). NC-plot, i.e., $GC_3$ vs effective number of codons (ENC), showed that most of the tyrosinase genes were below the expected curve. The codon adaptation index (CAI) values of the platyhelminth tyrosinases had a narrow distribution between 0.685/0.714 and 0.797/0.837, and were negatively correlated with their ENC. Taken together, these results suggested that CUB in the tyrosinase genes seemed to be basically governed by selection pressures rather than mutational bias, although the latter factor provided an additional force in shaping CUB of the C. sinensis and Opisthorchis viverrini genes. It was also apparent that the equilibrium point between selection pressure and mutational bias is much more inclined to selection pressure in highly expressed C. sinensis genes, than in poorly expressed genes.

교수 및 학습 프로그램 평가연구의 선별편향성 개선을 위한 제언 (Suggestions to Improve Selection-Bias in Teaching or Studying Programs)

  • 박경호
    • 의학교육논단
    • /
    • 제12권1호
    • /
    • pp.3-8
    • /
    • 2010
  • This study is designed to evaluate the effectiveness of teaching or studying programs, and thus to overcome the selectionbias in studies. Selection-bias derived from unobservable characteristics in the course of participants selection of the teaching or studying programs, in the case of cross-section data instrumental variable(IV) method and two stage least square estimation were suggested as an analysis tool. Panel data were analyzed by using both fixed effect in which individual effects are captured by intercept terms and random effect estimation where an unobserved effect can be characterized as being randomly drawn from a given distribution.

A CONSISTENT AND BIAS CORRECTED EXTENSION OF AKAIKE'S INFORMATION CRITERION(AIC) : AICbc(k)

  • Kwon, Soon H.;Ueno, M.;Sugeno, M.
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제2권1호
    • /
    • pp.41-60
    • /
    • 1998
  • This paper derives a consistent and bias corrected extension of Akaike's Information Criterion (AIC), $AIC_{bc}$, based on Kullback-Leibler information. This criterion has terms that penalize the overparametrization more strongly for small and large samples than that of AIC. The overfitting problem of the asymptotically efficient model selection criteria for small and large samples will be overcome. The $AIC_{bc}$ also provides a consistent model order selection. Thus, it is widely applicable to data with small and/or large sample sizes, and to cases where the number of free parameters is a relatively large fraction of the sample size. Relationships with other model selection criteria such as $AIC_c$ of Hurvich, CAICF of Bozdogan and etc. are discussed. Empirical performances of the $AIC_{bc}$ are studied and discussed in better model order choices of a linear regression model using a Monte Carlo experiment.

  • PDF

표본중도절단에 따른 통계학적 문제와 교정방법에 관한 고찰 -소비자분야 연구에의 적용을 중심으로- (Statistical Problems Caused by Sample Censoring and Their Solutions -Focused on the application to consumer research-)

  • 나명균
    • 대한가정학회지
    • /
    • 제33권2호
    • /
    • pp.19-27
    • /
    • 1995
  • This paper discusses the bias that results from using nonrandomly selectd samples of consumer research. A two stage system (maximum likelihood probit analysis and ordinary least square analysis) is a solution to sample selection bias. Empirical results show that correcting for sample selection bias improves the validity of consumer research results.

  • PDF