• 제목/요약/키워드: quantiles

검색결과 181건 처리시간 0.029초

일반계 고등학생 사교육비 지출에 대한 베이지안 분위회귀모형 분석 (Bayesian quantile regression analysis of private education expenses for high scool students in Korea)

  • 오현숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1457-1469
    • /
    • 2017
  • 일반계 고등학생의 사교육비 지출은 대학입시와 맞물려 최근 더욱 증가하고 있는 동시에 가구소득 수준, 지역 등에 따라 양극화되고 있다. 기존의 사교육비 연구는 주로 다중회귀모형을 토대로 최소자승법을 이용하였으나 자료가 최소자승법의 기본가정인 정규성과 등분산성을 만족하지 않으면 분석결과의 신뢰성에 대한 문제가 발생된다. 본 연구는 2015년도 사교육실태조사자료에 대하여 정규성과 등분산성이 성립되지 않음을 확인하고 이를 통제할 수 있는 베이지안 분위회귀모형을 적합한 후 깁스 샘플링 방법을 이용하여 사교육비 지출규모 수준 (분위수)에 따라 영향요인들을 분석하였다. 분석결과 학생의 성별, 부모의 나이, 방과후 학교 참여시간과 비용은 사교육비 지출규모에 의미있는 영향을 주지 못하였다. 가구소득은 사교육비 지출규모의 모든 수준에서 동일하게 영향을 주는 요인으로 파악되었다. 그 외, 거주지역, 총사교육시간, 학생의 성적, 부모의 교육정도, 가구의 경제활동주체, 방과후 학교 참여여부, EBS 교재비용은 사교육비 지출 규모의 수준에 따라 다르게 영향을 주었다.

한강유역의 면적 확률강우량 산정에 관한 연구 (The Estimation of Areal Rainfall Quantiles in Han River Basin)

  • 김경덕;고연우;허준행
    • 한국수자원학회논문집
    • /
    • 제33권4호
    • /
    • pp.419-426
    • /
    • 2000
  • 한강유역의 면적 확률강우량을 산정하는데 있어서 자료기간이 충분하고 신뢰할 수 있는 지속기간별 연최대치 강우자료를 구축하는 것은 매우 중요하다. 현재 이를 만족하는 강우자료는 9개 기상청 자료이며, 면적 강우량을 산정하기에는 그 분포가 너무 적은게 사실이다. 이를 해결하기 위하여 건설교통부와 수자원공사 산하 강우관측소 자료 (59개소)의 공간적 상관관계를 이용하여 기상청 강우관측소의 관측소밀도를 보정하였으며, 회귀분석을 실시하여 소유역별 면적 확률강우량을 산정하였다.

  • PDF

Factors Related to Regional Variation in the High-risk Drinking Rate in Korea: Using Quantile Regression

  • Kim, Eun-Su;Nam, Hae-Sung
    • Journal of Preventive Medicine and Public Health
    • /
    • 제54권2호
    • /
    • pp.145-152
    • /
    • 2021
  • Objectives: This study aimed to identify regional differences in the high-risk drinking rate among yearly alcohol users in Korea and to identify relevant regional factors for each quintile using quantile regression. Methods: Data from 227 counties surveyed by the 2017 Korean Community Health Survey (KCHS) were analyzed. The analysis dataset included secondary data extracted from the Korean Statistical Information Service and data from the KCHS. To identify regional factors related to the high-risk drinking rate among yearly alcohol users, quantile regression was conducted by dividing the data into 10%, 30%, 50%, 70%, and 90% quantiles, and multiple linear regression was also performed. Results: The current smoking rate, perceived stress rate, crude divorce rate, and financial independence rate, as well as one's social network, were related to the high-risk drinking rate among yearly alcohol users. The quantile regression revealed that the perceived stress rate was related to all quantiles except for the 90% quantile, and the financial independence rate was related to the 50% to 90% quantiles. The crude divorce rate was related to the high-risk drinking rate among yearly alcohol users in all quantiles. Conclusions: The findings of this study suggest that local health programs for high-risk drinking are needed in areas with high local stress and high crude divorce rates.

Noninformative Priors for the Difference of Two Quantiles in Exponential Models

  • Kang, Sang-Gil;Kim, Dal-Ho;Lee, Woo-Dong
    • Communications for Statistical Applications and Methods
    • /
    • 제14권2호
    • /
    • pp.431-442
    • /
    • 2007
  • In this paper, we develop the noninformative priors when the parameter of interest is the difference between quantiles of two exponential distributions. We want to develop the first and second order probability matching priors. But we prove that the second order probability matching prior does not exist. It turns out that Jeffreys' prior does not satisfy the first order matching criterion. The Bayesian credible intervals based on the first order probability matching prior meet the frequentist target coverage probabilities much better than the frequentist intervals of Jeffreys' prior. Some simulation and real example will be given.

ROBUST TEST BASED ON NONLINEAR REGRESSION QUANTILE ESTIMATORS

  • CHOI, SEUNG-HOE;KIM, KYUNG-JOONG;LEE, MYUNG-SOOK
    • 대한수학회논문집
    • /
    • 제20권1호
    • /
    • pp.145-159
    • /
    • 2005
  • In this paper we consider the problem of testing statistical hypotheses for unknown parameters in nonlinear regression models and propose three asymptotically equivalent tests based on regression quantiles estimators, which are Wald test, Lagrange Multiplier test and Likelihood Ratio test. We also derive the asymptotic distributions of the three test statistics both under the null hypotheses and under a sequence of local alternatives and verify that the asymptotic relative efficiency of the proposed test statistics with classical test based on least squares depends on the error distributions of the regression models. We give some examples to illustrate that the test based on the regression quantiles estimators performs better than the test based on the least squares estimators of the least absolute deviation estimators when the disturbance has asymmetric and heavy-tailed distribution.

Adaptive M-estimation in Regression Model

  • Han, Sang-Moon
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.859-871
    • /
    • 2003
  • In this paper we introduce some adaptive M-estimators using selector statistics to estimate the slope of regression model under the symmetric and continuous underlying error distributions. This selector statistics is based on the residuals after the preliminary fit L$_1$ (least absolute estimator) and the idea of Hogg(1983) and Hogg et. al. (1988) who used averages of some order statistics to discriminate underlying symmetric distributions in the location model. If we use L$_1$ as a preliminary fit to get residuals, we find the asymptotic distribution of sample quantiles of residual are slightly different from that of sample quantiles in the location model. If we use the functions of sample quantiles of residuals as selector statistics, we find the suitable quantile points of residual based on maximizing the asymptotic distance index to discriminate distributions under consideration. In Monte Carlo study, this adaptive M-estimation method using selector statistics works pretty good in wide range of underlying error distributions.

일반화 감마분포의 백분위수에 대한 근사신뢰구간 (Approximate confidence intervals about quantiles in the generalized gamma distribution)

  • 나종화
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.435-442
    • /
    • 1993
  • 일반화 감마분포 모형에서 지표모수(k)가 알려진 경우에는 백분위 수에 대한 정확한 추론이 가능하다. 이 방법은 정확한 결과를 제공하지만 복잡한식의 수치적 계산이 요구된다. 본 논문에서는 이러한 계산상의 어려움을 극복함과 동시에 거의 대등한 정확도를 유지하는 근사신뢰구간을 구하였다. 또한, 로그정규모형에 대해서도 그 결과를 적용시켜 보았다.

  • PDF

Quantile estimation using near optimal unbalanced ranked set sampling

  • Nautiyal, Raman;Tiwari, Neeraj;Chandra, Girish
    • Communications for Statistical Applications and Methods
    • /
    • 제28권6호
    • /
    • pp.643-653
    • /
    • 2021
  • Few studies are found in literature on estimation of population quantiles using the method of ranked set sampling (RSS). The optimal RSS strategy is to select observations with at most two fixed rank order statistics from different ranked sets. In this paper, a near optimal unbalanced RSS model for estimating pth(0 < p < 1) population quantile is proposed. Main advantage of this model is to use each rank order statistics and is distributionfree. The asymptotic relative efficiency (ARE) for balanced RSS, unbalanced optimal and proposed near-optimal methods are computed for different values of p. We also compared these AREs with respect to simple random sampling. The results show that proposed unbalanced RSS performs uniformly better than balanced RSS for all set sizes and is very close to the optimal RSS for large set sizes. For the practical utility, the near optimal unbalanced RSS is recommended for estimating the quantiles.

우리나라 강우 자료를 이용한 FORGEX 기법의 공간상관식 개발 (Development of spatial dependence formula of FORGEX method using rainfall data in Korea)

  • 김성훈;안현준;신홍준;허준행
    • 한국수자원학회논문집
    • /
    • 제49권12호
    • /
    • pp.1007-1014
    • /
    • 2016
  • 영국에서는 지역구분이 필요없고 상대적으로 긴 재현기간에 대해서도 안정적인 확률강우량 추정이 가능한 FORGEX (Focused Rainfall Growth Extension) 기법을 개발하여 강우자료의 지역빈도해석을 수행하고 있으며, 지역빈도해석에 적합한 모집단 성장곡선으로부터 네트워크 최대값(network maximum, netmax) 자료의 분포위치를 고려하기 위하여 영국 강우자료를 이용한 공간상관식(ln $N_e$)을 유도하였다. 이런 이유로 영국에서 개발된 공간상관식을 우리나라에 적용할 경우 부정확한 확률강우량을 산정하는 문제점이 발생한다. 이를 보완하기 위하여 본 연구에서는 우리나라 기상청 산하 유인관측소 지점 중 30년 이상의 긴 강우자료를 보유한 64개 지점의 강우자료를 이용하여 공간상관식을 유도하였다. 지점 간의 합리적인 비교를 위해 1973년부터 2014까지를 기준기간(reference period)으로 정하였고, 강우지속시간, 지점 수, 네트워크 면적 등 3가지 변수를 고려하여 공간상관식을 유도하였다. 유도된 공간상관식을 FORGEX 기법에 적용하여 지역빈도해석을 수행하였고, 기존의 영국식을 이용하여 산정한 확률강우량 값과 비교 분석하였다. 그 결과 우리나라 강우자료를 이용하여 새롭게 유도한 공간상관식은 기존의 영국식 보다 정확한 것으로 나타났고, 이를 FORGEX 기법에 적용한 결과 영국 공간상관식은 새롭게 개발한 공간상관식보다 확률강우량을 과소 추정하는 것으로 나타났다. 본 연구를 통하여 기존 FORGEX 기법에서 내포하고 있는 부정확성을 보완할 수 있고, 긴 재현기간에 대한 확률강우량을 보다 정확하게 추정할 수 있을 것으로 판단된다.

Two-Sample Inference for Quantiles Based on Bootstrap for Censored Survival Data

  • Kim, Ji-Hyun
    • Journal of the Korean Statistical Society
    • /
    • 제22권2호
    • /
    • pp.159-169
    • /
    • 1993
  • In this article, we consider two sample problem with randomly right censored data. We propse two-sample confidence intervals for the difference in medians or any quantiles, based on bootstrap. The bootstrap version of two-sample confidence intervals proposed in this article is simple to apply and do not need the assumption of the shift model, so that for the non-shift model, the density estimation is not necessary, which is an attractive feature in small to moderate sized sample case.

  • PDF