• Title/Summary/Keyword: 조사회귀모형

Search Result 751, Processing Time 0.03 seconds

Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data (보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교)

  • Rhee, Eun Hee;Hwang, Beom Seuk
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.1
    • /
    • pp.131-146
    • /
    • 2022
  • Logit models are commonly used to predicting and classifying categorical response variables. Most Bayesian approaches to logit models are implemented based on the Metropolis-Hastings algorithm. However, the algorithm has disadvantages of slow convergence and difficulty in ensuring adequacy for the proposal distribution. Therefore, we use auxiliary mixture sampler proposed by Frühwirth-Schnatter and Frühwirth (2007) to estimate logit models. This method introduces two sequences of auxiliary latent variables to make logit models satisfy normality and linearity. As a result, the method leads that logit model can be easily implemented by Gibbs sampling. We applied the proposed method to diabetes data from the Community Health Survey (2020) of the Korea Disease Control and Prevention Agency and compared performance with Metropolis-Hastings algorithm. In addition, we showed that the logit model using auxiliary mixture sampling has a great classification performance comparable to that of the machine learning models.

로지스틱 회귀를 통한 경마의 입상확률모형

  • 유선경;박흥선
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.1
    • /
    • pp.35-43
    • /
    • 2000
  • 본 연구에서는 우리 나라 경마의 실제자료를 이용하여 연승식 경마의 입상확률에 미치는 여러 가지 요인을 조사하였고, 이를 토대로 입상확률모형을 유도하여 보았다. 외국의 경우, 경마에 대한 통계적 접근이 다각적으로 시행되었지만, 기존의 선행방법이 배당금에 의한 입상확률에 근거를 하고 있는 반면, 본 연구에서는 경마장에서 쉽게 구할 수 있는 정보를 중심으로, 로지스틱 회귀를 이용한 방법을 시도해 보았다.

  • PDF

Comparison of Regression Model Approaches fitted to Complex Survey Data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교: 소규모사업체조사 데이터 분석을 중심으로)

  • 이기재
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2001.04a
    • /
    • pp.73-86
    • /
    • 2001
  • In this paper, we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations(GEEs) approach with the model-based approach through the design and weighting effects analysis.

Comparison of regression model approaches fitted to complex survey data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교 - 소규모사업체조사 데이터 분석을 중심으로 -)

  • 이기재
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2001.06a
    • /
    • pp.45-56
    • /
    • 2001
  • In this paper, we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations(GEEs) approach with the model-based approach through the design and weighting effects analysis.

  • PDF

A study on Bayesian beta regressions for modelling rates and proportions (비율자료 모델링을 위한 베이지안 베타회귀모형의 비교 연구)

  • Jeongin Lee;Jaeoh Kim;Seongil Jo
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.3
    • /
    • pp.339-353
    • /
    • 2024
  • In cases where the response variable in proportional data is confined to a limited interval, a regression model based on the assumption of normality can yield inaccurate results due to issues such as asymmetry and heteroscedasticity. In such cases, the beta regression model can be considered as an alternative. This model reparametrizes the beta distribution in terms of mean and precision parameters, assuming that the response variable follows a beta distribution. This allows for easy consideration of heteroscedasticity in the data. In this paper, we therefore aim to analyze proportional data using the beta regression model in two empirical analyses. Specifically, we investigate the relationship between smoking rates and coffee consumption using data from the 6th National Health Survey, and examine the association between regional characteristics in the U.S. and cumulative mortality rates based on COVID-19 data. In each analysis, we apply the ordinary least squares regression model, the beta regression model, and the extended beta regression model to analyze the data and interpret the results with the selected optimal model. The results demonstrate the appropriateness of applying the beta regression model and its extended version in proportional data.

건강 관련 삶의 질의 사회인구학적 상관요인에 대한 공간분석

  • Jo, Dong-Gi
    • Korea journal of population studies
    • /
    • v.32 no.3
    • /
    • pp.1-20
    • /
    • 2009
  • 본 연구는 지리정보시스템(GIS)과 지리적 가중 회귀(GWR)를 이용하여 건강 관련 삶의 질(HRQoL)의 사회인구학적 상관요인에 대한 공간분석을 시도한다. 관찰의 독립성과 오차의 동분산성을 가정하는 전통적 회귀분석과 달리, 지리적 가중 회귀분석은 속성정보뿐만 아니라 공간정보를 활용하는 공간분석 기법이다. 분석모형은 건강 관련 삶의 질을 종합적으로 측정하는 EQ-5D를 종속변수로 하고 지역의 사회인구학적 특성인 노령인구비율, 조이혼율, 병상수, 재정자주도를 독립변수로 하여 구성하였다. 종속변수는 질병관리본부에서 실시한 <지역사회건강조사>의 자료를 이용하였고, 독립변수는 통계청 온라인 DB에 수록된 지역별 자료를 이용하였다. 모형을 추정해 본 결과 전반적으로 사회적 특성보다는 노령인구비율이나 조이혼율과 같은 인구학적 특성이 건강 관련 삶의 질에 더 많은 영향을 미치는 것으로 나타났다. 공간적 변이를 고려하는 지역모형은 전역모형에서 드러나지 않았던 중요한 유형을 보여주는데, 노령인구비율 변수와 조이혼율 변수의 지역별 추정치를 지도상으로 살펴본 결과 변수들의 효과가 공간적 위치에 따라 차이를 보인다는 점이 확인되었다. 분석 결과는 또한 지리적 가중 회귀분석이 전통적 회귀분석에 비해 공간적 자기상관의 문제를 극복하고 모형의 부합도를 증가시킨다는 것을 보여준다.

Testing the Equality of Two Linear Regression Models : Comparison between Chow Test and a Permutation Test

  • Um, Yonghwan
    • Journal of the Korea Society of Computer and Information
    • /
    • v.26 no.8
    • /
    • pp.157-164
    • /
    • 2021
  • Regression analysis is a well-known statistical technique useful to explain the relationship between response variable and predictor variables. In particular, Researchers are interested in comparing the regression coefficients(intercepts and slopes) of the models in two independent populations. The Chow test, proposed by Gregory Chow, is one of the most commonly used methods for comparing regression models and for testing the presence of a structural break in linear models. In this study, we propose the use of permutation method and compare it with Chow test analysis for testing the equality of two independent linear regression models. Then simulation study is conducted to examine the powers of permutation test and Chow test.

Influence Comparison of Customer Satisfaction Factor using Quantile Regression Model (분위회귀모형을 이용한 고객만족도 요인의 영향력 비교)

  • Kim, Seong-Yoon;Kim, Yong-Tae;Lee, Sang-Jun
    • Journal of Digital Convergence
    • /
    • v.13 no.6
    • /
    • pp.125-132
    • /
    • 2015
  • It is current situation that a number of issues are being raised how the weight is calculated from customer satisfaction survey. This study investigated how the weight of satisfaction for each quantile is different by comparing ordinary least square regression model to quantile regression model and carried out bootstrap verification to find the influence difference of regression coefficient for each quantile. As the analysis result of using R(Quantreg package) that is open software, it appeared that there was the influence size of satisfaction factor along study result and quantile and there was the significant difference statistically regarding regression coefficient for each quantile. So, to use quantile regression model that offers the influence of satisfaction factor for each customer group along satisfaction level would contribute to plan the quantitative convergence policy for customer satisfaction.

Estimation of Average Low Flow Using Base Flow Index for Ungaged Basin (기저유량비를 이용한 미계측 유역의 평균 갈수량 산정)

  • Lee, Si Yoon;Kim, Chi Young;Lee, Jong so;Kim, Hung Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.415-420
    • /
    • 2017
  • 유량자료는 연속적으로 관측하기가 쉽지 않을 뿐 아니라 모든 관측소에서 매년 적정한 유량자료를 생산하는 것 또한 매우 어려운 실정이다. 이에 따라 미계측 유역에 대한 유량 산정을 위해 많은 연구가 진행되고 있다. 영국의 "Low Flow Studies report(Institute of Hydrology, 1980)"에서는 갈수량 산정과 관련하여 기저유량비(Base Flow Index, BFI)를 사용하는 것을 추천하였다. 국내에서는 이와 관련한 적용 사례가 없기 때문에 본 연구에서는 BFI를 적용하여 미계측 유역의 갈수량을 산정하고자 하였다. 대상유역은 낙동강 권역의 22개 지점을 대상으로 실시하였으며, 기저유량비 및 평균 갈수량과 유역 및 수문인자들의 상관분석을 수행하였다. 분석을 통하여 기저유량비는 토양군 C와 지하수위를 독립변수로, 평균 갈수량은 기저유량비, 유역면적, 강수량을 독립변수로 선정하여 회귀분석을 실시하였다. 그 결과 개발한 기저유량비 지역회귀모형의 상대오차는 -26.5%(기계2)~57.2%(구영)의 범위로 분포하였고, 절대오차의 평균은 17.2%로 산정되었다. 평균 갈수량 지역회귀모형은 상대오차가 -38.4%(도천)~184.4%(길안)의 범위에서 분포하고 있으며, 절대오차의 평균은 47.3%이다. 그러나 소토, 기계2, 길안 지점을 제외하면 절대오차는 30.6%이다. 상대오차는 다소 부정적이지만 기존에 개발된 지역회귀모형으로 평균 갈수량을 산정한 결과와 비교하면 상대적으로 양호한 것으로 판단된다. 사용한 자료의 기간이 6년으로 통계적인 결과로 보기에는 다소 미흡한 측면이 있지만, 유역인자로서 BFI가 미계측 유역의 갈수량 특성을 설명할 수 있는 우수한 인자라고 판단하였다.

  • PDF

Application of Central Composite Design in Simulation Experiment (시뮬레이션 실험에서 중심합성계획의 응용)

  • 권치명
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2004.05a
    • /
    • pp.41-47
    • /
    • 2004
  • 중심합성계획(central composite design: ccd)은 반응 표면이 곡면적인 특성을 나타낼때 반응 공간을 추정하기 위해 사용되는 실험계획이다. 반응공간이 2차 회귀모형으로 나타나는 경우에 반응곡면의 변화량을 알기 위해서는 변수의 수준이 3이상이 되어야하는데 ccd는 적은 횟수의 실험으로 곡면을 효과적으로 추정하기 위해 2$^{k}$ 요인실험에 추가적으로 중심점(central point)과 축점(axial point)을 표본점에 포함시키는 계획이다. 본 연구에서는 시뮬레이션 실험에서 반응변수가 2차 회귀모형으로 근사되는 경우에 cod를 이용하여 관심 성과치의 반응표면을 추정하고자 한다. 일반적인 실험에서와는 달리 시뮬레이션 실험에서는 두개의 표본점(인자 수준의 조합)에서 분석자가 공통 난수계열(common random number series)을 부여하여 시뮬레이션 시스템 요소의 변화과정을 유사하게 통제할 수 있다. 일반적으로 공통난수법(common random number method)에 의해 얻어지는 두 표본점에서의 반응변수는 서로 양의 상관관계를 가지며 대조 난수(antithetic random number)에 의한 두 반응변수는 음의 상관성을 가지는 것으로 알려졌다. 본 연구는 ccd의 표본점에 공통난수와 대조난수 법을 이용하여 회귀모형의 파라미터를 효과적으로 추정하는 방법을 조사하고 이를 (s, S) 재고관리 모형에 적용하여 그 효율성을 평가하고자 한다.

  • PDF