• 제목/요약/키워드: longitudinal binary data

검색결과 19건 처리시간 0.025초

Bayesian Pattern Mixture Model for Longitudinal Binary Data with Nonignorable Missingness

  • Kyoung, Yujung;Lee, Keunbaik
    • Communications for Statistical Applications and Methods
    • /
    • 제22권6호
    • /
    • pp.589-598
    • /
    • 2015
  • In longitudinal studies missing data are common and require a complicated analysis. There are two popular modeling frameworks, pattern mixture model (PMM) and selection models (SM) to analyze the missing data. We focus on the PMM and we also propose Bayesian pattern mixture models using generalized linear mixed models (GLMMs) for longitudinal binary data. Sensitivity analysis is used under the missing not at random assumption.

Confounding of Time Trend with Dropout Process in Longitudinal Data Analysis

  • Kim, Ji-Hyun;Choi, Hye-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제9권3호
    • /
    • pp.703-713
    • /
    • 2002
  • In longitudinal studies, outcomes are repeatedly measured over time for each subject. It is common to have missing values or dropouts for longitudinal data. In this study time trend in longitudinal data with dropouts is of concern. The confounding of time trend with dropout process is investigated through simulation studies. Some simulation results are reported for binary responses as well as continuous responses with patterns of dropouts varying. It has been found that time trend is not confounded with random dropout process for binary responses when it is estimated using GEE.

A Study on Decision Tree for Multiple Binary Responses

  • Lee, Seong-Keon
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.971-980
    • /
    • 2003
  • The tree method can be extended to multivariate responses, such as repeated measure and longitudinal data, by modifying the split function so as to accommodate multiple responses. Recently, some decision trees for multiple responses have been constructed by Segal (1992) and Zhang (1998). Segal suggested a tree can analyze continuous longitudinal response using Mahalanobis distance for within node homogeneity measures and Zhang suggested a tree can analyze multiple binary responses using generalized entropy criterion which is proportional to maximum likelihood of joint distribution of multiple binary responses. In this paper, we will modify CART procedure and suggest a new tree-based method that can analyze multiple binary responses using similarity measures.

Semiparametric kernel logistic regression with longitudinal data

  • Shim, Joo-Yong;Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.385-392
    • /
    • 2012
  • Logistic regression is a well known binary classification method in the field of statistical learning. Mixed-effect regression models are widely used for the analysis of correlated data such as those found in longitudinal studies. We consider kernel extensions with semiparametric fixed effects and parametric random effects for the logistic regression. The estimation is performed through the penalized likelihood method based on kernel trick, and our focus is on the efficient computation and the effective hyperparameter selection. For the selection of optimal hyperparameters, cross-validation techniques are employed. Numerical results are then presented to indicate the performance of the proposed procedure.

목표변수의 형태에 따른 신용평점 모형 구축 (Building credit scoring models with various types of target variables)

  • 우현석;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.85-94
    • /
    • 2013
  • 금융시장의 규모가 점점 더 커짐에 따라 고객정보 관리 미숙 또는 부실한 의사결정, 즉 신용 리스크 관리 실패로 인한 손실이 막대하게 증가하고 있다. 따라서 신용 리스크 관리가 점차 더 중요해지고, 이런 신용 리스크를 최소화하는 기본적인 도구인 신용 평점 모형이 절실히 요구된다. 신용평점 모형은 주로 이항형 목표변수만 이용하여 개발 연구되었다. 본 논문에서는 순서형 다항 자료 또는 경시적 이항 자료 같은 다른 형태의 목표 변수를 고려한 신용평점 모형구축 방법을 제시한다. 그 개발된 모형을 실제 자료와 랜덤화한 자료에 적용하여 Kolmogorov-Smirnov 통계량으로 비교 분석한다.

t-링크를 갖는 마코프 이항 회귀 모형을 이용한 인도네시아 어린이 종단 자료에 대한 베이지안 분석 (Bayesian inference of longitudinal Markov binary regression models with t-link function)

  • 심보현;정윤식
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.47-59
    • /
    • 2020
  • 본 논문에서는 마코프 이항 회귀 모형의 시차가 알려져 있거나 그렇지 않은 경우일 때, t-링크 함수를 갖는 종단적 마코프 이항 회귀 모형을 제시한다. 일반적으로, 이항 회귀 모형에서는 로직 모형이나 프로빗 모형이 주로 사용된다. t-링크 함수는 t 분포가 자유도가 커질수록 정규분포로 근사하기 때문에 프로빗 모형을 대신 더 많은 유연성을 위해 사용될 수 있다. 게다가 마코프 회귀모형은 종단 자료에 대해 사용될 수 있다. 우리는 마코프 회귀 모형의 시차를 결정하기 위해 베이지안 방법을 제시하고자 한다. 특히, 각 모델의 차수에 대해 알고 있는 경우에는 DIC를 기준으로 모델 비교를 실시하였다. 모델의 차수에 대해 모르는 경우에는 가능한 모델들의 사후 확률을 이용하였다. 복잡한 베이지안 계산을 해결하기 위하여 Albert와 Chib (1993), Kuo와 Mallick (1998)과 Erkanli 등 (2001)의 방법을 이용하여 모델을 재설정하였다. 제안하는 방법은 시뮬레이션 데이터와 Somer 등 (1984)에 의해 조사된 인도네시아 어린이 종단 데이터에 적용했다. 마코프 이항 회귀모형의 순서에 대해서 아는 경우와 모르는 경우를 각각 가정하여 최적의 모델을 알아보기 위해 MCMC 방법을 사용하였다. 또한, 매트로폴리스 해스팅 알고리즘의 수렴성을 점검하기 위해 Gelman과 Rubin의 진단을 이용했다.

Property of regression estimators in GEE models for ordinal responses

  • Lee, Hyun-Yung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.209-218
    • /
    • 2012
  • The method of generalized estimating equations (GEEs) provides consistent esti- mates of the regression parameters in a marginal regression model for longitudinal data, even when the working correlation model is misspecified (Liang and Zeger, 1986). In this paper we compare the estimators of parameters in GEE approach. We consider two aspects: coverage probabilites and efficiency. We adopted to ordinal responses th results derived from binary outcomes.

준모수적 방법을 이용한 랜덤 절편 로지스틱 모형 분석 (Semiparametric Approach to Logistic Model with Random Intercept)

  • 김미정
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1121-1131
    • /
    • 2015
  • 의학이나 사회과학에서 이진 데이터 분석 시 랜덤 절편(random intercept)을 갖는 로지스틱 모형이 유용하게 쓰이고 있다. 지금까지는 이러한 로지스틱 모형에서 랜덤 절편이 정규분포와 같은 모수 모형(parametric model)을 따른다는 가정과 설명변수와 랜덤 절편이 독립이라는 가정 하에 실행된 데이터 분석이 전반적이었다. 그러나 이러한 두 가지 가정은 다소 무리가 있다. 이 연구에서는 설명 변수와 랜덤 절편의 독립성을 가정하지 않고, 비모수 랜덤 절편을 따르는 로지스틱 모형의 방법론을 기존에 널리 쓰인 방법과 비교하여 설명하도록 한다. 케냐의 초등학생들의 영양 섭취 및 질병의 발병을 조사한 데이터에 이 방법을 적용하였다.

인구사회학적 요인 및 건강관련 특성에 따른 인지기능저하 관련 요인 연구 -고령화연구패널 조사 자료를 이용하여- (Factors Related to Cognitive Function Decline by Socio-demographic and Health-related Characteristics : Based on Korean Longitudinal Study of Ageing(KLoSA) Panel Data)

  • 김경나;이효영;김수정
    • 보건의료산업학회지
    • /
    • 제14권1호
    • /
    • pp.137-146
    • /
    • 2020
  • Objectives: The aim of this study was to investigate cognitive function decline by socio-demographic and health-related characteristics (health behaviors and health status) using 5th Korean Longitudinal Study of Aging panel data. Methods: The subjects were 4,440 community-dwelling people aged over 57 years. The data were analyzed with descriptive statistics, frequency analysis, χ2-test, and binary logistic regression analysis using SPSS ver. 25.0. Results: The findings revealed that socio-demographic characteristics (gender, age, area of residence, educational level, marital status, number of children, number of grand-children) and health-related characteristics (smoking, drinking, regular exercise, weight category by body mass index, hypertension and diabetes mellitus) were factors that influenced cognitive function decline (p<.05). Conclusions: Cognitive function decline was closely related to health behaviors and disease types. Future studies must examine related constructs to accurately determine these relationships among various populations. The present study could be used as a tool for the development and implementation of health promotion and prevention strategies.

영과잉 경시적 가산자료 분석을 위한 허들모형 (Hurdle Model for Longitudinal Zero-Inflated Count Data Analysis)

  • 진익태;이근백
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.923-932
    • /
    • 2014
  • 허들모형은 영이 과잉 가산자료를 분석하기 위해서 사용되어 왔다. 이 모형은 이산부분을 위한 로짓모형과 절삭된 가산부분을 위한 절삭된 포아송모형의 혼합모형이다. 이 논문에서 우리는 경시적 영과잉 가산자료를 분석하기 위해서 수정된 콜레스키 분해을 이용하여 일반적인 이분산성을 가지는 변량효과 공분산행렬을 제안한다. 수정된 콜레스키 분해는 변량효과 공분산행렬을 일반화자기상관 모수와 혁신분산모수로 분리되면, 이러한 모수들은 베이지안 일반화 선형모형을 통해 추정된다. 그리고 실제 자료분석을 통하여 설명한다.