• Title/Summary/Keyword: 경시적 자료

Search Result 104, Processing Time 0.022 seconds

경시적 영과잉 가산자료와 생존자료의 결합모형 (A joint modeling of longitudinal zero-inflated count data and time to event data)

  • 김동욱;천지훈
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1459-1473
    • /
    • 2016
  • 시간의 흐름에 따라 관측되는 경시적(longitudinal) 자료의 경우, 경시적 자료와 생존(survival) 자료가 종종 동시에 수집된다. 이 때 경시적 자료에서 발생하는 결측이 생존자료와의 연관성으로 인해 발생한 무시할 수 없는 결측(non-ignorable missing)이라면, 경시적 자료분석 방법만으로는 두 자료 간의 연관성을 고려하지 않아 독립변수에 대한 효과는 편향된 결과를 얻게 된다. 이러한 문제를 해결하기 위해서 결측의 원인이 생존시간과 연관되어 있으므로 생존모형을 고려하여 불편추정량을 얻기 위해 경시적 자료와 생존자료의 결합모형에 대한 연구가 이루어져 왔다. 본 논문은 경시적 자료의 형태가 영이 많이 존재하는 영과잉 가산자료(zero-inflated count data)와 생존자료의 결합모형을 연구하였다. 경시적 영과잉 가산자료와 생존자료는 각각 허들모형(hurdle model)과 비례위험모형(proportional hazards model)의 부 모형을 적용하였고, 두 부 모형들의 변량효과가 다변량 정규분포를 따른다는 가정을 통하여 결합하였다. 모수의 최우추정법으로 EM 알고리즘을 활용하였고, 추정된 표준오차를 계산하기 위해 프로파일 우도(profile likelihood)를 이용하였다. 최종적으로 모의실험을 통해 두 부 모형의 변량효과 간 상관관계가 존재하는 경우 결합모형이 개별적 모형보다 편의와 포함확률(coverage probability)의 측면에서 더 우수함을 보였다.

경시적 자료의 계층적 베이즈 분석

  • 김달호;신임희
    • Communications for Statistical Applications and Methods
    • /
    • 제5권2호
    • /
    • pp.431-437
    • /
    • 1998
  • 본 논문의 목적은 계층적 베이즈 일반화 선형모형을 이용하여 경시적 자료를 분석하는 것이다. 구체적으로 계층적 베이즈 변량효과 모형을 소개하고 무정보적 사전분포 하에서 사후분포가 진(proper)인지에 대한 충분조건을 찾는다 또한, 깁스(Gibbs) 표본자를 사용하여 제안된 계층적 베이즈 절차의 수행에 관해 논의한다. 현실자료를 사용하여 제안된 계층적 베이즈 분석을 예시하고, 이에 대응하는 경험적 베이즈 분석과 비교한다.

  • PDF

주변화 모형을 이용한 의료 패널 이진 데이터 분석 (Analysis of medical panel binary data using marginalized models)

  • 오채영;이근백
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.467-484
    • /
    • 2024
  • 경시적 자료는 같은 개체를 반복 측정함으로써 시간의 흐름에 따른 반복 측정된 자료들 간의 상관관계가 존재한다. 따라서 경시적 자료분석에서는 이 상관관계를 분석할 때 개체 내 상관관계와 개체 간 변동성 모두를 고려해야 한다. 본 논문에서는 경시적 이진 자료를 분석하기 위한 모형 중 공변량의 모집단 평균 효과의 추정을 위해 주변화 모형에 집중하고자 한다. 경시적 이진 자료분석을 위한 주변화 모형으로는 주변화 임의효과, 주변화 전이, 주변화 전이 임의효과 모형이 있으며, 본 논문에서 이들 모형을 먼저 고찰하고, 그리고 모형들의 성능을 비교하기 위해 결측치가 없는 자료와 결측치가 있는 자료로 나눠서 모의실험을 진행한다. 모의실험에서 자료에 결측치가 있는 경우에 자료가 생성된 모형에 따른 성능 차이가 있음을 확인하였다. 마지막으로 주변화 모형을 이용하여 한국의료패널자료를 분석한다. 한국의료패널자료는 반응변수로 주관적 불건강 응답을 이진변수로 고려하였고, 여러 설명변수를 가진 모형을 비교하고 가장 적합한 모형을 제시한다.

베이지안 다변량 선형 모형을 이용한 청소년 패널 데이터 분석 (KCYP data analysis using Bayesian multivariate linear model)

  • 이인선;이근백
    • 응용통계연구
    • /
    • 제35권6호
    • /
    • pp.703-724
    • /
    • 2022
  • 다변량 경시적 자료 분석은 반복 측정된 자료에 존재하는 상관관계를 올바르게 추정하면서 자료를 분석해야 한다. 경시적 연구에서는 다변량 경시적 자료가 주로 생성되지만, 기존 통계적 모형은 대부분 단변량으로 분석되어 다변량 경시적 자료에 존재하는 복잡한 상관관계를 제대로 설명하지 못하게 된다. 따라서 본 논문에서는 복잡한 상관관계를 설명하기 위해 공분산 행렬을 모형화하는 다양한 방법에 대해 고찰한다. 그 중 수정된 콜레스키 분해, 수정된 콜레스키 블록분해와 초구분해를 살펴본다. 그리고 일반화 자기회귀모수 행렬이 가지는 희박성 문제를 해결하기 위해 베이지안 방법을 이용하여 청소년 패널 데이터를 분석한다. 청소년 패널 데이터는 다변량 경시적 자료이며, 반응 변수로는 학교 적응도, 학업 성취도, 휴대전화 의존도를 고려한다. 자기 상관 구조와 혁신 표준 편차 구조를 달리 가정하여 여러 모형을 비교한다. 가장 적합한 모형에 대해 학교 적응도와 학업 성취도에 대해 모든 설명 변수가 유의미하며, 휴대전화 의존도가 반응 변수일 때 사교육 시간을 제외한 모든 설명 변수가 유의미한 것으로 나타난다.

결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형 (Joint model of longitudinal data with informative observation time and competing risk)

  • 김양진
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.113-122
    • /
    • 2016
  • 경시적 자료는 반복적으로 측정된 다변량 자료의 한 형태로 임상학, 보건학, 경제학에서 자주 발생된다. 시계열자료와 구분되는 가장 큰 특징은 표본수와 공변량 효과의 추정에 있다. 경시적 자료는 일반적으로 시계열 자료보다 더 큰 표본 개체로 이루어져 있으며 연구의 주 관심은 특정 공변량의 효과를 추정하는 데 있다. 또한 시계열 자료보다 반복 측정 횟수가 짧으며 개체마다 다른 관측 횟수와 다른 관측 중단 시점을 가질 수 있다. 본 연구에서는 관측 시점과 관측 종료 원인이 경시자료와 서로 연관된 경우에 결합 모형을 적용함으로써 이들간의 연관성을 분석하고자한다. 따라서 이들 변량간의 연관성을 모형화하기 위해 이변량 랜덤효과가 적용된다. 실제 자료 분석에서는 간경변증 환자의 핼액 응고 수치 시간을 관심 있는 경시적 자료로 환자가 병원 방문시점과 관측 중단원인들간의 상호 연관관계를 규명하고자 하였다. 특히, 중도 절단원인은 사망이나 간이식을 받는 사건일 때 발생하는데 본 연구에서는 사망 사건과의 연관성이 고려되었다. 결과를 통해 혈액 응고 시간이 길고 병원 방문 시점이 빈번할수록 사망할 가능성이 높음을 알수 있었다. 또한 혈액응고 시간이 길수록 병원 방문 횟수가 빈번하였다.

결합 다단계 일반화 선형모형을 이용한 다변량 경시적 자료 분석 (The Use of Joint Hierarchical Generalized Linear Models: Application to Multivariate Longitudinal Data)

  • 이동환;유재근
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.335-342
    • /
    • 2015
  • 경시적 자료는 각 환자마다 시간에 따라 반복 측정되는 코호트 연구 등에서 많이 쓰인다. 본 연구는 반응변수 간 상관성을 고려할 수 있는 결합 다단계 일반화 선형모형을 이용하여, 다변량 경시적 자료 분석을 수행하였다. 한국 유전체 역학 연구에서 실시한 코호트 자료를 적합하고 결과를 해석한다. 조건부 아카이케 정보 기준을 이용하여 모형 선택을 하고, 변량효과들의 추정치들을 설명한다.

소규모 경시적 마이크로어레이 실험의 통계적 분석 (Statistical Analysis of a Small Scale Time-Course Microarray Experiment)

  • 이근영;양상화;김병수
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.65-80
    • /
    • 2008
  • 소규모 경시적 마이크로어레이 실험이란 시점의 개수가 적은 경시적 마이크로어레이 실험으로서 현재까지 보고된 경시적 마이크로어레이 실험의 약 80%를 차지한다. 최근 들어 소규모 경시적 마이크로어레이 실험을 대상으로 하는 통계적 분석 방법이 몇 가지 제안되었다. 최근에 제안된 세 가지 방법들을 실제 소규모 경시적 마이크로어레이 실험자료에 적용하여 분석하고 모의실험 자료를 생성하여 각 방법들의 검정력과 위양성율을 비교해 보았다. 그 결과 낮은 위양성율을 보이는 STEM방법이 다른 방법에 비해서 우위에 있음이 드러났다.

다변량 경시적 자료 분석을 위한 공분산 행렬의 모형화 비교 연구 (Comparison study of modeling covariance matrix for multivariate longitudinal data)

  • 곽나영;이근백
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.281-296
    • /
    • 2020
  • 같은 개체로부터 반복 측정한 자료를 경시적 자료(longitudinal data)라고 한다. 이러한 자료를 분석하려면 흔히 사용되는 횡단 자료 분석과는 다른 분석 방법이 필요하다. 즉, 경시적 자료에서 공변량의 효과를 추정할 때에는 반복 측정된 결과 간의 상관성을 고려해야 하며, 따라서 공분산행렬을 모형화 하는 것이 매우 중요하다. 그러나 추정해야 할 모수가 많고, 추정된 공분산행렬이 양정치성을 만족해야 하므로 공분산 행렬의 모형화는 쉽지 않다. 특히 다변량 경시적 자료분석을 위한 공분산행렬의 모형화는 더욱더 심층적인 방법론을 사용해야 한다. 본 논문은 다변량 경시적 자료분석을 위한 공분산행렬을 모형화하기 위해 두 가지 방법론을 고찰한다. 두 방법 모두 수정된 콜레스키 분해(modified Cholesky decomposition)를 이용하여 시간에 따른 응답변수들의 상관관계를 설명하고 있다. 하지만 같은 시간에서 관측된 응답변수들간의 상관관계를 설명하는 방법이 다르다. 첫 번째 방법론에서는 향상된 선형 공분산 모형(enhanced linear covariance models)을 사용하여 공분산행렬이 양정치성을 만족하도록 한다. 두 번째 방법론에서는 분산-공분산 분해(variance-correlation decomposition)와 초구분해(hypersphere decomposition)을 이용하여 공분산 행렬을 모형화 한다. 이 두 방법론의 성능을 비교하고자 모의실험을 진행한다.

초등수학경시대회 문항분석을 통한 초등수학 영재교육 활성화 방안에 관한 연구

  • 김해규;김승진
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제16권
    • /
    • pp.345-365
    • /
    • 2003
  • 우리 나라 수학경시대회의 운영은 선발에 초점이 맞추어져 있어, 지속적인 교육 및 피드백이 결여되어 있고 단순히 경시대회성 기출문제만을 반복하여 출제하고 있는 실정이다. 그러므로 영재의 특성을 고려하고, 영재성을 키워주기 위해서는 무엇보다도 수학 창의적 문제해결력을 신장시켜줄 수 있는 학습 자료의 개발이 시급하다. 따라서 본 논문에서는 초등수학경시대회 기출문제와 시중에 출판되어 있는 경시대회 준비를 위한 학습자료를 분석하여, 일선 초등학교 현장에서 실시되고 있는 영재교육을 활성화시킬 수 있는 방안을 연구하는 데 목적이 있다.

  • PDF

가우시안 코플라를 이용한 반복측정 이변량 자료의 조건부 결합 분포 추정 (Estimation of the joint conditional distribution for repeatedly measured bivariate cholesterol data using Gaussian copula)

  • 곽민정
    • 응용통계연구
    • /
    • 제30권2호
    • /
    • pp.203-213
    • /
    • 2017
  • 우리는 이변량 경시적 자료의 조건부 결합 분포를 추정하기 위하여 회귀 모형과 코플라 모형을 연구하였다. 주변 분포의 추정을 위하여 시변 변환 모형을 고려하였고, 이변량 반응변수 각각에 대한 주변 분포를 가우시안 코플라를 이용하여 결합하여 조건부 결합 분포를 추정하였다. 우리가 제안한 모형은 조건부 평균 모형만으로 자료를 설명하기 어려운 경우에 적용될 수 있다. 시변 변환 모형과 가우시안 코플라 모형을 결합한 본 논문의 방법은 반복 측정된 이변량 경시적 자료에 대한 모형화가 용이하며 해석하기 쉬운 장점이 있다. 우리는 본 논문의 방법을 반복 측정된 이변량 콜레스테롤 자료를 분석하는데 적용하여 보았다.