• 제목/요약/키워드: 완전임의결측

검색결과 7건 처리시간 0.019초

패널자료의 종단적 결측패턴에 관한 실증분석 연구

  • 손창균
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2011년도 추계학술대회 발표논문집
    • /
    • pp.273-285
    • /
    • 2011
  • 본 논문에서는 패널조사와 같은 종단면 연구에서 시간의 흐름에 따라 패널의 노후화 등의 원인으로 각 조사주기별로 발생하는 무응답(결측)에 대해 특정한 패널집단을 대상으로 무응답 패턴을 통계모형을 이용하여 분석하였다. 이러한 무응답 패턴분석을 기반으로 결측자료가 존재하는 종단자료의 분석에서 적절한 방법을 선택하여 분석을 수행할수 있으며, 만일 무응답 대체가 필요한 경우 적절한 대체 방법을 결정할 수 있을 것이다. 횡단면 조사와는 달리 이용가능한 보조정보가 각 웨이브별로 다양하게 존재하며, 이와 같은 보조정보를 무응답 대체에 활용할수 있다면, 결측자료가 존재하는 패널 자료에 비해 전통적인 통계분석 방법을 적용하여 표준적인 결과를 산출할 수 있을 것으로 기대된다.

  • PDF

시간-종속적 공변량이 포함된 이분형 반복측정자료의 GEE를 이용한 분석에서 결측 체계에 따른 회귀계수 추정방법 비교 (Comparison of GEE Estimation Methods for Repeated Binary Data with Time-Varying Covariates on Different Missing Mechanisms)

  • 박보람;정인경
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.697-712
    • /
    • 2013
  • 다시점 자료 연구에서 일반화추정방정식은 가상관행렬을 잘못 가정하더라도 모수의 일치추정량을 도출하므로 많이 이용된다. 하지만, 결측 체계가 완전임의결측이 아닌 경우에는 편의추정량을 제공하고, 시간-종속적 공변량이 포함된 경우에는 가상관행렬에 따라 회귀계수 추정값이 다르게 도출될 수 있는 문제점이 있다. 결측 체계가 임의결측인 경우에 발생하는 문제를 해결하기 위해 가중 방법과 다중대체 방법을 사용하는 것이 제안되었다. 본 논문에서는 시간-종속적 공변량이 포함된 이분형 반복측정자료를 GEE를 이용하여 분석할 때 다양한 결측 체계에서 일반화추정방정식 방법, 가중 방법, 다중대체 방법의 회귀계수 추정에 대한 로버스트성과 정확성을 모의실험을 통하여 비교해 보았다. 세 가지 방법 모두에서 시간-종속적 공변량의 회귀계수가 시간-독립적 공변량의 회귀계수에 비해 가상관행렬에 따라 추정값의 차이가 크게 나타났다. 다른 두 방법에 비해 다중대체 방법이 가상관행렬의 형태에 대해 더 로버스트하고 편의도 작은 추정치를 도출하였다.

대체방법별 GEE추정량 비교 (Comparison of GEE Estimators Using Imputation Methods)

  • 김동욱;노영화
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.407-426
    • /
    • 2003
  • 본 연구에서는 범주형 반복측정자료의 일반화추정방정식(GEE)모형에서 결측이 발생할 경우 결측값 대체(imputation)방법들에 대한 성능을 비교하고자 한다. 설명변수 X가 부분적으로 결측을 갖는 경우 GEE추정량을 계산할 수 없다. 본 논문에서는 시점에 따라 값이 변하는 설명변수에 결측이 있는 경우 GEE모형에서 결측값을 추정하는 7가지의 대체방법을 다루며, 실제자료와 모의실험을 통하여 대체방법별 GEE추정량의 성질을 연구한다. 대체방법별 GEE추정량의 성능을 비교하기 위해 우리는 반응변수가 범주형인 반복측정모형에서 완전자료의 GEE추정량과 완전자료에서 결측을 생성하여 결측값에 각 대체방법을 적용하여 대체한 후 구한 GEE추정량을 비교한다. 대체방법으로는 (1) 단순삭제 (2) 표본 평균대체 (3) 행 평균대체 (4) 횡 시점 회귀대체 (5) 이월대체 (6) 베이지안 붓스트랩 (7) 근사적 베이지안 붓스트랩에 대해서 살펴본다. 결측과정(missing mechanism)은 무시할 수 있는 무응답(ignorable nonresponse)을 가정하며, 결측 발생에 대해서는 원자료의 시점 무응답 패턴(wave nonresponse pattern)을 고려하여 발생시키거나 또는 시점 무응답 패턴을 고려하지 않고 단순임의추출로 결측을 발생시키는 방법을 각각 고려한다.

임의의 불완전 순위자료 분석을 위한 비모수적 방법 (Nonparametric Approaches of Analyzing Randomly Incomplete Ranking Data)

  • 임동훈
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.45-53
    • /
    • 2000
  • 본 논문에서는 모든 판정자(judge)들이 모든 객체(object)들에 대해 순위를 부여할 수 없는 경우에 얻어지는 불완전 순위자료에서 판정자들의 처리 효과에 대한 유의성을 검정하는데 관심이 있다. 이를 위해 불완전 순위자료를 완전자료로 바꾸는 알고리즘을 제안하고 알고리즘에 의해 얻어진 완전 순위자료에 Friedman 검정법을 적용하고자 한다. 제안된 검정법은 결측 객체에 순위를 부여하는데 있어서 완전순위를 갖는 판정자들의 정보를 이용함으로서 효율적이며 검정을 시행하는데 기존의 Friedman 통계량에 대한 분포표를 사용할 수 있어 간편하다. 그리고 몬테칼로 모의실험을 통하여 제안된 검정법과 기존의 평균 순위법, 최대/최소 Friedman 검정법과 검정력을 비교하였다.

  • PDF

결측이 있는 이산형 공변량에 대한 Cox비례위험모형의 패턴-혼합 모델 (Pattern-Mixture Model of the Cox Proportional Hazards Model with Missing Binary Covariates)

  • 육태미;송주원
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.279-291
    • /
    • 2012
  • 공변량에 결측이 발생한 Cox 비례위험 모형을 적합할 때, 결측이 발생하는 개체를 모두 제거한 후 분석을 실시한다면 정보 손실에 의해 비효율적이고 결측의 발생 메커니즘이 완전 임의 결측(missing completely at random; MCAR)이 아니라면 모수의 추정값에 편향이 발생할 수 있다. Cox 비례위험 회귀모형의 공변량에 결측이 있는 경우 적용할 수 있는 여러 가지 방법들이 제안되어져 왔으나 이 분석들은 선택모델(selection model)에 기반하고 있다. 본 연구에서는 Little (1993)이 제안한 패턴-혼합 모델(pattern-mixture model)을 사용하여 Cox 비례위험 회귀모형에서 생존시간과 결측 메커니즘의 결합분포를 모델화 하고, 여러 가지 제약에 근거한 생존 분석의 결과를 비교하였다. 모의실험을 통해서 패턴-혼합 모델의 제약(restrictions)에 따른 모수 추정의 민감도를 확인하였고 결측을 무시한 채 분석한 결과 및 선택모형에 근거한 분석결과와 비교하였다. 패턴-혼합 모델의 제약에 따라 공변량의 결측으로 인한 모수 추정의 민감성 정도를 쥐백혈병 자료 예제를 통해 설명하였다.

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

수문관측자료 운영 개선방안에 대한 연구 II (Suggestions on the Improvement of the Hydrological Data Operation II)

  • 김휘린;조효섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.879-882
    • /
    • 2007
  • 수문관측자료 운영 개선방안에 대한 연구(2006, 김휘린, 조효섭)에서 건설교통부 한강홍수통제소에서 수행하고 있는 수문관측자료를 대상으로 하여 관측, 기록, 전송, 품질관리, DB구축 및 정보화의 5단계로 임의 분류하고 각 단계별 현황을 파악하여 문제점을 검토하고 개선방안을 제안하였다. 이는 적극적으로 수용되어 수문관측자료 운영에 대해 개선을 시도하였으며 본 논문에서는 이를 간략히 소개하고자한다. 첫째, 관측소 점검 대장이 조사과와 전기통신과로 이분화되어 있고 각 관측소별로 점검대장이 비치되어 있으나 이를 수기로 작성하고 있으며 자료의 업데이트 및 과거점검대장의 DB 구축과 비전산화를 지적한 바 있다. 이에 '물관련시스템 DB연계 사업'을 통해 수기로 작성된 관측시설 점검대장을 전부 DB로 구축하였고 이를 총괄하여 관리 및 점검사항을 업데이트할 수 있는 관측시설 점검대장 관리 및 입력 프로그램을 구축하였고 현재 한강홍수통제소에서 시험 운영 중에 있다. 향후 보완이 끝난 후에는 낙동강, 금강, 영산강 홍수통제소에도 확대 설치 및 운영을 실시할 예정이다. 둘째, 수문자료의 품질관리에 있어서 전산시스템에 의한 완전 자동화는 실현하기가 어려울 뿐 아니라 바람직하지 못한 결과를 가져올 수 있으므로 담당자의 수동 검토 및 처리과정은 필수적이라고 논한 바 있다. 그 후 수문자료품질관리T/F팀(조사과, 전기통신과, 하천정보센터)이 구성되었고, 홍수기 오 결측자료 발생 확인, 긴급대응 촉구, 이상치 발생원인 추정 및 대책 마련 등 고품질 수문자료를 생성하기 위해 노력하였다. T/F팀 활동사항은 타홍수통제소에서도 벤치마킹이 되고 있다. 보다 정확한 댐운영자료 공유방안을 위한 관련기관과의 협력회의가 개최되어 품질관리된 자료의 정보 공유시기, 공유방식, 자료형태 등이 결정되었다. 이는 유관기관간 품질관리된 댐운영자료의 효율적인 정보 공유체계 확립을 위한 체계를 마련하는 계기라고 사료된다. 또한, 유량측정사업 결과를 익년에 반영하는 기존 방식을 개선하기 위해 유량자료관리및분석시스템(프론티어사업에서 수행, 한국건설기술연구원 개발)을 통제소내에 설치 운영을 추진하고 있다.

  • PDF