• Title/Summary/Keyword: 대체자료

Search Result 2,106, Processing Time 0.027 seconds

Comparison of imputation methods for item nonresponses in a panel study (패널자료에서의 항목무응답 대체 방법 비교)

  • Lee, Hyejung;Song, Juwon
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.3
    • /
    • pp.377-390
    • /
    • 2017
  • When conducting a survey, item nonresponse occurs if the respondent does not respond to some items. Since analysis based only on completely observed data may cause biased results, imputation is often conducted to analyze data in its complete form. The panel study is a survey method that examines changes of responses over time. In panel studies, there has been a preference for using information from response values of previous waves when the imputation of item nonresponses is performed; however, limited research has been conducted to support this preference. Therefore, this study compares the performance of imputation methods according to whether or not information from previous waves is utilized in the panel study. Among imputation methods that utilize information from previous responses, we consider ratio imputation, imputation based on the linear mixed model, and imputation based on the Bayesian linear mixed model approach. We compare the results from these methods against the results of methods that do not use information from previous responses, such as mean imputation and hot deck imputation. Simulation results show that imputation based on the Bayesian linear mixed model performs best and yields small biases and high coverage rates of the 95% confidence interval even at higher nonresponse rates.

An Imputation for Nonresponses in the Survey on the Rural Living Indicators (농촌생활지표조사에서 무응답 대체 : 사례)

  • Cho, Young-Sook;Chun, Young-Min;Hwang, Dae-Yong
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.1
    • /
    • pp.95-107
    • /
    • 2008
  • Survey on the rural living indicators was the statistic approved from National Statistical Office and the survey executed by rural resources development institute. This study was used the raw data of survey on the rural living indicators in 2005. After editing procedure for raw data, we were studied 1,582 households which is acquired through elimination of case included nonresponses, and imputed a nonresponses of 15 item selected from 146 item. The imputation methods and efficiency of imputation for simulation was adapted differently from type of data. For continuous data, we imputed the nonresponses with mean imputation, regression imputation, adjusted grey-based k-NN imputation(DU, DW, WU, WW) and compared the results with RMSE. For categorical data, we imputed the nonresponses with mode method, probability imputation, conditional mode method, conditional probability method, hot-deck imputation, and compared the results with Accuracy. By the results, regression imputation and adjusted grey-based k-NN imputation appropriated for continuous data and hot-deck imputation appropriated for categorical data.

A Study on the Support System of Alternative Materials for College Students with Visual Impairment (시각장애대학생을 위한 대체자료 지원체계에 관한 연구)

  • Suh, Hye-Ran;Kang, Eun-Yeong
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.26 no.4
    • /
    • pp.5-30
    • /
    • 2015
  • The attention to higher education of individuals with disabilities has been increased. But, there is no concern for successful university life of students with visual impairment. The purpose of this study is to propose systematic learning-support systems for enhancing the rights of college students with visual impairment in accessing and using library materials. To accomplish the purpose of this study, the current states of alternative material system for those with visual impairment and use behavior of college students with visual impairment in Korea were analyzed. This study concluded with the following strategies for constructing the systematic support system for the alternative materials for college students with visual impairment: 1) improvement of The National Library for Individuals with Disabilities' function; 2) empowerment of service center for student with disabilities in University through strengthening network; 3) technical and systematic improvement for copyright protection.

Development of data assimilation technique using a surrogate model (대체모형을 이용한 자료동화기법 개발)

  • Kim, Jongho;Tran, Vinh Ngoc
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.381-381
    • /
    • 2020
  • 자료동화(Data Assimilation) 기법은 실시간 수문학적 예측에 있어 정확도 향상을 위해 필수적인 과정이다. 가장 대중적으로 사용되는 기법들 중 하나가 모델 상태변수와 매개변수를 동시에 업데이트할 수 있는 이중 앙상블 칼만 필터(Dual Ensemble Kalman Filter)이다. 이 방법은 정확도 개선 및 적용의 용이성 때문에 많은 연구 분야에서 사용되어져 왔지만, 앙상블을 생성하는 과정에서 상당시간이 소요되는 단점이 존재한다. 본 연구에서는 상태변수와 매개변수를 동시에 업데이트 하면서 홍수 예측의 정확성을 보장할 뿐만 아니라, 앙상블 생성에 있어 계산 효율을 크게 향상시킬 수 있는 기법을 제안한다. Polynomial Chaos Expansion(PCE) 기법을 사용하여 앙상블 칼만 필터를 모방(mimic)할 수 있는 새로운 대체필터(Surrogate Filter)를 개발하는 것을 목표로 한다. 구체적으로 대체필터를 구성하기 위한 다양한 필터를 설계하였다. 첫째 시간에 대해서 PCE가 변화하지 않는 '불변 필터'(즉, 전체 예측기간에 대해 하나의 필터를 사용하여 자료동화할 수 있는 대체필터)와, 매 시간마다 PCE가 변화하는 '시변 필터'(즉, 예측하는 매 시간마다 새로운 필터를 생성해야 하는 대체필터)를 설계하여 적용성, 정확성, 예측성 등을 비교하였다. 또한, PCE의 하이퍼 매개변수를 최적화하기 위한 최적의 프레임 워크가 제안되어, 대체필터를 구축하는 데 효율을 높이고 PCE의 과적합(overfitting) 현상을 피할 수 있도록 하였다. 본 연구에서 제안된 기법은 기존 단일 및 이중 앙상블 칼만 필터(EnKF)의 결과와 비교 검증하였으며, 그 결과는 다음과 같다. (1) 대체필터의 대부분은 원래 EnKF와 비슷한 정도의 불확실성을 설명할 수 있음; (2) 모든 대체 필터는 선행시간이 짧은 경우의 예측에 있어 우수한 결과를 제공하며, 시변 필터가 불변 필터보다 더 정확한 예측 결과를 제공함; (3) 대체필터는 원래 앙상블 칼만필터보다 최대 500배 빠른 속도로 성능을 향상시킬 수 있음. 제안된 대체필터는 자료동화를 수행하는 기존필터와 비슷한 정도의 정확성, 매우 향상된 효율성을 보장함을 확인할 수 있었다.

  • PDF

A comparison of imputation methods using nonlinear models (비선형 모델을 이용한 결측 대체 방법 비교)

  • Kim, Hyein;Song, Juwon
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.4
    • /
    • pp.543-559
    • /
    • 2019
  • Data often include missing values due to various reasons. If the missing data mechanism is not MCAR, analysis based on fully observed cases may an estimation cause bias and decrease the precision of the estimate since partially observed cases are excluded. Especially when data include many variables, missing values cause more serious problems. Many imputation techniques are suggested to overcome this difficulty. However, imputation methods using parametric models may not fit well with real data which do not satisfy model assumptions. In this study, we review imputation methods using nonlinear models such as kernel, resampling, and spline methods which are robust on model assumptions. In addition, we suggest utilizing imputation classes to improve imputation accuracy or adding random errors to correctly estimate the variance of the estimates in nonlinear imputation models. Performances of imputation methods using nonlinear models are compared under various simulated data settings. Simulation results indicate that the performances of imputation methods are different as data settings change. However, imputation based on the kernel regression or the penalized spline performs better in most situations. Utilizing imputation classes or adding random errors improves the performance of imputation methods using nonlinear models.

Comparison of GEE Estimators Using Imputation Methods (대체방법별 GEE추정량 비교)

  • 김동욱;노영화
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.2
    • /
    • pp.407-426
    • /
    • 2003
  • We consider the missing covariates problem in generalized estimating equations(GEE) model. If the covariate is partially missing, GEE can not be calculated. In this paper, we study the performance of 7 imputation methods to handle missing covariates in GEE models, and the properties of GEE estimators are investigated after missing covariates are imputed for ordinal data of repeated measurements. The 7 imputation methods include i) Naive Deletion ii) Sample Average Imputation iii) Row Average Imputation iv) Cross-wave Regression Imputation v) Carry-over Imputation vi) Bayesian Bootstrap vii) Approximate Bayesian Bootstrap. A Monte-Carlo simulation is used to compare the performance of these methods. For the missing mechanism generating the missing data, we assume ignorable nonresponse. Furthermore, we generate missing covariates with or without considering wave nonresp onse patterns.

A Comparison of BLS Non-Response Adjustment and Cross-Wave Regression Imputation Methods (BLS 무응답 보정법을 이용한 대체법과 이월대체법에 관한 연구)

  • Lee, Sang-Eun;Shin, Key-Il
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.909-921
    • /
    • 2010
  • Cross-wave regression imputation and carry-over imputation method are generally used in the analysis of panel data with missing values. Recently it is known that the BLS non-response adjust method has good statistical properties. In this paper we show that the BLS method can be considered as an imputation method with a similar formula of a ratio-estimator. In addition, we show that the carry-over imputation and BLS imputation are approximately the same under the assumption that data follow a non-stationary process with drift. Small simulation studies and real data analysis are performed. For the real data analysis, a monthly labor statistic (2007) is used.

Comparision of Missing Imputaion Methods In fine dust data (미세먼지 자료에서의 결측치 대체 방법 비교)

  • Kim, YeonJin;Park, HeonJin
    • The Journal of Bigdata
    • /
    • v.4 no.2
    • /
    • pp.105-114
    • /
    • 2019
  • Missing value replacement is one of the big issues in data analysis. If you ignore the occurrence of the missing value and proceed with the analysis, a bias can occur and give incorrect results for the estimate. In this paper, we need to find and apply an appropriate alternative to missing data from weather data. Through this, we attempted to clarify and compare the simulations for various situations using existing methods such as MICE and MissForest based on R and time series-based models. When comparing these results with each variable, it was determined that the kalman filter of the auto arima model using the ImputeTS package and the MissForest model gave good results in the weather data.

  • PDF

Case Study : Hydrological Function Evaluation of Replacement Wetlands in the River (하천에 대한 대체습지의 수문학적 평가)

  • Choi, Youngjoo;Kim, Jungwook;Hong, Seungjin;Kim, Jaegeun;Kim, Hungsoo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.172-172
    • /
    • 2016
  • 지난 2008년부터 2013년까지 우리나라는 홍수방어 및 가뭄을 대비하기 위하여 하천정비사업인 4대강 사업을 실시하였다. 또한, 4대강 사업은 환경적인 측면을 고려하기 위해 하천변에 대체습지를 조성하였다. 하지만, 대체습지 조성 이후 대체습지에 대한 평가가 제대로 이루어지지 않아 관리하는데 있어 문제가 발생하고 있다. 따라서 대체습지에 대해 기능을 평가하고 평가 결과를 통해 관리방안을 수립하는 것이 필요하다. 현재 습지의 기능은 수문학적, 생태학적, 지형학적으로 구분하여 평가하고 있다. 본 연구에서는 대체습지의 수문학적 평가를 위해 필요한 대체습지 제원 및 수리수문요소 등 관련자료를 수집하였다. 빈도해석과 수문모형을 통해 침수빈도, 침수심 등을 분석하여 수문학적 측면으로 대체습지를 평가하였다. 본 연구의 결과는 4대강 사업으로 조성된 대체습지의 관리방안을 수립하는데 기초자료로 활용될 것으로 기대된다.

  • PDF

A Development & Evaluation of Magnetometer Detector Algorithm (자기검지기 알고리즘 개발 및 평가)

  • 이철기;오영태
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.3
    • /
    • pp.101-111
    • /
    • 1998
  • 현재 고속도로 교통관리시스템(FTMS)에 사용되고 있는 차량 검지기는 주로 루프 식 검지기가 이용되고 있으나, 유지관리에 많은 어려움이 있다. 본 연구에서는 이러한 문제 점을 갖고 있는 루프 검지기를 대체하기 위한 대체 검지기를 개발하는데 그 목적이 있다. 자기 검지기 신뢰도 평가는 현장 실험으로 이루어지며 비디오 촬영 및 루프 검지기, test car를 이용하여 교통량·속도·점유율의 기준자료를 마련하고 자기 검지기 자료와 비교·분석 및 통계적 검정을 실시하였다. 1차 실험과 2차 실험의 결과, 교통량과 속도는 실측자료와 유사했으나 점유율은 실측치와 다소 차이가 발생함을 보였다. 향후 점유율에 대한 보정이 이루어진다면 현재 사용중인 루프 검지기를 대체할 수 있을 것으로 기대된다.

  • PDF