• Title/Summary/Keyword: 결측

Search Result 428, Processing Time 0.024 seconds

결측치를 가진 목표지향형 평가모델에서 수학학습능력의 평가에 관한 연구

  • 홍석강
    • The Mathematical Education
    • /
    • v.33 no.2
    • /
    • pp.167-175
    • /
    • 1994
  • 결측치를 가진 회귀모형의 모수 추정법을 이용하여 목표지향형 평가 모델에서 기초고사(X)와 신고사(I)(Y), 신고사(II)(Z)등 두 개 이상의 고사지로 이루어진 고사집에서 기초고사에는 결측치가 없고 신고사(I), 신고사(II)등에는 결측치가 있는 경우 모수의 최우추정량 계산법을 논하고 E.M. 알고리즘과 평가치는 희귀방적식화에 의하여 우리나라 중등학교 학생의 수학학습능력과 수학적 사고력의 크기를 변별하며 학생들의 진능력이 반영된 평가모델과 최종 성적을 평가 할 수 있는 계산법을 제시하였다.

  • PDF

Analysis of Missing Data Using an Empirical Bayesian Method (경험적 베이지안 방법을 이용한 결측자료 연구)

  • Yoon, Yong Hwa;Choi, Boseung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.1003-1016
    • /
    • 2014
  • Proper missing data imputation is an important procedure to obtain superior results for data analysis based on survey data. This paper deals with both a model based imputation method and model estimation method. We utilized a Bayesian method to solve a boundary solution problem in which we applied a maximum likelihood estimation method. We also deal with a missing mechanism model selection problem using forecasting results and a comparison between model accuracies. We utilized MWPE(modified within precinct error) (Bautista et al., 2007) to measure prediction correctness. We applied proposed ML and Bayesian methods to the Korean presidential election exit poll data of 2012. Based on the analysis, the results under the missing at random mechanism showed superior prediction results than under the missing not at random mechanism.

Modelling Missing Traffic Volume Data using Circular Probability Distribution (순환확률분포를 이용한 교통량 결측자료 보정 모형)

  • Kim, Hyeon-Seok;Im, Gang-Won;Lee, Yeong-In;Nam, Du-Hui
    • Journal of Korean Society of Transportation
    • /
    • v.25 no.4
    • /
    • pp.109-121
    • /
    • 2007
  • In this study, an imputation model using circular probability distribution was developed in order to overcome problems of missing data from a traffic survey. The existing ad-hoc or heuristic, model-based and algorithm-based imputation techniques were reviewed through previous studies, and then their limitations for imputing missing traffic volume data were revealed. The statistical computing language 'R' was employed for model construction, and a mixture of von Mises probability distribution, which is classified as symmetric, and unimodal circular probability were finally fitted on the basis of traffic volume data at survey stations in urban and rural areas, respectively. The circular probability distribution model largely proved to outperform a dummy variable regression model in regards to various evaluation conditions. It turned out that circular probability distribution models depict circularity of hourly volumes well and are very cost-effective and robust to changes in missing mechanisms.

Imputation Method using the Space-Time Model in Sample Survey (공간-시계열 모형을 이용한 결측대체 방법에 대한 연구)

  • Lee, Jin-Hee;Shin, Key-Il
    • The Korean Journal of Applied Statistics
    • /
    • v.20 no.3
    • /
    • pp.499-514
    • /
    • 2007
  • It is a common practice to use the auxiliary variables to impute missing values from item nonresponse in surveys. Sometimes there are few auxiliary variables for missing value imputation, but if spatial and time autocorrelations exist, we should use these correlations for better results. Recently, Lee et al. (2006) showed that spatial autocorrelation could be efficiently used for missing value imputation when spatial autocorrelation existed, using the data from the farm household economy data in Gangwon-do, 2002. In this paper, we present au evaluation of spatial and space-time nonresponse imputation methods when there exist spatial and time autocorrelations using the monthly data during 2000-2002 from the same data previously used by Lee et al. (2006). We show that space-time imputation method is more efficient than the other through the numerical simulations.

A Study on estimation of IRDIMS Missing Data Using HEC-RAS Modeling (HEC-RAS 모의결과를 활용한 연속유량 자료 보완 방법에 관한 연구)

  • OH, Dong Heon;Cho, Sang UK;Roh, Young Sin;Jung, Sung Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.263-263
    • /
    • 2019
  • 자동유량측정시설은 하천 유량을 실시간으로 측정하기 위한 수문조사시설로써, 기존 수위-유량관계곡선식으로는 유량산정이 어려운 배수 및 조위영향 구간에서 양질의 유량자료를 확보할 수 있다. 하지만 자동유량측정시설의 경우 시설물 고장 등으로 인해 자료의 결측이 발생할 수 있으며, 단기간 발생한 결측자료는 수문자료품질관리를 통해 보완이 가능하지만 장기간 결측이 발생한 경우 보완방법이 없는 실정이다. 본 연구에서는 남한강 유역의 여주시(남한강교)~양평군(양평교) 구간 중 장기간 결측이 발생한 여주보(하류) 지점과 이포보(상류) 지점의 2013년 평수기(3월)와 홍수기(7월) 기간을 선정하여 HEC-RAS 모형을 통해 결측자료의 보완 가능 여부를 검토하였다. HEC-RAS 모의결과 여주보(하류) 지점의 경우 실시간 유량자료와 상대오차는 평저수기(3월), 홍수기(7월) 각각 0.7%와 5.0% 나타났으며, 이포보(상류) 지점은 각각 5.0%와 6.0%로 나타나 장기간 결측 발생시 HEC-RAS 모형을 통해 결측자료 보완이 가능한 것으로 나타났으며, 결측 발생기간에 적용한 결과, 여주보(하류) 지점과 이포보(상류) 지점에서 측정된 검보정 측정성과와 상대오차는 각각 4.0%, 6.0%로 나타나 결측자료 보완이 잘 이루어진 것으로 나타났다. 따라서 남한강 유역의 여주시(남한강교)~양평군(양평교) 구간과 같이 배수영향을 받는 지점에 경우 장기간 결측 발생 시 검증된 지점에 한하여 HEC-RAS 모형과 같은 수치모형을 통해 자료를 보완하는 것이 적절하다고 판단된다. 또한, 이 방법을 통해 현재 보 개방에 따라 유량측정이 어려운 자동유량측정시설의 자료보완 방법으로 일부 적용이 가능할 것으로 판단된다.

  • PDF

Long-gap Filling Method for the Coastal Monitoring Data (해양모니터링 자료의 장기결측 보충 기법)

  • Cho, Hong-Yeon;Lee, Gi-Seop;Lee, Uk-Jae
    • Journal of Korean Society of Coastal and Ocean Engineers
    • /
    • v.33 no.6
    • /
    • pp.333-344
    • /
    • 2021
  • Technique for the long-gap filling that occur frequently in ocean monitoring data is developed. The method estimates the unknown values of the long-gap by the summation of the estimated trend and selected residual components of the given missing intervals. The method was used to impute the data of the long-term missing interval of about 1 month, such as temperature and water temperature of the Ulleungdo ocean buoy data. The imputed data showed differences depending on the monitoring parameters, but it was found that the variation pattern was appropriately reproduced. Although this method causes bias and variance errors due to trend and residual components estimation, it was found that the bias error of statistical measure estimation due to long-term missing is greatly reduced. The mean, and the 90% confidence intervals of the gap-filling model's RMS errors are 0.93 and 0.35~1.95, respectively.

A Study on Replacement of Missing Data using Z (Z 값을 활용한 결측치 대체에 관한 연구)

  • Park, Seung-Hyeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.47-48
    • /
    • 2020
  • 데이터에 결측치가 존재할 때 어떤 데이터로 결측치를 대체시켜야 원래의 데이터에 가장 근접한 데이터를 만들어낼 수 있는지에 관한 연구. Z 값을 사용하면 평균으로 결측치를 대체시키는 것보다 더 정확한 결과를 도출해낼 수 있다.

An EM Algorithm-Based Approach for Imputation of Pixel Values in Color Image (색조영상에서 랜덤결측화소값 대체를 위한 EM 알고리즘 기반 기법)

  • Kim, Seung-Gu
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.2
    • /
    • pp.305-315
    • /
    • 2010
  • In this paper, a frequentistic approach to impute the values of R, G, B-components in random missing pixels of color image is provided. Under assumption that the given image is a realization of Gaussian Markov random field, its model is designed such that each neighbor pixel values for a given pixel follows (independently) the normal distribution with covariance matrix scaled by an evaluates of the similarity between two pixel values, so that the imputation is not to be affected by the neighbors with different color. An approximate EM-based algorithm maximizing the underlying likelihood is implemented to estimate the parameters and to impute the missing pixel values. Some experiments are presented to show its effectiveness through performance comparison with a popular interpolation method.

Implementation of Quality Evaluation, Error Filtering, Imputation for Traffic Missing Data (교통 데이터에 대한 품질 평가 및 자료 처리 기법의 구현)

  • Cheong, Su-Jeong;Song, Soo-Kyung;Lee, Min-Soo;NamGung, Sung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.185-190
    • /
    • 2007
  • 대용량의 자료가 생산됨에 따라 데이터를 효율적으로 저장, 관리, 이용할 수 있는 데이터 웨어하우스의 역할이 중요하게 되었고, 그에 따라 자료 처리 기법의 개발은 필수 과제가 되었다. 품질 평가와 오류 판단, 결측 보정의 자료 처리 과점은 자료의 신뢰도를 판단하고 활용도를 높일 수 있는 과정으로 매우 중요하다. 본 논문에서는 우리나라의 실제 교통상황을 반영하고 평가 기준의 오차를 줄이면서 더욱 간단 명료한 평가 계산식을 도입하여 효율적인 품질평가와 오류판단, 결측 보정의 자료 처리 기법을 제안한다. 또한 오류 판단 기준에 새로운 파라미터론 도입하여 교통 연구자의 요구 사항을 반영할 수 있게 하였다. 결측 보정 과정은 여러 기법을 연구하고 기존의 결측 보정 기법에 입력 변수를 추가하여 실제 대용량의 교통 자료에 적용하였다. 그리고 교통 자료가 저장되는 데이터베이스에 직접 접근하여 결측 보정과정을 수행하도록 PL/SQL로 구현하였으며, 이를 통해 교통 연구자에게 쉽고 다양한 방법으로 결측 보정을 수행하고 그 결과를 이용하여 다양한 교통 정보를 가공할 수 있는 환경을 제공하였다.

  • PDF

Comparison of GEE Estimation Methods for Repeated Binary Data with Time-Varying Covariates on Different Missing Mechanisms (시간-종속적 공변량이 포함된 이분형 반복측정자료의 GEE를 이용한 분석에서 결측 체계에 따른 회귀계수 추정방법 비교)

  • Park, Boram;Jung, Inkyung
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.5
    • /
    • pp.697-712
    • /
    • 2013
  • When analyzing repeated binary data, the generalized estimating equations(GEE) approach produces consistent estimates for regression parameters even if an incorrect working correlation matrix is used. However, time-varying covariates experience larger changes in coefficients than time-invariant covariates across various working correlation structures for finite samples. In addition, the GEE approach may give biased estimates under missing at random(MAR). Weighted estimating equations and multiple imputation methods have been proposed to reduce biases in parameter estimates under MAR. This article studies if the two methods produce robust estimates across various working correlation structures for longitudinal binary data with time-varying covariates under different missing mechanisms. Through simulation, we observe that time-varying covariates have greater differences in parameter estimates across different working correlation structures than time-invariant covariates. The multiple imputation method produces more robust estimates under any working correlation structure and smaller biases compared to the other two methods.