• 제목/요약/키워드: 결측

검색결과 428건 처리시간 0.028초

반복비율적합에 의한 다차원 분할표의 결측칸값 추정 (Estimating Missing Cells in Contingency Table with IPE)

  • 최현집;신상준
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.197-206
    • /
    • 2000
  • 반복비율적합 방법을 확장하여 준독립성모형하에서 불완전한 다차원 분할표에 포함된 결측칸의 최우추정값을 얻기 위한 추정방법을 제안하였다. 제안된 방법은 주변합이 영이 아닌 모든 불완전한 분할표에 적용할 수 있으며 주어진 준로그선형모형의 구조를 해치지 않는다. 또한 결측칸의 위치와 수에 영향을 받지 않고 항상 수렴한다는 것을 확인하였다.

  • PDF

임상시험에서 이분형 결측치 처리방법의 비교연구 (Comparison of binary data imputation methods in clinical trials)

  • 안구성;김동재
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.539-547
    • /
    • 2016
  • 임상시험에서 흔히 발생하는 결측치 중 이분형 결측치에 대한 논의를 하였다. 본 논문에서는 결측치가 발생하는 기재를 논의하고 기존의 여러 이분형 결측치 대체 방법과 수정된 결측치 대체방법을 소개하였다. 이후 각 결측치 대체 방법을 실제 자료에 적용하여 모의 실험을 진행하였다. 실제 자료의 성격 및 결측률의 변화에 따른 결측치 대체 방법들의 성능비교를 통해 진행하였다. 마지막으로 각 결측치 대체 방법에 대한 모의 실험 결과를 요약하고 토의하였다.

불규칙한 관측주기를 갖는 지하수자료를 이용한 지하수위 변동의 시계열 분석

  • 이명재;이강근
    • 한국지하수토양환경학회:학술대회논문집
    • /
    • 한국지하수토양환경학회 2000년도 추계학술대회
    • /
    • pp.64-68
    • /
    • 2000
  • 장기간 관측된 지하수위 자료를 시계열분석 중의 하나인 전이함수 모형(Transfer Function - Noise model)을 이용하여 분석하였다. 일반적으로 전이함수 모형은 입력 변수와 출력변수와의 관계가 선형적일 때 적용이 가능하며, 자료가 시간에 대해 연속적으로 존재해야 하는 제한이 있다. 강수량과 지하수위의 변동은 비선형적인 관계를 가지고 있어 이러한 전이함수 모형을 직접 적용하는데는 어려움이 있다. 이러한 비선형성의 정도를 감소시키기 위해 물리모형(HYDRUS)을 이용하여 침투량을 계산하고 이를 입력변수로 사용하여 전이함수 모형을 적용하였다. 침투량을 입력변수로 모형을 추정하였을 때, 강수량을 직접 입력자료로 사용했을 경우보다 ME(mean error), RMSE(root-mean-squre error), MAE(mean absolute error)에서 상대적으로 작은 값을 보여주고 있다. TFN 모형의 모수를 추정하기 위해서 Kalman 필터 알고리즘과 최우추정법(Maximum Likelihood Estimation)을 이용하였다. Kalman 필터 알고리즘을 이용하여 불규칙한 관측주기를 갖는 시계열이나 결측값이 있는 시계열에 대해서도 전이함수 모형을 구하였으며, 이를 통해 결측값에 대한 추정이 가능하였다.

  • PDF

상호정보량 기법과 인공신경망을 이용한 실시간 강우 자료 보정 (Calibration of Real Time Rainfall Data Using Mutual Information and Artificial Neural Network)

  • 성경민;구여주;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1269-1273
    • /
    • 2010
  • 이러한 강우자료의 결측값이나 오자료를 보정하는 것은 그 유역의 정확한 수문학적 특성 파악 및 안전한 수공구조물의 설계에 영향을 미치게 되므로 매우 중요하다고 할 수 있다. 최근 이러한 강우자료를 비선형적 모델인 인공신경망(Artificial Neural Network)을 이용하여 보정하는 연구가 활발히 진행되고 있다(오재우 등, 2008). 그러나 이러한 인공신경망을 적용하는 경우, 선택한 신경망 구조의 형태와 학습(training)을 위해 사용되는 자료가 전체 자료의 특성을 반영하고 있는 정도에 따라 정확도에 차이를 보인다(한광희 등, 2010). 따라서 자료보정을 위한 입력 자료의 선택은 인공신경망을 이용한 결측치 보정의 중요한 과정이다. 본 연구에서는 이러한 입력 자료의 선택을 위한 여러 가지 기법 중 입력 변수간의 상호정보량 (Mutual Information)을 이용한 방법을 적용하여 대상 결측 지점을 보정할 강우지점을 선별한 후 선택된 지점만으로 인공신경망을 구성하여 강우자료를 보정하고 주변 자료를 모두 이용한 결과와 상관성분석으로 얻어진 결과와 비교하였다.

  • PDF

전자의무기록 데이터에서의 적대적 생성 알고리즘 기반 결측값 대치 알고리즘 성능분석 (Performance Evaluation of an Imputation Method based on Generative Adversarial Networks for Electric Medical Record)

  • 조용연;정민영;황보율
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.879-881
    • /
    • 2019
  • 전자의무기록 (EMR)과 같은 의료 현장에서 수집되는 대용량의 데이터는 임상 해석적으로 잠재가치가 크고 활용도가 다양하나 결측값이 많아 희소성이 크다는 한계점이 있어 분석이 어렵다. 특히 EMR의 정보수집과정에서 발생하는 결측값은 무작위적이고 임의적이어서 분석 정확도를 낮추고 예측 모델의 성능을 저하시키는 주된 요인으로 작용하기 때문에, 결측치 대체는 필수불가결하다. 최근 통상적으로 활용되어지던 통계기반 알고리즘기반의 결측치 대체 알고리즘보다는 딥러닝 기술을 활용한 알고리즘들이 새로이 등장하고 있다. 본 논문에서는 Generative Adversarial Network를 기반한 최신 결측값 대치 알고리즘인 Generative Adversarial Imputation Nets을 적용하여 EMR에서의 성능을 분석해보고자 하였다.

대용량 교통 데이터의 자료처리 과정과 시스템의 개발 (Development of data processing method and system for huge Highway Data)

  • 정수정;송수경;이민수;남궁성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.295-297
    • /
    • 2007
  • 교통 관련 검지기 시스템에 의해 수집된 교통량, 점유율, 속도와 같은 교통 정보 데이터는 품질평가, 오류판단, 결측보정의 자료처리를 거치게 되며 이러한 전처리 후 다양한 목적에 의해 연구자들에게 활용된다. 신속하고 정확한 자료처리와 보다 편리하고 효과적인 웹 UI 의 제공은 매우 중요하다. 본 논문에서는 품질평가, 오류판단, 결측보정에 해당하는 세 단계의 자료처리 알고리즘을 개발하고 사용자에게 자료처리의 과정을 제공하는 웹 UI 시스템을 구현한다.

  • PDF