• Title/Summary/Keyword: K-최근접 이웃 대체

Search Result 4, Processing Time 0.019 seconds

Classification of Heart Disease Using K-Nearest Neighbor Imputation (K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측)

  • Park, Pyoung-Woo;Lee, Seok-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.742-745
    • /
    • 2017
  • 본 논문은 심장질환 도메인에 데이터 마이닝 기법을 적용한 연구로, 기존 환자의 정보에 대하여 K-최근접 이웃 알고리즘을 통해 결측 값을 대체하고, 대표적인 예측 분류기인 나이브 베이지안, 소포트 벡터 머신, 그리고 다층 퍼셉트론을 적용하여 각각 결과를 비교 및 분석한다. 본 연구의 실험은 K 최적화 과정을 포함하고 10-겹 교차 검증 방식으로 수행되었으며, 비교 및 분석은 정확도와 카파 통계치를 통해 판별한다.

Comparison of Data Reconstruction Methods for Missing Value Imputation (결측값 대체를 위한 데이터 재현 기법 비교)

  • Cheongho Kim;Kee-Hoon Kang
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.1
    • /
    • pp.603-608
    • /
    • 2024
  • Nonresponse and missing values are caused by sample dropouts and avoidance of answers to surveys. In this case, problems with the possibility of information loss and biased reasoning arise, and a replacement of missing values with appropriate values is required. In this paper, as an alternative to missing values imputation, we compare several replacement methods, which use mean, linear regression, random forest, K-nearest neighbor, autoencoder and denoising autoencoder based on deep learning. These methods of imputing missing values are explained, and each method is compared by using continuous simulation data and real data. The comparison results confirm that in most cases, the performance of the random forest imputation method and the denoising autoencoder imputation method are better than the others.

A Study on Applying the Nonlinear Regression Schemes to the Low-GloSea6 Weather Prediction Model (Low-GloSea6 기상 예측 모델 기반의 비선형 회귀 기법 적용 연구)

  • Hye-Sung Park;Ye-Rin Cho;Dae-Yeong Shin;Eun-Ok Yun;Sung-Wook Chung
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.16 no.6
    • /
    • pp.489-498
    • /
    • 2023
  • Advancements in hardware performance and computing technology have facilitated the progress of climate prediction models to address climate change. The Korea Meteorological Administration employs the GloSea6 model with supercomputer technology for operational use. Various universities and research institutions utilize the Low-GloSea6 model, a low-resolution coupled model, on small to medium-scale servers for weather research. This paper presents an analysis using Intel VTune Profiler on Low-GloSea6 to facilitate smooth weather research on small to medium-scale servers. The tri_sor_dp_dp function of the atmospheric model, taking 1125.987 seconds of CPU time, is identified as a hotspot. Nonlinear regression models, a machine learning technique, are applied and compared to existing functions conducting numerical operations. The K-Nearest Neighbors regression model exhibits superior performance with MAE of 1.3637e-08 and SMAPE of 123.2707%. Additionally, the Light Gradient Boosting Machine regression model demonstrates the best performance with an RMSE of 2.8453e-08. Therefore, it is confirmed that applying a nonlinear regression model to the tri_sor_dp_dp function during the execution of Low-GloSea6 could be a viable alternative.

Adaptive Operation of Boryeong Dam Water Supply Adjustment Standards against Multi-year Droughts (다년 가뭄 대비 보령댐 용수공급 조정기준의 적응형 운영방안)

  • Kim, Gi Joo;Lee, Jae Hwang;Lee, Joohyung;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.373-373
    • /
    • 2022
  • 전세계적으로 기후변화로 인해 3년 이상의 기간동안 지속되는 다년 가뭄의 빈도와 심도가 증가하고 있으며, 이로 인한 피해도 증가하고 있다. 본 연구에서는 이를 반영하여 전국 다목적댐 및 용수댐에서 모두 주요 가뭄 대응 대책으로 사용되고 있는 현행 용수공급 조정기준을 개선하는 방안을 제안하고자 한다. 가장 먼저, 장기 기억 반영이 가능한 시계열 모형인 ARFIMA(Autoregressive Fractional Integrated Moving Average) 모델을 사용하여 다양한 강도의 장기 기억을 가지고 있는 연간 유입량을 생성하였다. 이후, 연간 유입량을 k-최근접 이웃 방법 기반의 배분 도구를 사용하여 10일 단위 유입량으로 분배하였으며 이를 대체 용수공급 조정기준을 생성하기 위한 입력 변수로 사용하였다. 새로운 용수공급 조정기준은 매 시점마다 새롭게 업데이트되는 정보를 통해 현행 기준과 함께 적응형으로 저수지 운영에 사용되었다. 다년 가뭄이 반영된 유입량으로 적응형으로 저수지 운영을 관측 유입량 하에서 빈도와 크기의 측면에서 분석을 시행하였다. 그 결과, 심각한 실패(물 부족 비율 30% 이상)의 빈도의 경우 현행 기준 운영 시 6.14%에서 적응형 운영 시행 시 2.99%로 개선되었지만, 전체 기간 동안의 신뢰도는 적응형 운영보다(26.42%) 현행 운영 하에서 더욱 나은 결과를 보였다(41.19%). 위와 같은 분석 결과는 심각한 실패의 빈도와 크기를 줄이는 용수공급 조정기준을 시행하는 원론적인 목적과 일치하기에, 본 연구에서 제안하는 다년 가뭄에 대비한 적응형 운영 방안은 향후 길게 지속되는 가뭄 조건에서 저수지 운영 정책으로 활용될 수 있음을 확인하였다.

  • PDF