• 제목/요약/키워드: K-최근접 이웃 대체

검색결과 4건 처리시간 0.02초

K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측 (Classification of Heart Disease Using K-Nearest Neighbor Imputation)

  • 박평우;이석원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.742-745
    • /
    • 2017
  • 본 논문은 심장질환 도메인에 데이터 마이닝 기법을 적용한 연구로, 기존 환자의 정보에 대하여 K-최근접 이웃 알고리즘을 통해 결측 값을 대체하고, 대표적인 예측 분류기인 나이브 베이지안, 소포트 벡터 머신, 그리고 다층 퍼셉트론을 적용하여 각각 결과를 비교 및 분석한다. 본 연구의 실험은 K 최적화 과정을 포함하고 10-겹 교차 검증 방식으로 수행되었으며, 비교 및 분석은 정확도와 카파 통계치를 통해 판별한다.

결측값 대체를 위한 데이터 재현 기법 비교 (Comparison of Data Reconstruction Methods for Missing Value Imputation)

  • 김청호;강기훈
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.603-608
    • /
    • 2024
  • 무응답 및 결측값은 표본 탈락, 설문조사에 대한 답변 회피 등으로 발생하며 정보의 손실 및 편향된 추론의 가능성이 있는 문제가 발생하게 되며, 이 경우 결측값을 적절한 값으로 바꾸는 대체가 필요하게 된다. 본 논문에서는 결측값에 대한 대체 방법으로 제안되었던 평균 대체, 다중회귀 대체, 랜덤 포레스트 대체, K-최근접 이웃 대체, 그리고 딥러닝을 기본으로 한 오토인코더 대체와 잡음제거 오토인코더 대체 방법을 비교한다. 결측값을 대체하는 이러한 방법들에 대해 설명하고, 연속형의 모의실험 데이터와 실제 데이터에 접목시켜 각 방법들을 비교하였다. 비교 결과 대부분의 경우에서 다중 대체 방법인 랜덤 포레스트 대체 방법과 잡음제거 오토인코더 대체 방법의 성능이 좋았음을 확인하였다.

Low-GloSea6 기상 예측 모델 기반의 비선형 회귀 기법 적용 연구 (A Study on Applying the Nonlinear Regression Schemes to the Low-GloSea6 Weather Prediction Model)

  • 박혜성;조예린;신대영;윤은옥;정성욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.489-498
    • /
    • 2023
  • 하드웨어의 성능 및 컴퓨팅 기술의 발전 덕분에 기후환경 변화를 대비하기 위해 기후예측 모델 또한 발전하고 있다. 한국 기상청은 GloSea6를 도입하여 슈퍼컴퓨터를 이용하여 기상 예측을 하고있으며, 각 대학 및 연구 기관에서는 중소규모 서버에서 사용하기 위해 저해상도 결합모델인 Low-GloSea6를 사용하여 기상 연구에 활용하고 있다. 본 논문에서는 중소규모 서버에서의 기상 연구의 원활한 연구를 위해 Low-GloSea6의 Intel VTune Profiler를 사용한 분석을 진행하였으며 1125.987초의 CPU Time을 수행하는 대기모델의 tri_sor_dp_dp 함수를 Hotspot으로 검출하였다. 수치적 연산을 진행하는 기존 함수에 머신러닝 기법의 하나인 비선형 회귀모델을 적용 및 비교하여 머신러닝 적용 가능성을 확인하였다. 기존 tri_sor_dp_dp 함수의 실제 연산되는 값인 1e-3 ~ 1e-20의 범위를 가지는 Output Data인 변수 "Px"를 기준으로 평가하였을때 K-최근접 이웃 회귀 모델은 MAE가 1.3637e-08, SMAPE가 123.2707%로 가장 우수하게 나타났으며 RMSE의 경우 Light Gradient Boosting Machine 회귀 모델이 2.8453e-08로 가장 우수한 성능을 보이는 것으로 측정되었다. 따라서 Low-GloSea6 수행 과정 중 tri_sor_dp_dp 함수의 데이터를 추출 후 비선형 회귀 모델을 적용한 결과로 기존의 tri_sor_dp_dp 함수의 수치적 연산 값과 K-최근접 이웃 회귀 모델을 비교하였을 때 SMAPE가 123.2707%의 오차가 발생하는 것으로 측정되어 기존 모듈의 대체 가능성이 있다는 것을 확인하였다.

다년 가뭄 대비 보령댐 용수공급 조정기준의 적응형 운영방안 (Adaptive Operation of Boryeong Dam Water Supply Adjustment Standards against Multi-year Droughts)

  • 김기주;이재황;이주형;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.373-373
    • /
    • 2022
  • 전세계적으로 기후변화로 인해 3년 이상의 기간동안 지속되는 다년 가뭄의 빈도와 심도가 증가하고 있으며, 이로 인한 피해도 증가하고 있다. 본 연구에서는 이를 반영하여 전국 다목적댐 및 용수댐에서 모두 주요 가뭄 대응 대책으로 사용되고 있는 현행 용수공급 조정기준을 개선하는 방안을 제안하고자 한다. 가장 먼저, 장기 기억 반영이 가능한 시계열 모형인 ARFIMA(Autoregressive Fractional Integrated Moving Average) 모델을 사용하여 다양한 강도의 장기 기억을 가지고 있는 연간 유입량을 생성하였다. 이후, 연간 유입량을 k-최근접 이웃 방법 기반의 배분 도구를 사용하여 10일 단위 유입량으로 분배하였으며 이를 대체 용수공급 조정기준을 생성하기 위한 입력 변수로 사용하였다. 새로운 용수공급 조정기준은 매 시점마다 새롭게 업데이트되는 정보를 통해 현행 기준과 함께 적응형으로 저수지 운영에 사용되었다. 다년 가뭄이 반영된 유입량으로 적응형으로 저수지 운영을 관측 유입량 하에서 빈도와 크기의 측면에서 분석을 시행하였다. 그 결과, 심각한 실패(물 부족 비율 30% 이상)의 빈도의 경우 현행 기준 운영 시 6.14%에서 적응형 운영 시행 시 2.99%로 개선되었지만, 전체 기간 동안의 신뢰도는 적응형 운영보다(26.42%) 현행 운영 하에서 더욱 나은 결과를 보였다(41.19%). 위와 같은 분석 결과는 심각한 실패의 빈도와 크기를 줄이는 용수공급 조정기준을 시행하는 원론적인 목적과 일치하기에, 본 연구에서 제안하는 다년 가뭄에 대비한 적응형 운영 방안은 향후 길게 지속되는 가뭄 조건에서 저수지 운영 정책으로 활용될 수 있음을 확인하였다.

  • PDF