• 제목/요약/키워드: Support Vector Machine-Regression

검색결과 375건 처리시간 0.027초

A Strategy of Assessing Climate Factors' Influence for Agriculture Output

  • Kuan, Chin-Hung;Leu, Yungho;Lee, Chien-Pang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1414-1430
    • /
    • 2022
  • Due to the Internet of Things popularity, many agricultural data are collected by sensors automatically. The abundance of agricultural data makes precise prediction of rice yield possible. Because the climate factors have an essential effect on the rice yield, we considered the climate factors in the prediction model. Accordingly, this paper proposes a machine learning model for rice yield prediction in Taiwan, including the genetic algorithm and support vector regression model. The dataset of this study includes the meteorological data from the Central Weather Bureau and rice yield of Taiwan from 2003 to 2019. The experimental results show the performance of the proposed model is nearly 30% better than MARS, RF, ANN, and SVR models. The most important climate factors affecting the rice yield are the total sunshine hours, the number of rainfall days, and the temperature.The proposed model also offers three advantages: (a) the proposed model can be used in different geographical regions with high prediction accuracies; (b) the proposed model has a high explanatory ability because it could select the important climate factors which affect rice yield; (c) the proposed model is more suitable for predicting rice yield because it provides higher reliability and stability for predicting. The proposed model can assist the government in making sustainable agricultural policies.

다중선형회귀와 기계학습 모델을 이용한 PM10 농도 예측 및 평가 (Evaluation and Predicting PM10 Concentration Using Multiple Linear Regression and Machine Learning)

  • 손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제36권6_3호
    • /
    • pp.1711-1720
    • /
    • 2020
  • 최근 급속한 산업화와 도시화로 인해 인위적으로 발생하는 미세먼지(Particulate matter, PM)는 기상 조건에 따라 이동 및 분산되면서 피부와 호흡기 등 인체에 악영향을 미친다. 본 연구는 기상인자를 multiple linear regression(MLR), support vector machine(SVM), 그리고 random forest(RF) 모델의 입력자료로 하여 서울시 PM10 농도를 예측하고, 모델 간 성능을 비교 평가하는데 그 목적을 둔다. 먼저 서울시에 소재한 39개소 대기오염측정망(air quality monitoring sites, AQMS)에서 관측된 PM10 농도 자료를 8:2 비율로 구분하여 모델 훈련과 검증 데이터셋으로 사용되었다. 또한 기상관측소(automatic weather system, AWS)에서 관측되고 있는 자료 중 9개 기상인자(평균기온, 최고기온, 최저기온, 일 강수량, 평균풍속, 최대순간풍속, 최대순간풍속풍향, 황사발생유무, 상대습도)가 모델의 입력자료로 선정되었다. 각 AQMS에서 관측된 PM10 농도와 MLR, SVM, 그리고 RF 모델에 의해 예측된 PM10 농도 간 결정계수(R2)는 각각 0.260, 0.772, 그리고 0.793이었고, RF 모델이 PM10 농도 예측에 가장 높은 성능을 나타냈다. 특히 모델 검증에 사용되는 AQMS 중 관악구와 강남대로 AQMS는 상대적으로 AWS에 가까워 SVM과 RF 모델에서 높은 정확도를 나타냈다. 종로구 AQMS는 AWS에서 비교적 멀리 떨어져 있지만, 인접한 두 AQMS 데이터가 모델 학습에 사용되었기 때문에 두 모델에서 높은 정확도를 나타냈다. 반면 용산구 AQMS는 AQMS 및 AWS에서 비교적 멀리 떨어져 있기에 두 모델의 성능이 낮게 나타냈다.

방사선치료 시 다양한 기계학습을 이용한 선량품질관리 결과의 예측 (Prediction of Delivery Quality Assurance Via Machine Learning in Helical Tomotherapy)

  • 장경환
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제47권4호
    • /
    • pp.263-270
    • /
    • 2024
  • The objective of this study was to evaluate the accuracy and impact of leaf open time (LOT) and pitch using various machine learning models on EBT film-based delivery quality assurance (DQA) performed on 211 patients of helical tomotherapy (HT). We randomly selected passed (n=191) and failed (n=20) DQA measurements to evaluate the accuracy of the k-nearest neighbor (KNN), support vector machine (SVM), naive Bayes (NB) and logistic regression (LR) models using scale-dependent metrics such as the coefficient of determination (R2), mean squared error (MSE), and root MSE (RMSE). We evaluated the performance of the four prediction models in terms of the accuracy, precision, sensitivity, and F1-score using a confusion matrix, finding the NB and LR models to achieve optimal results. The results of this study are expected to reduce the workload of medical physicists and dosimetrists by predicting DQA results according to LOT and pitch in advance.

Support Vector Machines를 이용한 교각주위 국부세굴 예측 (Prediction of Local Scour around Bridge Piers using Support Vector Machines)

  • 최성욱;최성욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.57-61
    • /
    • 2016
  • 교각 주위에서의 국부세굴은 교각을 지나는 유체의 복잡한 흐름에 의해 발생한다. 이를 해석하기 위하여 많은 난류모형을 이용한 실내실험 및 수치실험을 수행하였으나 발생하는 와류를 하천 규모에서 전부 계산하기는 매우 어려운 문제다. 따라서 국부세굴 관련으로 최대 관심사인 최대 세굴심은 인공지능 기술에 근거한 다양한 기법을 적용해 계산하여 예측하기도 한다. 본 연구에서는 기계학습 분야 중 하나인 서포트 벡터 머신 (Support Vector Machines)을 이용하여 교각주위 국부세굴을 예측하였다. SVM은 본래 초평면을 이용하여 데이터를 분류시키는 기법이나 Vapnik(1995)이 제안한 ${\varepsilon}$ 서포트 벡터 회귀 (${\varepsilon}$-support vector regression)방법을 통해 회귀분석에도 활용할 수 있게 되었다. 학습을 위해 Charbert and Engeldinger (1956), Shen et al. (1969), Jain and Fischer (1979), 그리고 Dey et al. (1995)의 실험 자료를 이용하였고 검증을 위해 Yanmaz and Altinbilek (1991)의 실험 자료를 이용하였다. 커널함수로는 다항식 함수와 방사 기저 함수를 이용하였고 각 계수는 적합한 값을 찾기 위해 시행착오법을 사용하였다. 민감도 분석을 통해 각 계수들 중 ${\varepsilon}$의 변화가 결과에 가장 민감하게 변화를 일으키는 것을 확인하였고 검증 결과 SVM가 충분히 국부세굴을 잘 예측하는 것을 확인하였다.

  • PDF

주식 시장 예측을 위한 π-퍼지 논리와 SVM의 최적 결합 (An Optimized Combination of π-fuzzy Logic and Support Vector Machine for Stock Market Prediction)

  • 다오두안훙;안현철
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.43-58
    • /
    • 2014
  • 최근 정보기술의 발전으로 복잡하고 방대한 양의 주가 데이터에 대한 실시간 분석이 가능해지면서 인공지능 기법을 활용해 주식 시장의 등락을 예측하고, 이를 기반으로 매매 거래를 수행하는 트레이딩 시스템에 대한 세간의 관심이 높아지고 있다. 본 연구는 이러한 트레이딩 시스템의 시장 예측 알고리즘으로 활용될 수 있는 새로운 주식 시장 등락 예측 모형을 제시한다. 본 연구의 제안 모형은 ${\pi}$-퍼지 논리를 이용해 모든 입력변수의 차원을 low, medium, high로 퍼지변환한 입력값을 대상으로 Support Vector Machine(SVM)을 적용하여 익일 시장의 등락을 예측하도록 설계되었다. 그런데 이 경우 입력변수의 수가 3배로 늘어나기 때문에, 적절한 입력변수의 선택이 요구된다. 이에 본 연구에서는 유전자 알고리즘을 활용하여 입력변수 선택 집합을 최적화하도록 하였으며, 동시에 ${\pi}$-퍼지 논리 및 SVM에 적용되는 조절 파라미터들의 값도 함께 최적화 하도록 하였다. 모형의 성능을 검증하기 위해, 본 연구에서는 지난 2004년부터 2013년까지의 10년치 국내 주식시장 데이터를 기반으로 한 KOSPI 200 지수의 등락 예측에 제안모형을 적용해 보았다. 이 때, 비교모형으로 로지스틱 회귀모형, 다중판별분석, 의사결정나무, 인공신경망, SVM, 퍼지SVM 등도 함께 적용시켜 성과를 정밀하게 검증해 보고자 하였다. 그 결과, 제안모형이 예측 정확도는 물론 투자수익률(Return on Investment) 측면에서도 다른 모든 비교모형들에 비해 월등히 우수한 성능을 보임을 확인할 수 있었다.

기계학습모형을 이용한 다분광 위성 영상 기반 낙동강 부유 물질 농도 계측 기법 개발 (Development of suspended solid concentration measurement technique based on multi-spectral satellite imagery in Nakdong River using machine learning model)

  • 권시윤;서일원;백동해
    • 한국수자원학회논문집
    • /
    • 제54권2호
    • /
    • pp.121-133
    • /
    • 2021
  • 하천에서 발생하는 부유 물질은 주로 유역으로부터 유입되거나 하천 내에서 자생으로 발생하기도 하며, 퇴적되어 중장기적인 수질 오염을 초래할 수도 있는 중요한 수질 인자이다. 하지만, 부유물질의 재래식 계측방식은 점 단위 계측이기 때문에 노동 집약적이며 방대한 양의 자료를 취득하기는 어렵다. 따라서, 본 연구에서는 고해상도 다분광 위성영상을 제공하는 Sentinel-2 위성 자료를 이용하여 낙동강 전역에 대한 원격탐사 기반 부유 물질 농도 계측 기법을 개발하였다. 개발된 기법은 기존 원격탐사 기반 회귀식들의 한계점을 개선하고 낙동강 전체 영역의 지역적 특성을 반영하기 위해 기계학습 모형인 서포트 벡터 회귀(Support Vector Regression, SVR) 모형을 이용하여 다양한 파장대의 분광 밴드들과 밴드비(band ratios)를 고려하였으며, 이를 입력 변수들의 최적 조합으로 재귀적 특징 제거법(Recursive Feature Elimination, RFE)과 SVR의 각 변수별 가중계수를 활용하여 도출하였다. 가장 중요도가 높은 분광 밴드로는 Red-edge 파장대 영역에 속하는 705 nm 밴드가 산출되었으며, 최종적으로 구축된 SVR 모형을 선행 연구들에서 제시한 회귀식들과 비교한 결과, 가장 정확한 계측 결과를 제공하는 것으로 밝혀졌다. 본 연구에서 개발된 SVR 모형은 RFE를 통해 산출된 최적 분광 밴드 조합을 바탕으로 하기 때문에 기존 단일 분광 밴드 혹은 밴드비를 기반으로 구축된 회귀식들이 가지는 변수 의존도를 낮추는 동시에 더욱 정확한 부유물질 농도 공간분포를 제공할 수 있을 것으로 판단된다.

선형변수 기계학습 기법을 활용한 저속비대선의 잉여저항계수 추정 (Prediction of Residual Resistance Coefficient of Low-Speed Full Ships Using Hull Form Variables and Machine Learning Approaches)

  • 김유철;양경규;김명수;이영연;김광수
    • 대한조선학회논문집
    • /
    • 제57권6호
    • /
    • pp.312-321
    • /
    • 2020
  • In this study, machine learning techniques were applied to predict the residual resistance coefficient (Cr) of low-speed full ships. The used machine learning methods are Ridge regression, support vector regression, random forest, neural network and their ensemble model. 19 hull form variables were used as input variables for machine learning methods. The hull form variables and Cr data obtained from 139 hull forms of KRISO database were used in analysis. 80 % of the total data were used as training models and the rest as validation. Some non-linear models showed the overfitted results and the ensemble model showed better results than others.

BCI에서 기계 학습을 위한 간질 뇌파 특징 선택을 통한 차원 감소 방법 분석 (Analysis of Dimensionality Reduction Methods Through Epileptic EEG Feature Selection for Machine Learning in BCI)

  • 양통;;임창균
    • 한국전자통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.1333-1342
    • /
    • 2018
  • 지금까지 뇌파(Electroencephalography - EEG)는 뇌전증 진단 및 치료를 위한 가장 중요하고 편리한 방법이었다. 그러나 뇌전증 뇌파 신호의 파형 특성은 매우 약하고 비 정지 상태이며 배경 노이즈가 강하기 때문에 식별하기가 어렵다. 이 논문에서는 간질 뇌파의 특징 선택을 통한 차원 감소를 통한 분류 방법의 효과를 분석한다. 우리는 차원 감소를 위해 주 요소 분석, 커널 요소 분석, 선형 판별 분석 방법을 사용하였다. 차원 감소방법의 성능 분석을 위해 Support Vector Machine: SVM), Logistic Regression(: LR), K-Nearestneighbor(: K-NN), Decision Tree(: DR), Random Forest(: RF) 분류 방법들을 사용해 평가하였다. 실험 결과에 따르면, PCA는 SVM, LR 및 K-NN에서 75% 정확도를 나타냈다. KPCA는 SVM과 K-KNN에서 85%의 성능을 보였으며 LDA는 K-NN를 이용했을 때 100 %의 정확도 보여주었다. 따라서 LDA를 이용한 차원 감소가 뇌전증 EEG 신호에 대한 최고의 분류 결과 보여주었다.

A Supervised Feature Selection Method for Malicious Intrusions Detection in IoT Based on Genetic Algorithm

  • Saman Iftikhar;Daniah Al-Madani;Saima Abdullah;Ammar Saeed;Kiran Fatima
    • International Journal of Computer Science & Network Security
    • /
    • 제23권3호
    • /
    • pp.49-56
    • /
    • 2023
  • Machine learning methods diversely applied to the Internet of Things (IoT) field have been successful due to the enhancement of computer processing power. They offer an effective way of detecting malicious intrusions in IoT because of their high-level feature extraction capabilities. In this paper, we proposed a novel feature selection method for malicious intrusion detection in IoT by using an evolutionary technique - Genetic Algorithm (GA) and Machine Learning (ML) algorithms. The proposed model is performing the classification of BoT-IoT dataset to evaluate its quality through the training and testing with classifiers. The data is reduced and several preprocessing steps are applied such as: unnecessary information removal, null value checking, label encoding, standard scaling and data balancing. GA has applied over the preprocessed data, to select the most relevant features and maintain model optimization. The selected features from GA are given to ML classifiers such as Logistic Regression (LR) and Support Vector Machine (SVM) and the results are evaluated using performance evaluation measures including recall, precision and f1-score. Two sets of experiments are conducted, and it is concluded that hyperparameter tuning has a significant consequence on the performance of both ML classifiers. Overall, SVM still remained the best model in both cases and overall results increased.

머신러닝을 이용한 급성 뇌졸중 퇴원 환자의 중증도 보정 사망 예측 모형 개발에 관한 연구 (A study on the development of severity-adjusted mortality prediction model for discharged patient with acute stroke using machine learning)

  • 백설경;박종호;강성홍;박혜진
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.126-136
    • /
    • 2018
  • 본 연구는 머신러닝을 활용하여 급성 뇌졸중 퇴원 환자의 중증도 보정 사망 예측 모형 개발을 목적으로 시행하였다. 전국 단위의 퇴원손상심층조사 2006~2015년 자료 중 한국표준질병사인분류(Korean standard classification of disease-KCD 7)에 따라 뇌졸중 코드 I60-I63에 해당하는 대상자를 추출하여 분석하였다. 동반질환 중증도 보정 도구로는 Charlson comorbidity index(CCI), Elixhauser comorbidity index(ECI), Clinical classification software(CCS)의 3가지 도구를 사용하였고 중증도 보정 모형 예측 개발은 로지스틱회귀분석, 의사결정나무, 신경망, 서포트 벡터 머신 기법을 활용하여 비교해 보았다. 뇌졸중 환자의 동반질환으로는 ECI에서는 합병증을 동반하지 않은 고혈압(hypertension, uncomplicated)이 43.8%로, CCS에서는 본태성고혈압(essential hypertension)이 43.9%로 다른 질환에 비해 가장 월등하게 높은 것으로 나타났다. 동반질환 중중도 보정 도구를 비교해 본 결과 CCI, ECI, CCS 중 CCS가 가장 높은 AUC값으로 분석되어 가장 우수한 중증도 보정 도구인 것으로 확인되었다. 또한 CCS, 주진단, 성, 연령, 입원경로, 수술유무 변수를 포함한 중증도 보정 모형 개발 AUC값은 로지스틱 회귀분석의 경우 0.808, 의사결정나무 0.785, 신경망 0.809, 서포트 벡터 머신 0.830로 분석되어 가장 우수한 예측력을 보인 것은 서포트 벡터머신 기법인 것으로 최종 확인되었고 이러한 결과는 추후 보건의료정책 수립에 활용될 수 있을 것이다.