• 제목/요약/키워드: Support Vector Machine-Regression

검색결과 372건 처리시간 0.026초

농업용 난방기의 사용 연식에 따른 이산화탄소 배출농도 비교 (Comparison of Carbon Dioxide Emission Concentration according to the Age of Agricultural Heating Machine)

  • 김나은;김대현;김연중;김현태
    • 생물환경조절학회지
    • /
    • 제32권3호
    • /
    • pp.190-196
    • /
    • 2023
  • 본 연구는 등유를 사용하는 농업용 난방기에서 배출되는 가스를 포집하고, 농업용 난방기의 사용 연식에 따른 이산화탄소의 배출농도를 파악하고자 수행되었다. 선형 회귀분석의 결과로 농업용 난방기의 연식에 따른 이산화탄소의 배출량은 R2 = 0.84로 y = 26.99x+721.98의 식을 따른다고 나타났다. 농업용 난방기의 사용 연식에 따라 세 그룹으로 분류하여 분산분석을 수행하였다. 분산분석을 수행한 결과, 분석을 위해 설정한 유의확률0.05보다 작은 2.1961×10-13으로 나타났으며 이는 적어도 한 그룹에서 차이가 나타난다는 것을 의미한다. 본 연구에서는 농업용 난방기의 기본적인 배출농도의 차이를 분석하고자 기기의 제작사와 상관없이 농업용 난방기의 기기 연식만을 고려하여 배출가스 데이터를 수집하였다. 기기의 연소 방식에는 제작사에 따라 연소 방식에 차이가 미미하게 있었을 것으로 판단되며 데이터 변수의 개수가 늘어난다면, SVR(support vector regression) 기반의 선형회귀 분석 등을 실시하여 농업용 난방기의 이산화탄소 데이터가 온실가스발생량 파악에 더욱 활용도가 높아질 것으로 판단된다. 추후 연구에서는 더욱 세분화된 데이터의 수집 방식을 따라 더욱 높은 정확도를 가진 결과값을 도출할 수 있다고 판단된다. 이처럼 우리나라의 농업 분야에서 용도별 온실가스 발생량을 조사하기 위하여 고정형 농기계인 농업용 난방기의 이산화탄소 발생량을 정확히 파악하여 온실가스 배출량 조사에 활용할 수 있을 것으로 판단된다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.

Calibration of Portable Particulate Mattere-Monitoring Device using Web Query and Machine Learning

  • Loh, Byoung Gook;Choi, Gi Heung
    • Safety and Health at Work
    • /
    • 제10권4호
    • /
    • pp.452-460
    • /
    • 2019
  • Background: Monitoring and control of PM2.5 are being recognized as key to address health issues attributed to PM2.5. Availability of low-cost PM2.5 sensors made it possible to introduce a number of portable PM2.5 monitors based on light scattering to the consumer market at an affordable price. Accuracy of light scatteringe-based PM2.5 monitors significantly depends on the method of calibration. Static calibration curve is used as the most popular calibration method for low-cost PM2.5 sensors particularly because of ease of application. Drawback in this approach is, however, the lack of accuracy. Methods: This study discussed the calibration of a low-cost PM2.5-monitoring device (PMD) to improve the accuracy and reliability for practical use. The proposed method is based on construction of the PM2.5 sensor network using Message Queuing Telemetry Transport (MQTT) protocol and web query of reference measurement data available at government-authorized PM monitoring station (GAMS) in the republic of Korea. Four machine learning (ML) algorithms such as support vector machine, k-nearest neighbors, random forest, and extreme gradient boosting were used as regression models to calibrate the PMD measurements of PM2.5. Performance of each ML algorithm was evaluated using stratified K-fold cross-validation, and a linear regression model was used as a reference. Results: Based on the performance of ML algorithms used, regression of the output of the PMD to PM2.5 concentrations data available from the GAMS through web query was effective. The extreme gradient boosting algorithm showed the best performance with a mean coefficient of determination (R2) of 0.78 and standard error of 5.0 ㎍/㎥, corresponding to 8% increase in R2 and 12% decrease in root mean square error in comparison with the linear regression model. Minimum 100 hours of calibration period was found required to calibrate the PMD to its full capacity. Calibration method proposed poses a limitation on the location of the PMD being in the vicinity of the GAMS. As the number of the PMD participating in the sensor network increases, however, calibrated PMDs can be used as reference devices to nearby PMDs that require calibration, forming a calibration chain through MQTT protocol. Conclusions: Calibration of a low-cost PMD, which is based on construction of PM2.5 sensor network using MQTT protocol and web query of reference measurement data available at a GAMS, significantly improves the accuracy and reliability of a PMD, thereby making practical use of the low-cost PMD possible.

Prediction Models for Solitary Pulmonary Nodules Based on Curvelet Textural Features and Clinical Parameters

  • Wang, Jing-Jing;Wu, Hai-Feng;Sun, Tao;Li, Xia;Wang, Wei;Tao, Li-Xin;Huo, Da;Lv, Ping-Xin;He, Wen;Guo, Xiu-Hua
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권10호
    • /
    • pp.6019-6023
    • /
    • 2013
  • Lung cancer, one of the leading causes of cancer-related deaths, usually appears as solitary pulmonary nodules (SPNs) which are hard to diagnose using the naked eye. In this paper, curvelet-based textural features and clinical parameters are used with three prediction models [a multilevel model, a least absolute shrinkage and selection operator (LASSO) regression method, and a support vector machine (SVM)] to improve the diagnosis of benign and malignant SPNs. Dimensionality reduction of the original curvelet-based textural features was achieved using principal component analysis. In addition, non-conditional logistical regression was used to find clinical predictors among demographic parameters and morphological features. The results showed that, combined with 11 clinical predictors, the accuracy rates using 12 principal components were higher than those using the original curvelet-based textural features. To evaluate the models, 10-fold cross validation and back substitution were applied. The results obtained, respectively, were 0.8549 and 0.9221 for the LASSO method, 0.9443 and 0.9831 for SVM, and 0.8722 and 0.9722 for the multilevel model. All in all, it was found that using curvelet-based textural features after dimensionality reduction and using clinical predictors, the highest accuracy rate was achieved with SVM. The method may be used as an auxiliary tool to differentiate between benign and malignant SPNs in CT images.

스태킹 앙상블 모델을 이용한 시간별 지상 오존 공간내삽 정확도 향상 (Improved Estimation of Hourly Surface Ozone Concentrations using Stacking Ensemble-based Spatial Interpolation)

  • 김예진;강은진;조동진;이시우;임정호
    • 한국지리정보학회지
    • /
    • 제25권3호
    • /
    • pp.74-99
    • /
    • 2022
  • 지상 오존은 차량 및 산업 현장에서 배출된 질소화합물(Nitrogen oxides; NOx)과 휘발성 유기화합물(Volatile Organic Compounds; VOCs)의 광화학 반응을 통해 생성되어 식생 및 인체에 악영향을 끼친다. 국내에서는 실시간 오존 모니터링을 수행하고 있지만 관측소 기반으로, 미관측 지역의 공간 분포 분석에 어려움이 있다. 본 연구에서는 스태킹 앙상블 기법을 활용하여 매시간 남한 지역의 지상 오존 농도를 1.5km의 공간해상도로 공간내삽하였고, 5-fold 교차검증을 수행하였다. 스태킹 앙상블의 베이스 모델로는 코크리깅(Cokriging), 다중 선형 회귀(Multi-Linear Regression; MLR), 랜덤 포레스트(Random Forest; RF), 서포트 벡터 회귀(Support Vector Regression; SVR)를 사용하였다. 각 모델의 정확도 비교 평가 결과, 스태킹 앙상블 모델이 연구 기간 내 시간별 평균 R 및 RMSE이 0.76, 0.0065ppm으로 가장 높은 성능을 보여주었다. 스태킹 앙상블 모델의 지상 오존 농도 지도는 복잡한 지형 및 도시화 변수의 특징이 잘 드러나며 더 넓은 농도 범위를 보여주었다. 개발된 모델은 매시간 공간적으로 연속적인 공간 지도를 산출할 수 있을 뿐만 아니라 8시간 평균치 산출 및 시계열 분석에 있어서도 활용 가능성이 클 것으로 기대된다.

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

발전플랜트 성능데이터 학습에 의한 발전기 출력 추정 모델 (A Predictive Model of the Generator Output Based on the Learning of Performance Data in Power Plant)

  • 양학진;김성근
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8753-8759
    • /
    • 2015
  • 터빈 발전 사이클에서의 안정적인 발전 출력 유지관리를 위해서는 검증된 성능 측정 데이터 그룹과 이를 바탕으로 한 발전 출력 성능 계산 절차의 수립이 필요하다. ASME PTC(Performance Test Code)의 성능 계산 절차를 기반으로 본 연구에서는 터빈 출력에 의한 발전기 출력 성능 산정을 위해서 터빈 팽창선 모델과 발전기 출력 측정 데이터의 입력 검증 모델을 구성하였다. 또한 불확실한 측정 데이터에 대한 검증 모델도 구성하였다. 지난 연구에서는 신경회로망과 커널 회귀의 학습 방법을 사용하였으나 본 연구에서는 미측정 데이터에 대한 보완을 하기 위하여 서포트 벡터 머신 모델을 사용하여 발전기 출력 계산 데이터의 학습 모델을 구성하였으며, 학습 모델 구성을 위해서 관련 변수의 선정을 위한 절차와 학습 데이터 구간을 설정하는 알고리듬을 개발하였다. 학습의 결과 오차는 약 1% 범위 안에 있게 되어 추정 및 학습 모델로서 유용함을 입증하였다. 이 학습 모델을 사용하여 측정 데이터 중 상실된 부분에 대한 추정 모델을 구성함으로써, 터빈 사이클 보정 성능 계산의 신뢰성을 향상시킬 수 있음을 검증하였다.

주급수 유량의 형상 분류 및 추정 모델에 대한 연구 (A Study of the Feature Classification and the Predictive Model of Main Feed-Water Flow for Turbine Cycle)

  • 양학진;김성근;최광희
    • 에너지공학
    • /
    • 제23권4호
    • /
    • pp.263-271
    • /
    • 2014
  • 터빈 사이클의 성능 상태량을 결정하기 위한 보정 열 성능 분석은 발전소의 향상된 경제성 운전을 위해 요구된다. 본 연구에서는 유용하고 정확한 성능 분석을 위해서 산업 표준인 ASME PTC를 기분으로 하여 성능 데이터를 사용하여 주급수 유량의 영역별 판정 알고리듬을 개발하고 각 영역별 추정 알고리즘을 개발하였다. 추정 알고리즘은 측정 상태량의 상관관계를 기반으로 형상 분류를 제시하고, 이를 기반으로 서포트 벡터 머신 모델링을 이용하여 추정 모델을 구성하였으며, 서포트 벡터 머신 모델링의 우수성을 검증하기 위하여 신경 회로망 모델, 커널 회귀 모델과 비교하였다. 주급수 유량의 형상 분류 및 추정 모델은 터빈 사이클에서 정확한 보정 열 성능 분석을 제공함으로써 향상된 성능 분석에 기여할 것이다.

IoT Enabled Intelligent System for Radiation Monitoring and Warning Approach using Machine Learning

  • Muhammad Saifullah ;Imran Sarwar Bajwa;Muhammad Ibrahim;Mutyyba Asgher
    • International Journal of Computer Science & Network Security
    • /
    • 제23권5호
    • /
    • pp.135-147
    • /
    • 2023
  • Internet of things has revolutionaries every field of life due to the use of artificial intelligence within Machine Learning. It is successfully being used for the study of Radiation monitoring, prediction of Ultraviolet and Electromagnetic rays. However, there is no particular system available that can monitor and detect waves. Therefore, the present study designed in which IOT enables intelligence system based on machine learning was developed for the prediction of the radiation and their effects of human beings. Moreover, a sensor based system was installed in order to detect harmful radiation present in the environment and this system has the ability to alert the humans within the range of danger zone with a buzz, so that humans can move to a safer place. Along with this automatic sensor system; a self-created dataset was also created in which sensor values were recorded. Furthermore, in order to study the outcomes of the effect of these rays researchers used Support Vector Machine, Gaussian Naïve Bayes, Decision Trees, Extra Trees, Bagging Classifier, Random Forests, Logistic Regression and Adaptive Boosting Classifier were used. To sum up the whole discussion it is stated the results give high accuracy and prove that the proposed system is reliable and accurate for the detection and monitoring of waves. Furthermore, for the prediction of outcome, Adaptive Boosting Classifier has shown the best accuracy of 81.77% as compared with other classifiers.

근적외선 분광법 기반 비침습식 혈당 수치 추정 알고리즘 연구 (Research on a Non-invasive Blood Glucose level Estimation Algorithm based on Near- infrared Spectroscopy)

  • 강영만;한순희
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1353-1362
    • /
    • 2023
  • 혈당 수치를 확인하기 위해 사용하는 채혈식 혈당 측정기의 불편함을 해소하기 위한 다양한 방법이 시도되고 있다. 본 논문에서는 근적외선 센서를 이용하여 획득한 스펙트럼 데이터로부터 머신러닝 기술을 사용하여 비침습적으로 혈당 수치를 추정하고자 하였다. 연구에 사용한 비침습식 혈당측정기는 가시광선을 포함하여 총 6개로 구성된 근적외선 발광부와 이를 수신하는 수광부를 가지는데, 손가락과 같은 인체의 특정 부위에 대한 스펙트럼 데이터를 수집하기 위해 만든 기기이다. 혈당 수치에 따라 유의미한 차이가 있는지를 검증하기 위해 머신 러닝 알고리즘들을 통해 혈당 수치 추정을 시도하였다. 수집한 데이터에 5가지 머신 러닝 알고리즘 기법을 적용하면서 다양한 하이퍼 파라미터를 조정한 결과, 서포트 벡터 회귀 알고리즘이 가장 좋은 성능을 나타냄을 확인하였다.