• 제목/요약/키워드: Binary Validation

검색결과 59건 처리시간 0.025초

한의 체중 조절 프로그램에 참여한 과체중, 비만 환자에서의 머신러닝 기법을 적용한 체중 감량 예측 연구 (Application of Machine Learning to Predict Weight Loss in Overweight, and Obese Patients on Korean Medicine Weight Management Program)

  • 김은주;박영배;최가혜;임영우;옥지명;노은영;송태민;강지훈;이향숙;김서영
    • 대한한의학회지
    • /
    • 제41권2호
    • /
    • pp.58-79
    • /
    • 2020
  • Objectives: The purpose of this study is to predict the weight loss by applying machine learning using real-world clinical data from overweight and obese adults on weight loss program in 4 Korean Medicine obesity clinics. Methods: From January, 2017 to May, 2019, we collected data from overweight and obese adults (BMI≥23 kg/m2) who registered for a 3-month Gamitaeeumjowi-tang prescription program. Predictive analysis was conducted at the time of three prescriptions, and the expected reduced rate and reduced weight at the next order of prescription were predicted as binary classification (classification benchmark: highest quartile, median, lowest quartile). For the median, further analysis was conducted after using the variable selection method. The data set for each analysis was 25,988 in the first, 6,304 in the second, and 833 in the third. 5-fold cross validation was used to prevent overfitting. Results: Prediction accuracy was increased from 1st to 2nd and 3rd analysis. After selecting the variables based on the median, artificial neural network showed the highest accuracy in 1st (54.69%), 2nd (73.52%), and 3rd (81.88%) prediction analysis based on reduced rate. The prediction performance was additionally confirmed through AUC, Random Forest showed the highest in 1st (0.640), 2nd (0.816), and 3rd (0.939) prediction analysis based on reduced weight. Conclusions: The prediction of weight loss by applying machine learning showed that the accuracy was improved by using the initial weight loss information. There is a possibility that it can be used to screen patients who need intensive intervention when expected weight loss is low.

Development of a Classification Model for Driver's Drowsiness and Waking Status Using Heart Rate Variability and Respiratory Features

  • Kim, Sungho;Choi, Booyong;Cho, Taehwan;Lee, Yongkyun;Koo, Hyojin;Kim, Dongsoo
    • 대한인간공학회지
    • /
    • 제35권5호
    • /
    • pp.371-381
    • /
    • 2016
  • Objective:This study aims to evaluate the features of heart rate variability (HRV) and respiratory signals as indices for a driver's drowsiness and waking status in order to develop the classification model for a driver's drowsiness and waking status using those features. Background: Driver's drowsiness is one of the major causal factors for traffic accidents. This study hypothesized that the application of combined bio-signals to monitor the alertness level of drivers would improve the effectiveness of the classification techniques of driver's drowsiness. Method: The features of three heart rate variability (HRV) measurements including low frequency (LF), high frequency (HF), and LF/HF ratio and two respiratory measurements including peak and rate were acquired by the monotonous car driving simulation experiments using the photoplethysmogram (PPG) and respiration sensors. The experiments were repeated a total of 50 times on five healthy male participants in their 20s to 50s. The classification model was developed by selecting the optimal measurements, applying a binary logistic regression method and performing 3-fold cross validation. Results: The power of LF, HF, and LF/HF ratio, and the respiration peak of drowsiness status were reduced by 38%, 22%, 31%, and 7%, compared to those of waking status, while respiration rate was increased by 3%. The classification sensitivity of the model using both HRV and respiratory features (91.4%) was improved, compared to that of the model using only HRV feature (89.8%) and that using only respiratory feature (83.6%). Conclusion: This study suggests that the classification of driver's drowsiness and waking status may be improved by utilizing a combination of HRV and respiratory features. Application: The results of this study can be applied to the development of driver's drowsiness prevention systems.

Predicting Mortality in Patients with Tuberculous Destroyed Lung Receiving Mechanical Ventilation

  • Kim, Won-Young;Kim, Mi-Hyun;Jo, Eun-Jung;Eom, Jung Seop;Mok, Jeongha;Kim, Ki Uk;Park, Hye-Kyung;Lee, Min Ki;Lee, Kwangha
    • Tuberculosis and Respiratory Diseases
    • /
    • 제81권3호
    • /
    • pp.247-255
    • /
    • 2018
  • Background: Patients with acute respiratory failure secondary to tuberculous destroyed lung (TDL) have a poor prognosis. The aim of the present retrospective study was to develop a mortality prediction model for TDL patients who require mechanical ventilation. Methods: Data from consecutive TDL patients who had received mechanical ventilation at a single university-affiliated tertiary care hospital in Korea were reviewed. Binary logistic regression was used to identify factors predicting intensive care unit (ICU) mortality. A TDL on mechanical Ventilation (TDL-Vent) score was calculated by assigning points to variables according to ${\beta}$ coefficient values. Results: Data from 125 patients were reviewed. A total of 36 patients (29%) died during ICU admission. On the basis of multivariate analysis, the following factors were included in the TDL-Vent score: age ${\geq}65$ years, vasopressor use, and arterial partial pressure of oxygen/fraction of inspired oxygen ratio <180. In a second regression model, a modified score was then calculated by adding brain natriuretic peptide. For TDL-Vent scores 0 to 3, the 60-day mortality rates were 11%, 27%, 30%, and 77%, respectively (p<0.001). For modified TDL-Vent scores 0 to ${\geq}3$, the 60-day mortality rates were 0%, 21%, 33%, and 57%, respectively (p=0.001). For both the TDL-Vent score and the modified TDL-Vent score, the areas under the receiver operating characteristic curve were larger than that of other illness severity scores. Conclusion: The TDL-Vent model identifies TDL patients on mechanical ventilation with a high risk of mortality. Prospective validation studies in larger cohorts are now warranted.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

인체 간세포주 HepG2 및 발광박테리아를 활용한 유기인계 난연제와 그 혼합물의 독성 스크리닝 (Toxicity of Organophosphorus Flame Retardants (OPFRs) and Their Mixtures in Aliivibrio fischeri and Human Hepatocyte HepG2)

  • 김선미;강경희;김지윤;나민주;최지원
    • 한국환경보건학회지
    • /
    • 제49권2호
    • /
    • pp.89-98
    • /
    • 2023
  • Background: Organophosphorus flame retardants (OPFRs) are a group of chemical substances used in building materials and plastic products to suppress or mitigate the combustion of materials. Although OPFRs are generally used in mixed form, information on their mixture toxicity is quite scarce. Objectives: This study aims to elucidate the toxicity and determine the types of interaction (e.g., synergistic, additive, and antagonistic effect) of OPFRs mixtures. Methods: Nine organophosphorus flame retardants, including TEHP (tris(2-ethylhexyl) phosphate) and TDCPP (tris(1,3-dichloro-2-propyl) phosphate), were selected based on indoor dust measurement data in South Korea. Nine OPFRs were exposed to the luminescent bacteria Aliivibrio fischeri for 30 minutes and the human hepatocyte cell line HepG2 for 48 hours. Chemicals with significant toxicity were only used for mixture toxicity tests in HepG2. In addition, the observed ECx values were compared with the predicted toxicity values in the CA (concentration addition) prediction model, and the MDR (model deviation ratio) was calculated to determine the type of interaction. Results: Only four chemicals showed significant toxicity in the luminescent bacteria assays. However, EC50 values were derived for seven out of nine OPFRs in the HepG2 assays. In the HepG2 assays, the highest to lowest EC50 were in the order of the molecular weight of the target chemicals. In the further mixture tests, most binary mixtures show additive interactions except for the two combinations that have TPhP (triphenyl phosphate), i.e., TPhP and TDCPP, and TPhP and TBOEP (tris(2-butoxyethyl) phosphate). Conclusions: Our data shows OPFR mixtures usually have additivity; however, more research is needed to find out the reason for the synergistic effect of TPhP. Also, the mixture experimental dataset can be used as a training and validation set for developing the mixture toxicity prediction model as a further step.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

LC-MS/MS를 이용한 조제유류 중 비오틴 함량 분석법 연구 (Establishment of Biotin Analysis by LC-MS/MS Method in Infant Milk Formulas)

  • 신용운;이화정;함현숙;신성철;강윤정;황경미;권용관;서일원;오재명;구용의
    • 한국식품위생안전성학회지
    • /
    • 제31권5호
    • /
    • pp.327-334
    • /
    • 2016
  • 본 연구는 "축산물의 가공기준 및 성분규격"에 기준규격은 설정되어 있지 않으나, 국제 기준과의 조화를 위해 규격 신설 검토 대상 성분인 비오틴의 분석법을 마련하고자 수행하였다. 조제유류에 미량으로 함유된 비오틴함량 분석을 위해 선택성과 정밀성이 뛰어난 LC-MS/MS를 이용한 분석법을 확립하고 시중에 유통중인 제품을 대상으로 적용성을 검토하였다. 비오틴 표준품을 이용하여 LC-MS/MS를 이용한 기기분석조건을 확립하고, 식품의 기준 및 규격 분석법을 참고로 0.01 M 인산이수소칼륨(pH 4.8) 용액을 이용하여 시료중의 비오틴을 추출하여 분석하였다. 분석법 검증은 특이성, 직선성, 검출한계 및 정량한계, 정확성, 정밀성에 대해 수행되었다. 5~60 ng/mL의 농도범위에서 $R^2=0.999$ 이상의 우수한 직선성을 확인할 수 있었으며, LOD와 LOQ는 각각 0.10, 0.31 ng/mL 이었다. CRM (NIST SRM 1849a) 및 표준물질 첨가법을 이용하여 정확성을 검토하였으며, CRM에서 103%, 조제분유에서 101~104%, 조제우유에서 99~101%의 회수율을 확인할 수 있었다. 정밀성을 검토한 결과 시료 채취량에 따른 상대표준편차가 조제분유 0.4~0.9%, 조제우유1.4~1.6%로 확인하였으며, 실험일자에 따른 재현성은 조제분유에서 1.3%, 조제우유에서 1.2%로 확인하였다. 본 연구에서 확립된 분석법을 적용하여 조제분유 39건, 조제우유 3건, 성장기용조제분유 23건 등 국내 유통중인 조제유류 65건에 대해 적용성 검토를 실시한 결과 전체시료에서 분석이 용이하였으며, 모두 표시기준에 적합함을 확인하였다.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.