• 제목/요약/키워드: predictive accuracy

검색결과 797건 처리시간 0.029초

건설현장 정형·비정형데이터를 활용한 기계학습 기반의 건설재해 예측 모델 개발 (Development of Machine Learning-based Construction Accident Prediction Model Using Structured and Unstructured Data of Construction Sites)

  • 조민건;이동환;박주영;박승희
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.127-134
    • /
    • 2022
  • 현재 국내 건설업에서는 꾸준히 증가하는 건설재해를 예방하기 위해 다양한 정책적 노력과 연구가 활발하게 진행되고 있다. 기존 연구에서 건설재해 예방을 위해 개발한 예측 모델의 경우, 주로 정형데이터만을 활용하였기에 건설현장의 다양한 특성을 충분히 고려하지 못한 예측 결과가 도출되었다. 따라서, 본 연구에서는 정형데이터와 텍스트 형식의 비정형데이터를 동시에 활용하여 건설현장의 특성을 충분히 고려할 수 있는 기계학습 기반 건설재해 사전 예측 모델을 개발하였다. 본 연구는 기계학습을 위해 건설공사 안전관리 종합정보망(CSI)의 최근 3년간 건설재해 데이터 6,826건을 수집하였다. 수집된 데이터 중 정형데이터의 학습은 5가지 알고리즘의 성능 분석을 통해 Decision forest 알고리즘을 사용하였고 비정형데이터의 학습은 BERT 언어모델을 사용하였다. 정형 및 비정형데이터를 동시에 활용한 건설재해 예측 모델의 성능 비교 결과, 정형데이터만을 활용한 경우보다 약 20 % 향상된 95.41 %의 예측정확도가 도출되었다. 본 연구 결과, 비정형데이터를 동시에 활용함으로써 예측 모델의 효과적인 성능 향상을 확인하였으며, 보다 정확한 예측을 통한 건설재해 저감을 기대할 수 있다.

인공신경망과 가우시안 과정 회귀에 의한 규칙파의 조파기 입력파고 추정 (Estimation of the Input Wave Height of the Wave Generator for Regular Waves by Using Artificial Neural Networks and Gaussian Process Regression)

  • 오정은;오상호
    • 한국해안·해양공학회논문집
    • /
    • 제34권6호
    • /
    • pp.315-324
    • /
    • 2022
  • 2차원 조파수조 내에서 취득된 규칙파 실험데이터를 머신러닝 기법으로 분석하여 천수 변형을 경험한 파랑으로부터 조파기의 입력파고를 예측하는 모델을 수립하고 그 성능을 검증하였다. 이를 위해 가장 대표적인 머신러닝 기법인 인공신경망(NN)과 비모수 회귀분석 방법 중 하나인 가우시안 과정 회귀(GPR) 모델을 각각 수립하고 두 모델의 예측 성능을 비교하였다. 전체 실험자료를 모두 한꺼번에 활용한 경우와 쇄파 발생 여부에 따라 자료를 구분한 경우에 대해 독립적으로 분석을 수행하였다. 데이터를 구분하지 않은 경우에는 NN 및 GPR 모델 모두 조파기 입력파고 값과 계측값 사이의 오차가 비교적 크게 나타났다. 반면에 데이터를 비쇄파 및 쇄파 조건으로 구분하면 조파기 입력파고의 예측 정확도가 크게 향상되었다. 두 모델 중에서는 NN 모델보다 GPR 모델의 성능이 전반적으로 더 우수한 것으로 나타났다.

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

Development of a lateral flow dipstick test for the detection of 4 strains of Salmonella spp. in animal products and animal production environmental samples based on loop-mediated isothermal amplification

  • Wirawan Nuchchanart;Prapasiri Pikoolkhao;Chalermkiat Saengthongpinit
    • Animal Bioscience
    • /
    • 제36권4호
    • /
    • pp.654-670
    • /
    • 2023
  • Objective: This study aimed to develop loop-mediated isothermal amplification (LAMP) combined with lateral flow dipstick (LFD) and compare it with LAMP-AGE, polymerase chain reaction (PCR), and standard Salmonella culture as reference methods for detecting Salmonella contamination in animal products and animal production environmental samples. Methods: The SalInvA01 primer, derived from the InvA gene and designed as a new probe for LFD detection, was used in developing this study. Adjusting for optimal conditions by temperature, time, and reagent concentration includes evaluating the specificity and limit of detection. The sampling of 120 animal product samples and 350 animal production environmental samples was determined by LAMP-LFD, comparing LAMP-AGE, PCR, and the culture method. Results: Salmonella was amplified using optimal conditions for the LAMP reaction and a DNA probe for LFD at 63℃ for 60 minutes. The specificity test revealed no cross-reactivity with other microorganisms. The limit of detection of LAMP-LFD in pure culture was 3×102 CFU/mL (6 CFU/reaction) and 9.01 pg/μL in genomic DNA. The limit of detection of the LAMP-LFD using artificially inoculated in minced chicken samples with 5 hours of pre-enrichment was 3.4×104 CFU/mL (680 CFU/reaction). For 120 animal product samples, Salmonella was detected by the culture method, LAMP-LFD, LAMP-AGE, and PCR in 10/120 (8.3%). In three hundred fifty animal production environmental samples, Salmonella was detected in 91/350 (26%) by the culture method, equivalent to the detection rates of LAMP-LFD and LAMP-AGE, while PCR achieved 86/350 (24.6%). When comparing sensitivity, specificity, positive predictive value, and accuracy, LAMP-LFD showed the best results at 100%, 95.7%, 86.3%, and 96.6%, respectively. For Kappa index of LAMP-LFD, indicated nearly perfect agreement with culture method. Conclusion: The LAMP-LFD Salmonella detection, which used InvA gene, was highly specific, sensitive, and convenient for identifying Salmonella. Furthermore, this method could be used for Salmonella monitoring and primary screening in animal products and animal production environmental samples.

소아 척추 결핵: 투약 후의 병의 정지와 치유점, 그리고 후만 변형 (Spinal Tuberculosis in Children: Predictable Kyphotic Deformity after Cure of the Tuberculosis)

  • 문명상;김동현;김상재;문한림;김성수;김성심
    • 대한정형외과학회지
    • /
    • 제52권1호
    • /
    • pp.73-82
    • /
    • 2017
  • 목적: 화학요법만으로 치료한 소아 척추 결핵 환아들에서의 후만의 경시적 변화를 분석하였다. 대상 및 방법: 2세부터 15세 사이의 101명을 대상으로 하여 후향적으로 단순 방사선 영상과 소수에게서 자기공명영상을 이용하여 치료 시작 시와 치료 종결 시의 잔존 성장판에 의한 후만 변형의 변화를 살폈다. 결과: 영상상 초진 시 추간판의 완전 파괴로 판정한 예들은 경추의 경우 40명 중 2명(5.0%), 흉추 내에서는 30명 중 8예(26.7%), 그리고 요천추에서는 31명 중 6명(19.4%)이었다. 나머지 예들에서는 성장판이 완전하게 또는 부분적으로 잔존하는 것으로 판정하였다. 101명 중 후만 변형이 변치 않고 유지된 경우는 20명(19.8%), 후만각 감소 예는 14명(13.9%), 그리고 후만각의 증가 예는 67명(66.3%)에서 관찰되었다. 결론: 반수 이상의 환아에서 치료 시작 시점에서 이미 병이 심히 진행되었던 것을 알 수 있었다. 후만 변형의 진행 여부는 일차적으로 치료 시작 시점에서 예측 가능하나 그 정확도가 떨어지므로 후만 변형의 변화의 보다 정확한 증거를 확인할 수 있는 투약 종료 시점에서 실시할 것을 권한다. 진행형과 자연 교정군에서는 성장 종료 시까지의 추적 관찰이 필요하다.

프로세스 마이닝을 활용한 온라인 교육 오픈 플랫폼 내 학습 패턴 분석 방법 개발 (Toward understanding learning patterns in an open online learning platform using process mining)

  • 김태영;김효민;조민수
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.285-301
    • /
    • 2023
  • 비대면 교육의 중요성 및 필요에 따른 수요가 증가함에 따라 국내외 온라인 교육 오픈 플랫폼이 활성화되고 있다. 본 플랫폼은 대학 등 교육 전문기관과 달리 학습자의 자율성이 높은 특징을 가지며 이에 따라 개인화된 학습 도구를 지원하기 위한 학습 행동 데이터의 분석 연구가 중요시 되고 있다. 실제적인 학습 행동을 이해하고 패턴을 도출하기 위하여 프로세스 마이닝이 다수 활용되었지만 온라인 교육 플랫폼과 같이 자기 관리형(Self-regulated) 환경에서의 학습 로그를 기반한 사례는 부족하다. 또한, 대부분 프로세스 모델 도출 등의 모델 관점에서의 접근이며 분석 결과의 실제적인 적용을 위한 개별 패턴 및 인스턴스 관점에서의 방법 제시는 미흡하다. 본 연구에서는 온라인 교육 오픈 플랫폼 내 학습 패턴을 파악하기 위하여 프로세스 마이닝을 활용한 분석 방법을 제시한다. 학습 패턴을 다각도로 분석하기 위하여 모델, 패턴, 인스턴스 관점에서의 분석 방법을 제시하며, 프로세스 모델 발견, 적합도 검사, 군집화 기법, 예측 알고리즘 등 다양한 기법을 활용한다. 본 방법은 국내 오픈 교육 플랫폼 내 기계학습 관련 강좌의 학습 로그를 추출하여 분석하였다. 분석 결과 온라인 강의의 특성에 맞게 비구조화된 프로세스 모델을 도출할 수 있었으며 구체적으로 한 개의 표준 학습 패턴과 세 개의 이상 학습 패턴으로 세분화할 수 있었다. 또한, 인스턴스별 패턴 분류 예측 모델을 도출한 결과 전체 흐름 중 초기 30%의 흐름을 바탕으로 예측하였을 때 0.86의 분류 정확도를 보였다. 본 연구는 프로세스 마이닝을 활용하여 학습자의 패턴을 체계적으로 분석한다는 점에서 기여점을 가진다.

LSTM을 활용한 고속도로 교통정보 예측 모델 개발 방법론 (Methodology for Developing a Predictive Model for Highway Traffic Information Using LSTM)

  • 이요셉;진형석;김예진;박성호;윤일수
    • 한국ITS학회 논문지
    • /
    • 제22권5호
    • /
    • pp.1-18
    • /
    • 2023
  • 최근 빅데이터 및 딥러닝 기술의 발전으로 다양한 교통정보가 널리 수집 및 활용되고 있다. 특히 시계열 특성을 갖는 교통정보 예측 분야에서는 장단기 메모리(long short term memory, LSTM)가 널리 사용되고 있다. LSTM에 입력되는 시계열 데이터의 추세, 계절성, 주기 등이 상이하기 때문에 시계열 데이터를 기반으로 한 예측 모델에서도 데이터의 특성에 따라 하이퍼 파라미터의 적합한 값을 찾는 시행착오법이 필수적이다. 이에 적합한 하이퍼 파라미터를 찾는 방법론이 정립된다면, 정확도가 높은 모델 구성에 소요되는 시간을 줄일 수 있다. 따라서, 본 연구에서는 국내 고속도로 차량검지기 데이터와 LSTM을 기반으로 교통정보 예측 모델을 개발하였으며, LSTM의 하이퍼 파라미터별 평가지표 변화를 통해 예측 결과에 미치는 영향평가를 수행하였다. 또한, 이를 기반으로 교통분야에서 고속도로 교통정보 예측에 적합한 하이퍼 파라미터를 찾는 방법론을 제시하였다.

Neutrophil to Lymphocyte Ratio and Serum Biomarkers : A Potential Tool for Prediction of Clinically Relevant Cerebral Vasospasm after Aneurysmal Subarachnoid Hemorrhage

  • Osman Kula;Burak Gunay;Merve Yaren Kayabas;Yener Akturk;Ezgi Kula;Banu Tutunculer;Necdet Sut;Serdar Solak
    • Journal of Korean Neurosurgical Society
    • /
    • 제66권6호
    • /
    • pp.681-689
    • /
    • 2023
  • Objective : Subarachnoid hemorrhage (SAH) is a condition characterized by bleeding in the subarachnoid space, often resulting from the rupture of a cerebral aneurysm. Delayed cerebral ischemia caused by vasospasm is a significant cause of mortality and morbidity in SAH patients, and inflammatory markers such as systemic inflammatory response index (SIRI), systemic inflammatory index (SII), neutrophil-to-lymphocyte ratio (NLR), and derived NLR (dNLR) have shown potential in predicting clinical vasospasm and outcomes in SAH patients. This article aims to investigate the relationship between inflammatory markers and cerebral vasospasm after aneurysmatic SAH (aSAH) and evaluate the predictive value of various indices, including SIRI, SII, NLR, and dNLR, in predicting clinical vasospasm. Methods : A retrospective analysis was performed on a cohort of 96 patients who met the inclusion criteria out of a total of 139 patients admitted Trakya University Hospital with a confirmed diagnosis of aSAH between January 2013 and December 2021. Diagnostic procedures, neurological examinations, and laboratory tests were performed to assess the patients' condition. The Student's t-test compared age variables, while the chi-square test compared categorical variables between the non-vasospasm (NVS) and vasospasm (VS) groups. Receiver operating characteristic (ROC) curve analyses were used to evaluate the diagnostic accuracy of laboratory parameters, calculating the area under the ROC curve, cut-off values, sensitivity, and specificity. A significance level of p<0.05 was considered statistically significant. Results : The study included 96 patients divided into two groups : NVS and VS. Various laboratory parameters, such as NLR, SII, and dNLR, were measured daily for 15 days, and statistically significant differences were found in NLR on 7 days, with specific cut-off values identified for each day. SII showed a significant difference on day 9, while dNLR had significant differences on days 2, 4, and 9. Graphs depicting the values of these markers for each day are provided. Conclusion : Neuroinflammatory biomarkers, when used alongside radiology and scoring scales, can aid in predicting prognosis, determining severity and treatment decisions for aSAH, and further studies with larger patient groups are needed to gain more insights.

Comparison of One- and Two-Region of Interest Strain Elastography Measurements in the Differential Diagnosis of Breast Masses

  • Hee Jeong Park;Sun Mi Kim;Bo La Yun;Mijung Jang;Bohyoung Kim;Soo Hyun Lee;Hye Shin Ahn
    • Korean Journal of Radiology
    • /
    • 제21권4호
    • /
    • pp.431-441
    • /
    • 2020
  • Objective: To compare the diagnostic performance and interobserver variability of strain ratio obtained from one or two regions of interest (ROI) on breast elastography. Materials and Methods: From April to May 2016, 140 breast masses in 140 patients who underwent conventional ultrasonography (US) with strain elastography followed by US-guided biopsy were evaluated. Three experienced breast radiologists reviewed recorded US and elastography images, measured strain ratios, and categorized them according to the American College of Radiology breast imaging reporting and data system lexicon. Strain ratio was obtained using the 1-ROI method (one ROI drawn on the target mass), and the 2-ROI method (one ROI in the target mass and another in reference fat tissue). The diagnostic performance of the three radiologists among datasets and optimal cut-off values for strain ratios were evaluated. Interobserver variability of strain ratio for each ROI method was assessed using intraclass correlation coefficient values, Bland-Altman plots, and coefficients of variation. Results: Compared to US alone, US combined with the strain ratio measured using either ROI method significantly improved specificity, positive predictive value, accuracy, and area under the receiver operating characteristic curve (AUC) (all p values < 0.05). Strain ratio obtained using the 1-ROI method showed higher interobserver agreement between the three radiologists without a significant difference in AUC for differentiating breast cancer when the optimal strain ratio cut-off value was used, compared with the 2-ROI method (AUC: 0.788 vs. 0.783, 0.693 vs. 0.715, and 0.691 vs. 0.686, respectively, all p values > 0.05). Conclusion: Strain ratios obtained using the 1-ROI method showed higher interobserver agreement without a significant difference in AUC, compared to those obtained using the 2-ROI method. Considering that the 1-ROI method can reduce performers' efforts, it could have an important role in improving the diagnostic performance of breast US by enabling consistent management of breast lesions.

Machine Learning-Based Prediction of COVID-19 Severity and Progression to Critical Illness Using CT Imaging and Clinical Data

  • Subhanik Purkayastha;Yanhe Xiao;Zhicheng Jiao;Rujapa Thepumnoeysuk;Kasey Halsey;Jing Wu;Thi My Linh Tran;Ben Hsieh;Ji Whae Choi;Dongcui Wang;Martin Vallieres;Robin Wang;Scott Collins;Xue Feng;Michael Feldman;Paul J. Zhang;Michael Atalay;Ronnie Sebro;Li Yang;Yong Fan;Wei-hua Liao;Harrison X. Bai
    • Korean Journal of Radiology
    • /
    • 제22권7호
    • /
    • pp.1213-1224
    • /
    • 2021
  • Objective: To develop a machine learning (ML) pipeline based on radiomics to predict Coronavirus Disease 2019 (COVID-19) severity and the future deterioration to critical illness using CT and clinical variables. Materials and Methods: Clinical data were collected from 981 patients from a multi-institutional international cohort with real-time polymerase chain reaction-confirmed COVID-19. Radiomics features were extracted from chest CT of the patients. The data of the cohort were randomly divided into training, validation, and test sets using a 7:1:2 ratio. A ML pipeline consisting of a model to predict severity and time-to-event model to predict progression to critical illness were trained on radiomics features and clinical variables. The receiver operating characteristic area under the curve (ROC-AUC), concordance index (C-index), and time-dependent ROC-AUC were calculated to determine model performance, which was compared with consensus CT severity scores obtained by visual interpretation by radiologists. Results: Among 981 patients with confirmed COVID-19, 274 patients developed critical illness. Radiomics features and clinical variables resulted in the best performance for the prediction of disease severity with a highest test ROC-AUC of 0.76 compared with 0.70 (0.76 vs. 0.70, p = 0.023) for visual CT severity score and clinical variables. The progression prediction model achieved a test C-index of 0.868 when it was based on the combination of CT radiomics and clinical variables compared with 0.767 when based on CT radiomics features alone (p < 0.001), 0.847 when based on clinical variables alone (p = 0.110), and 0.860 when based on the combination of visual CT severity scores and clinical variables (p = 0.549). Furthermore, the model based on the combination of CT radiomics and clinical variables achieved time-dependent ROC-AUCs of 0.897, 0.933, and 0.927 for the prediction of progression risks at 3, 5 and 7 days, respectively. Conclusion: CT radiomics features combined with clinical variables were predictive of COVID-19 severity and progression to critical illness with fairly high accuracy.