• 제목/요약/키워드: 의사결정나무 모형

검색결과 228건 처리시간 0.023초

공작기계의 절삭용 인서트의 잔여 유효 수명 예측 모형 (Machine Learning Model for Predicting the Residual Useful Lifetime of the CNC Milling Insert)

  • 최원근;김흥섭;고봉진
    • 한국항행학회논문지
    • /
    • 제27권1호
    • /
    • pp.111-118
    • /
    • 2023
  • 스마트팩토리의 구축을 위해서는 제조환경에서 여러 센서 및 기기 등을 연결하여 데이터를 수집하고, 데이터 분석을 통해 생산설비 등의 장애를 진단하거나 예측하여야 한다. 본 논문에서는 공작기계에서 제품을 가공하기 위해 사용되는 절삭용 인서트의 잔여 유효 수명을 예측하기 위해 진동 신호를 기반으로 한 가중화 k-최근접이웃(Weighted k-NN) 알고리즘, 의사결정나무(Decision Tree), 서포트벡터회귀(SVM), XGBoost, 랜덤포레스트(Random forest), 1차원 합성곱신경망(1D-CNN), 그리고 진동 신호를 FFT한 주파수 스펙트럼에 대해 알아보았다. 연구결과, 주파수 스펙트럼으로는 잔여 유효수명의 정확한 예측에 대해서는 신빙성있는 기준을 제공하지 못한다는 것을 알수 있었고, 예측 모델 중 가중화 k-최근접이웃 알고리즘이 MAE가 0.0013, MSE가 0.004, RMSE가 0.0192로 가장 우수한 성능을 나타내었다. 이는 가중화 k-최근접이웃 알고리즘에 의해 예측되는 인서트의 잔여 유효 수명의 오차가 0.001초 수준으로 평가되어, 실제 산업현장에 적용이 가능한 수준으로 사료된다.

데이터마이닝을 활용한 사랑의 형태에 따른 연인관계 몰입수준 및 관계 지속여부 예측 (Prediction of commitment and persistence in heterosexual involvements according to the styles of loving using a datamining technique)

  • 박윤주
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.69-85
    • /
    • 2016
  • 연인과의 성공적인 관계형성은 인생의 만족감을 결정짓는 핵심적인 요소 중 하나이다. 기존에 심리학 분야에서는 성공적인 연인관계에 영향을 미치는 요인들에 대한 다양한 연구가 수행되어 왔으나, 주로 통계적인 분석기법에 기반하고 있기 때문에 복잡한 비선형의 관계를 분석하고, 특징을 추출하는 데에는 한계가 있었다. 이에, 본 연구는, 기존의 통계적인 분석 기법과 더불어, 데이터마이닝의 의사결정나무 분석기법을 활용하여 사랑의 형태에 따른 연인관계의 몰입(commitment) 수준과 관계지속 여부를 분석하였다. 특히, 기존 연구에서 도출된 주요 변인들 이외에 사랑의 여섯 가지 형태인 에로스(eros), 루두스(ludus), 스트로게(storge), 매니아(mania), 프래그마(pragma) 그리고 아가페(agape)를 추가적으로 고려하여, 이들이 연인관계에서 서로에 대한 몰입수준 및 연인관계 지속여부에 어떠한 영향을 미치는지 분석하고, 예측하는 모형을 수립하였다. 본 연구에는 실제 남녀커플 105쌍, 총 210명에 대한 데이터가 활용되었다. 본 연구결과 연인관계 몰입수준 및 관계 지속여부의 영향요인으로, 기존에 심리학 분야에서 제시된 변수들 이외에, 에로스, 아가페, 프래그마 등이 유의한 영향을 미친다는 것을 확인하였다. 특히, 남성은 아가페적 사랑의 형태가 몰입에 중요한 영향을 미치는 반면, 여성은 에로스적 사랑의 형태가 더욱 중요한 영향을 미치는 것으로 나타났다. 또한, 연인관계 지속여부에는 남성의 나르시시즘, 만족, 투자 및 매니아적 성향이 영향을 주고 있는 것으로 나타난 반면, 여성의 경우, 여성이 남성을 매니아적으로 사랑하는 정도만이 영향을 주고 있어, 남성이 관계의 지속 또는 결별에 더욱 결정적인 영향을 미치고 있는 것을 알 수 있었다. 이러한 연구는 데이터마이닝의 적용분야를 심리학 영역으로 확장한 융합연구로, 연인관계에 대한 새로운 분석을 시도하였다는 점에서 의의가 있으며, 조화로운 연인관계를 형성하는데 실질적인 시사점을 제공할 수 있을 것으로 기대된다.

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

카노모형에서 의사결정나무모형을 이용한 통상우편서비스 품질속성 분석 (An Analysis of Ordinary Mail Service Quality Attributes using Kano Model and Decision Tree Model)

  • 최현덕;류문찬
    • 품질경영학회지
    • /
    • 제44권4호
    • /
    • pp.883-895
    • /
    • 2016
  • Purpose: The demand for ordinary mail services supplied by 'Korea POST' is decreasing due to the opening of mail service market and the growth of alternative communication media such as e-mail and SNS. To overcome this situation it is urgent to introduce new services that can be able to appeal customers and to improve existing services. Methods: A field survey is conducted to corporate customers who send ordinary mails and individual customers who receive these mails, respectively. Quality attributes of ordinary mail services are classified by two-dimensional perspectives in terms of Kano model. Decision tree model is utilized for classifying the quality attributes. Comparative analyses are done whether there are perceived differences on each quality attributes between corporate customers and individual customers. Results: Quality attributes such as 'discount postal charges', 'sending small packages by simply dropping it into a mail box', 'sending a mail of any appearance', 'delivering a mail anywhere', and 'receiving a mail at a preferred time where a customer is located ' are classified differently according to some market segments, while most of the quality attributes are classified as attractive or one-dimensional. Conclusion: Decision tree model has been found to be most effective to classify quality attributes for each market segment especially when trying to classify quality attributes belonging to 'gray areas'. Based on the perceived differences on quality attributes among customers, strategic implications are suggested to obtain potential customers and to have competitive advantages.

머신러닝을 이용한 급성심근경색증 환자의 퇴원 시 사망 중증도 보정 방법 개발에 대한 융복합 연구 (Convergence Study in Development of Severity Adjustment Method for Death with Acute Myocardial Infarction Patients using Machine Learning)

  • 백설경;박혜진;강성홍;최준영;박종호
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.217-230
    • /
    • 2019
  • 본 연구는 기존 동반질환을 이용한 중증도 보정 방법의 제한점을 보완하기 위해 급성심근경색증 환자의 맞춤형 중증도 보정방법을 개발하고, 이의 타당성을 평가하기 위해 수행되었다. 이를 위하여 질병관리본부에서 2006년부터 2015년까지 10년간 수집한 퇴원손상심층조사 자료 중 주진단이 급성심근경색증인 한국표준질병사인분류(KCD-7) 코드 I20.0~I20.9의 대상자를 추출하였고, 동반질환 중증도 보정 도구로는 기존 활용되고 있는 CCI(Charlson comorbidity index), ECI(Elixhauser comorbidity index)와 새로이 제안하는 CCS(Clinical Classification Software)를 사용하였다. 이에 대한 중증도 보정 사망예측모형 개발을 위하여 머신러닝 기법인 로지스틱 회귀분석, 의사결정나무, 신경망, 서포트 벡터 머신기법을 활용하여 비교하였고 각각의 AUC(Area Under Curve)를 이용하여 개발된 모형을 평가하였다. 이를 평가한 결과 중증도 보정도구로는 CCS 가 가장 우수한 것으로 나타났으며, 머신러닝 기법 중에서는 서포트 벡터 머신을 이용한 모형의 예측력이 가장 우수한 것으로 확인되었다. 이에 향후 의료서비스 결과평가 등 중증도 보정을 위한 연구에서는 본 연구에서 제시한 맞춤형 중증도 보정방법과 머신러닝 기법을 활용하도록 하는 것을 제안한다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.

한국과 미국 의료기관의 중증도 보정 사망률 비교 (The Comparison of Risk-adjusted Mortality Rate between Korea and United States)

  • 정태경;강성홍
    • 디지털융복합연구
    • /
    • 제11권5호
    • /
    • pp.371-384
    • /
    • 2013
  • 본 연구에서는 한국 및 미국의 퇴원환자 자료를 이용하여 한국 및 미국의 중증도 보정 사망 모형을 개발하고 개발된 중증도 보정 사망모형에 따라 중증도 보정 사망률 지표를 산출 및 비교한 다음 이를 통해 국내 의료기관 사망률 관리 방안을 제시하고자 하였다. 한국 및 미국 의료기관의 중증도 보정 사망 모형은 데이터마이닝기법인 다중 로지스틱회귀분석 기법, 의사결정나무분석 기법을 이용하여 개발하였다. 개발된 의료기관의 중증도 보정 사망모형에 따라 한국 및 미국 의료기관의 중증도 보정 사망률을 산출한 결과 한국은 매년 증가하고 있는 반면 미국은 매년 감소하고 있는 것으로 나타나 한국과 미국간에 차이가 있었다. 의료기관의 병상규모별 중증도 보정 사망률의 변이 또한 한국이 미국보다 높았다. 국내 의료기관의 사망률 관리를 위해서는 의료기관 자체내에서 사망환자 관리가 가능한 대형 의료기관들의 경우 의료기관 중증도 보정 사망률 평가 결과 공개를 통해 지속적으로 사망률 관리를 유도하고, 의료기관 자체내에서 사망률 관리가 힘든 중소병원들은 국가 차원에서 파악한 국내 의료기관 사망환자 관리의 문제점 및 이를 개선할 수 있는 개선방안을 토대로 사망률 관리 컨설팅을 시행하는 등 의료기관 사망환자 관리 사업을 진행하여야 한다.

퇴원손상심층조사 자료를 이용한 의료기관 중증도 보정 사망비 비교 (Comparison of Hospital Standardized Mortality Ratio Using National Hospital Discharge Injury Data)

  • 박종호;김유미;김성수;김원중;강성홍
    • 한국산학기술학회논문지
    • /
    • 제13권4호
    • /
    • pp.1739-1750
    • /
    • 2012
  • 본 연구는 의료서비스의 결과지표인 의료기관 중증도 보정 사망비(HSMR)를 산출하고, 비교하여 행정자료를 이용한 의료서비스 결과를 평가할 수 있는 방안을 마련하고자 수행되었다. 이를 위해서 질병관리본부의 2007-2008년의 퇴원손상환자 63,664건의 자료를 분석하였다. 중증도 보정모형 개발을 위해 데이터마이닝을 이용한 의사결정나무와 로지스틱 회귀분석을 실시하였으며, 최종 모형으로 선정된 로지스틱 회귀분석에는 성별, 재원일수, Elixhauser 상병지수, 입원경로, 주상병 변수가 포함되었다. 퇴원시 사망에 영향을 끼치는 이러한 변수를 보정 후 병원간의 중증도 보정 사망비(HSMR)를 비교한 결과 병원간의 중증도 보정 사망비(HSMR)는 차이가 있는 것으로 나타남에 따라 병원의 의료서비스 수준 차이가 있는 것이 확인되었다(HSMR 범위: 55.6-201.6). 본 연구를 통하여 병원간의 퇴원시 사망률을 비교할 수 있는 방법이 개발되었으므로 향후에 이를 이용하여 다양한 의료의 질 향상 활동을 할 수 있는 방안을 마련하여야 할 것이다.

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.