• 제목/요약/키워드: 로지스틱 회귀 모델

검색결과 191건 처리시간 0.028초

머신러닝 기법을 이용한 약물 분류 방법 연구 (A Study on the Drug Classification Using Machine Learning Techniques)

  • Anmol Kumar Singh;Ayush Kumar;Adya Singh;Akashika Anshum;Pradeep Kumar Mallick
    • 산업과 과학
    • /
    • 제3권2호
    • /
    • pp.8-16
    • /
    • 2024
  • 본 논문에서는 인구통계학적, 생리학적 특성을 기반으로 환자에게 가장 적합한 약물을 예측하는 것을 목표로 하는 약물 분류 시스템을 제시한다. 데이터 세트에는 적절한 약물을 결정하기 위한 목적으로 연령, 성별, 혈압(BP), 콜레스테롤 수치, 나트륨 대 칼륨 비율(Na_to_K)과 같은 속성들이 포함된다. 본 연구에 사용된 모델은 KNN(K-Nearest Neighbors), 로지스틱 회귀 분석 및 Random Forest이다. 하이퍼파라미터를 최적화하기 위해 5겹 교차 검증을 갖춘 GridSearchCV를 활용하였으며, 각 모델은 데이터 세트에서 훈련 및 테스트 되었다. 초매개변수 조정 유무에 관계없이 각 모델의 성능은 정확도, 혼동 행렬, 분류 보고서와 같은 지표를 사용하여 평가되었다. GridSearchCV를 적용하지 않은 모델의 정확도는 0.7, 0.875, 0.975인 반면, GridSearchCV를 적용한 모델의 정확도는 0.75, 1.0, 0.975로 나타났다. GridSearchCV는 로지스틱 회귀 분석을 세 가지 모델 중 약물 분류에 가장 효과적인 모델로 식별했으며, K-Nearest Neighbors가 그 뒤를 이었고 Na_to_K 비율은 결과를 예측하는 데 중요한 특징인 것으로 밝혀졌다.

석면 해체 작업의 위험성평가모델 비교 분석 (A Comparative Analysis of Risk Assessment Models for Asbestos Demolition)

  • 김동규;김민승;이수민;김유진;한승우
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 가을 학술논문 발표대회
    • /
    • pp.99-100
    • /
    • 2022
  • As the danger of exposure to the asbestos has been revealed, the importance of demolition asbestos in existing buildings has been raised. Extensive body of study has been conducted to evaluate the risk of demolition asbestos, but there were confined types of variables caused by not reflecting categorical information and limitations in collecting quantitative information. Thus, this study aims to derive a model that predicts the risk in workplace of demolition asbestos by collecting categorical and continuous variables. For this purpose, categorical and continuous variables were collected from asbestos demolition reports, and the risk assessment score was set as the dependent variable. In this study, the influence of each variable was identified using logistic regression, and the risk prediction model methodologies were compared through decision tree regression and artificial neural network. As a result, a conditional risk prediction model was derived to evaluate the risk of demolition asbestos, and this model is expected to be used to ensure the safety of asbestos demolition workers.

  • PDF

FR과 LR 앙상블 모형을 이용한 산사태 취약성 지도 제작 및 검증 (Landslide Susceptibility Mapping Using Ensemble FR and LR models at the Inje Area, Korea)

  • 김진수;박소영
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.19-27
    • /
    • 2017
  • 본 연구의 목적은 인제읍을 대상으로 빈도비와 로지스틱 회귀분석 모델을 통합한 앙상블 모델을 이용하여 산사태 취약성을 분석하고, 예측 정확도를 비교하는 것이다. 산사태 위치는 산사태 발생 전 후에 촬영된 항공사진을 이용하여 추출되었다. 추출된 총 422개의 산사태는 산사태 취약성 분석을 위해 훈련용 (70%)과 검증용 (30%) 자료로 랜덤하게 분류되었다. 산사태 관련인자는 고도, 경사도, 경사향, 배수로부터의 거리, 토양수분지수, 하천강도지수, 토질, 유효토심, 영급, 경급, 밀도, 임상 등 총 12개의 인자를 이용하였다. 산사태 및 산사태 관련인자는 공간데이터베이스로 구축된 뒤 빈도비와 앙상블 모델을 이용하여 산사태와 산사태 관련 인자 간 상관관계를 분석하였다. 그 결과를 바탕으로 각 모델별 산사태 취약성 지도를 작성하였고, relative operating characteristics(ROC) 곡선을 이용하여 예측 정확도를 검증 및 비교하였다. 분석 결과, 앙상블 모델에 의해 작성된 산사태 취약성 지도는 75.2%의 예측 정확도를 보였고, 이 결과는 빈도비 모델에 의해 작성된 산사태 취약성 지도와 비교하여 예측 정확도가 약 2% 향상된 것으로 나타났다. 본 연구에서 작성된 산사태 취약성 지도는 향후 효과적인 토지이용 계획을 수립하고, 재난재해로 인한 피해를 경감시키는데 활용 가능할 것으로 판단된다.

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구에서는 주행 차량의 실시간 연료소모량을 예측할 수 있는 머신러닝 기법을 제안하고 그 특성을 분석하였다. 머신러닝 학습을 위해 실도로 주행을 실시하여 주행 속도, 가속도, 도로 구배와 함께 연료소모량을 측정하였다. 특성 데이터로 속도, 가속도, 도로구배를, 타깃으로 연료소모량을 지정하여 다양한 머신러닝 모델을 학습시켰다. 회귀법에 해당하는 K-최근접이웃회귀 및 선형회귀와 함께, 분류법에 해당하는 K-최근접이웃분류, 로지스틱회귀, 결정트리, 랜덤포레스트, 그래디언부스팅을 사용하였다. 실시간 연료소모량에 대한 예측 정확도는 0.5 ~ 0.6 수준으로 전반적으로 낮았고, 회귀법의 경우 분류법보다 정확도가 떨어졌다. 총연료소모량에 대한 예측 오차는 0.2 ~ 2.0% 수준으로 상당히 정확했고, 분류법보다 회귀법의 오차가 더 낮았다. 이는 예측 정확도의 기준으로 결정계수(R2)를 사용했기 때문인데, 이 값이 작을수록 타깃의 평균 부근에 예측치가 좁게 분포하기 때문이다. 따라서 실시간 연료소모량 예측에는 분류법이, 총연료소모량 예측에는 회귀법이 적합하다고 할 수 있다.

프라이버시 보존 데이터 학습을 위한 고효율 동형 암호 기법 (High-Efficiency Homomorphic Encryption Techniques for Privacy-Preserving Data Learning)

  • 심혜연;전유란;이일구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.419-422
    • /
    • 2024
  • 최근 인공지능 기술의 발전과 함께 기계학습과 빅데이터를 융합한 서비스가 증가하게 되었고, 무분별한 데이터 수집과 학습으로 인한 개인정보 유출 위험도가 커졌다. 따라서 프라이버시를 보호하면서 기계학습을 수행할 수 있는 기술이 중요해졌다. 동형암호 기술은 정보 주체자의 개인정보 기밀성을 유지하면서 기계학습을 할 수 있는 방법 중 하나이다. 그러나 평문 크기에 비례하여 암호문 크기와 연산 결과의 노이즈가 커지는 동형암호의 특징으로 인해 기계학습 모델의 예측 정확도가 감소하고 학습 시간이 오래 소요되는 문제가 발생한다. 본 논문에서는 부분 동형암호화된 데이터셋으로 로지스틱 회귀 모델을 학습할 수 있는 기법을 제안한다. 실험 결과에 따르면 제안하는 기법이 종래 기법보다 예측 정확도를 59.4% 향상시킬 수 있었고, 학습 소요 시간을 63.6% 개선할 수 있었다.

직사화기 무기체계의 무기효과지수 계산을 위한 메타모델 생성방법 연구 (A Study on Generating Meta-Model to Calculate Weapon Effectiveness Index for a Direct Fire Weapon System)

  • 이예림;이상진;오현식
    • 한국시뮬레이션학회논문지
    • /
    • 제30권2호
    • /
    • pp.23-31
    • /
    • 2021
  • 개체단위 M&S의 교전 결과에 대한 정확도를 높이기 위해서는 신뢰성 있는 무기효과지수를 바탕으로 피해 정도가 모의되어야 한다. 무기효과지수는 특정 교전 환경에서 무기체계와 표적에 대한 명중확률(Ph)과 살상확률(Pk)을 지수화한 값으로, 주로 JMEM 데이터나 JMEM 방법론에 따라 생산된 데이터가 활용되고 있다. 그러나 JMEM 방법론은 표적 중심부를 기준으로 원형공산오차를 통과하는 파편이나 탄의 격자 통과량으로 살상확률을 계산하기 때문에 지형, 대기, 장애물 등의 추가적인 환경 요소를 고려하기 위해서는 전문가에 의한 보정이 요구된다. 따라서 본 논문에서는 다수의 교전 및 환경요소가 반영된 무기효과지수 생산을 위해 공학급 무기체계 모델을 활용하여 몬테카를로 시뮬레이션을 수행하고, 그 결과 데이터를 바탕으로 메타모델을 생성하였다. 명중확률과 살상확률 메타모델로 로지스틱 회귀모델과 가우시안 프로세스 회귀모델이 각각 생성되었으며, 예시 시나리오에 적용하여 모델 적합도를 관찰하였다. 본 연구에서 제시한 절차를 따르면 개체단위 M&S의 입력자료를 효율적으로 생산할 수 있을 것으로 기대한다.

손해배상액과 무효심판 판례를 이용한 특허 로열티율 산정 회귀모형 (Regression Models for Determining the Patent Royalty Rates using Infringement Damage Awards and Inter-Partes Review Cases)

  • 양동홍;강근석;김성철
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.47-63
    • /
    • 2018
  • 무형자산의 가치평가에 많이 사용되고 있는 수익접근법과 시장접근법의 특성을 모두 가지고 있는 로열티공제법을 사용하여 지식재산권의 경제적 가치를 평가할 때, 로열티공제법의 중요한 투입변수인 로열티율을 객관적으로 산정하는 수리적 모형을 제시한다. 이를 위하여 미국의 특허침해 손해배상액을 로열티율로 산정한 판례를 참고로 하여 로열티율을 종속변수로, 당해 특허권의 특허지표를 독립변수로 하여 로열티율 산정 회귀모형을 적용한다. 또한 미국의 당사자계재심(Inter-Partes Review)판례를 참고로 하여 특허무효거절 결과를 종속변수로 하고 당해 특허권의 특허지표를 독립변수로 하여 로지스틱회귀 모형을 적합시킨다. 최종 로열티율은 위의 로열티율 산정 회귀모형에서 산출된 로열티율과 로지스틱회귀모형에서 산출된 특허무효거절 확률을 결합하여 산정한다. 마지막으로, 본 논문에서 구축된 모형에 의해 산정된 로열티율과 기준 방식에 의해 산정된 로열티율을 비교하여 제안된 모형의 객관성과 신뢰성을 분석한다.

한국 KOSDAQ 상장기업들의 자본구조 결정요인 분석 (Determinants of Leverage for Manufacturing Firms Listed in the KOSDAQ Stock Market)

  • 김한준
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2096-2109
    • /
    • 2012
  • 본 연구는 국내 자본시장에서 지금까지 상대적으로 낮은 관심을 받아왔던 KOSDAQ 상장기업들의 재무적 특성 분석(자본구조 포함에 관한 실증적인 연구이다. 본 연구에서는 KOSDAQ 기업들(우량기업부와 벤처기업부 소속)에 대한 상대적으로 포괄적인 가설검정을 실행하였다. 첫 번째 가설은 동 상장회사들의 자본구조(부채) 결정에 영향을 미칠 수 있는 설명변수의 통계학적인 분석이다. 다중 회귀식을 이용한 결과, 장부가 기준의 종속변수에 대한 영향력과의 관계에서, 자산크기, 성장성, 시가-장부가 비율, 변동성, 시가총액, 그리고 KOSDAQ 내의 소속부에 대한 더미변수 들이 통계학적인 유의성을 보였고, 시장가 기준의 종속변수에 대한 설명변수들의 영향력은 자산크기, 성장성, 시가총액, 체계적 위험의 대용치인 베타계수, 그리고 소속부 더미변수에서 나타났다. 두 번째 가설검정은 로지스틱 모델을 이용한 소속부 분류 기준상, 해당 기업들의 재무적인 특성분석 검정이었으며, 마지막 분석은 해당 기업들의 산업별 평균 부채비율로서의 '회귀성'관련 검정이었다. 로지스틱 회귀식 결과와 관련하여 기업들의 재무특성 중, 수익성, 자산크기, 시가대비 장부가 비율, 그리고, 외국인 지분률이 각각 높을수록 벤처기업부 대비, 우량기업부로 분류될 확률이 높음을 알 수 있었으며, Fisher exact 확률검정을 이용한 해당 기업들의 부채회귀성 가설에 대한 검정 결과, 산술평균치와 중앙값 각각을 기준으로 매 5년 주기로 평균 부채비율로의 회귀성이 통계적으로 판명되었다. 이는 Bowen et al.(1982)의 미국 기업들 대상의 검정결과와 일치하며, 평균부채 회귀성의 자본선진국의 일반 경향이 본 연구대상인 KOSDAQ 기업 대상의 연구에서도 발견될 수 있었다는 점에도 기여도가 있다고 판단한다.

한국어 학습 모델별 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Korean Classification Models' Korean Essay Score Range Prediction Performance)

  • 조희련;임현열;이유미;차준우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.133-140
    • /
    • 2022
  • 우리는 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 문제에서 세 개의 딥러닝 기반 한국어 언어모델의 예측 성능을 조사한다. 이를 위해 총 304편의 답안지로 구성된 실험 데이터 세트를 구축하였는데, 답안지의 주제는 직업 선택의 기준('직업'), 행복한 삶의 조건('행복'), 돈과 행복('경제'), 성공의 정의('성공')로 다양하다. 이들 답안지는 네 개의 점수 구간으로 구분되어 평어 레이블(A, B, C, D)이 매겨졌고, 총 11건의 점수 구간 예측 실험이 시행되었다. 구체적으로는 5개의 '직업' 답안지 점수 구간(평어) 예측 실험, 5개의 '행복' 답안지 점수 구간 예측 실험, 1개의 혼합 답안지 점수 구간 예측 실험이 시행되었다. 이들 실험에서 세 개의 딥러닝 기반 한국어 언어모델(KoBERT, KcBERT, KR-BERT)이 다양한 훈련 데이터로 미세조정되었다. 또 두 개의 전통적인 확률적 기계학습 분류기(나이브 베이즈와 로지스틱 회귀)도 그 성능이 분석되었다. 실험 결과 딥러닝 기반 한국어 언어모델이 전통적인 기계학습 분류기보다 우수한 성능을 보였으며, 특히 KR-BERT는 전반적인 평균 예측 정확도가 55.83%로 가장 우수한 성능을 보였다. 그 다음은 KcBERT(55.77%)였고 KoBERT(54.91%)가 뒤를 이었다. 나이브 베이즈와 로지스틱 회귀 분류기의 성능은 각각 52.52%와 50.28%였다. 학습된 분류기 모두 훈련 데이터의 부족과 데이터 분포의 불균형 때문에 예측 성능이 별로 높지 않았고, 분류기의 어휘가 글쓰기 답안지의 오류를 제대로 포착하지 못하는 한계가 있었다. 이 두 가지 한계를 극복하면 분류기의 성능이 향상될 것으로 보인다.

고속도로 건설사업의 재정/민자 발주선택 의사결정 지원모델 (Decision Support Model for Determining Public or Private Highway Investment Projects)

  • 여동훈;정우용;한승헌;이영천
    • 대한토목학회논문집
    • /
    • 제29권3D호
    • /
    • pp.381-389
    • /
    • 2009
  • 2007년 기준으로 정부는 18.4조원을 사회기반시설에 투자하고 있으며, 이 중 16.3%에 해당되는 3조원을 민간투자 사업에 집행하고 있다. 이는 인프라 시설에 대한 국민적인 요구를 충족시킴과 동시에 재정부담을 경감하고 사업 추진시 위험을 축소시키기 위한 것이다. 하지만 현재 국가 인프라 사업은 기획단계에서 재정사업 또는 민자사업으로 결정하는 체계적인 기준이나 지침이 없이 주로 재정 상태를 고려한 주무관청의 자체판단에 따라 사업추진 방식이 결정되고 있다. 또한 초기에 재정 사업으로 추진되는 경우에도, 사업타당성 조사를 실시하는 과정에서 민자사업으로서의 가능성은제대로 평가되지 않는 상황이다. 따라서 본 연구는 국가 인프라사업에 대하여 재정사업과 민자사업을 선택하는 합리적인 발주기준을 제시하는 것을 목표로 한다. 이를 위하여 고속도로 사업을 중심으로 재정 민자 의사결정 기준을 경제성, 정책성, 사업관리 항목으로 나누고 이를 바탕으로 재정 민자 의사결정 모델을 제시하였다. 본 연구에서는 의사결정 모델을 구축하기 위해 30건의 재정 및 민자사업 실제 사례를 분석하고 102건의 전문가 설문을 실시하였다. 본 모델은 크게 두 단계로 구분되는데, 첫째 경제성 평가는 평균 및 표준편차 분석을 통해 민자불가, 재정민자 양측가능 및 재정불가 구간을 제시하였으며, 둘째 정책성 평가와 사업관리 평가는 로지스틱 회귀분석을 실시함으로써 재정 또는 민자사업의 추진여부를 구분 짓는 예측식을 도출하였다. 본 연구의 결과를 통해 고속도로 사업의 기획단계에 참여하는 의사결정자는 고려중인 사업의 재정 민자사업 결정시 보다 체계적이고 합리적인 사업발주방식을 결정할 수 있을 것으로 사료된다.