• 제목/요약/키워드: 로지스틱회귀

검색결과 1,772건 처리시간 0.022초

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구에서는 주행 차량의 실시간 연료소모량을 예측할 수 있는 머신러닝 기법을 제안하고 그 특성을 분석하였다. 머신러닝 학습을 위해 실도로 주행을 실시하여 주행 속도, 가속도, 도로 구배와 함께 연료소모량을 측정하였다. 특성 데이터로 속도, 가속도, 도로구배를, 타깃으로 연료소모량을 지정하여 다양한 머신러닝 모델을 학습시켰다. 회귀법에 해당하는 K-최근접이웃회귀 및 선형회귀와 함께, 분류법에 해당하는 K-최근접이웃분류, 로지스틱회귀, 결정트리, 랜덤포레스트, 그래디언부스팅을 사용하였다. 실시간 연료소모량에 대한 예측 정확도는 0.5 ~ 0.6 수준으로 전반적으로 낮았고, 회귀법의 경우 분류법보다 정확도가 떨어졌다. 총연료소모량에 대한 예측 오차는 0.2 ~ 2.0% 수준으로 상당히 정확했고, 분류법보다 회귀법의 오차가 더 낮았다. 이는 예측 정확도의 기준으로 결정계수(R2)를 사용했기 때문인데, 이 값이 작을수록 타깃의 평균 부근에 예측치가 좁게 분포하기 때문이다. 따라서 실시간 연료소모량 예측에는 분류법이, 총연료소모량 예측에는 회귀법이 적합하다고 할 수 있다.

로지스틱 회귀분석 및 AHP 기법을 이용한 산사태 위험지역 분석 (Analysis of Landslide Hazard Area using Logistic Regression Analysis and AHP (Analytical Hierarchy Process) Approach)

  • 이용준;박근애;김성준
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.861-867
    • /
    • 2006
  • 본 연구에서는 안성시($520km^2$)를 대상으로 Logistic 회귀분석 방법과 AHP 기법을 이용하여, GIS와 RS 자료를 활용한 산사태 위험지를 분석하였다. Logistic 회귀분석과 AHP 기법에는 6개의 인자(경사, 경사향, 고도, 토양배수, 토심, 토지이용)를 사용하여, 7등급으로 산사태 위험도를 분류하였다. Logistic 회귀분석 방법과 AHP 기법을 이용한 산사태 위험지도를 표본 자료와 비교하면 산사태가 발생한 표본에서 산사태 위험성이 높은(1-2등급)지역이 Logistic 회귀분석에서는 46.1% AHP 기법은 48.7%로 분류되어 AHP 기법이 분류도가 높다고 분석되었다. Logistic 회귀분석과 AHP 기법은 서로 분석 과정의 차이를 가지고 있기 때문에 Logistic 회귀분석과 AHP기법을 적용한 결과에 동일 가중치를 부여한 후 7개 등급으로 재분류(reclass)하여 산사태 위험지역을 추출할 수 있는 방법론을 본 연구에서 제시하였다. 그 결과 산사태가 발생한 표본에서 1-2 등급지역이 58.9%로 분석되어 분류정확도를 높일 수 있었다.

로지스틱 임의선형 혼합모형의 최대우도 추정법 (Maximum likelihood estimation of Logistic random effects model)

  • 김민아;경민정
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.957-981
    • /
    • 2017
  • 관측되지 않는 효과 또는 고정효과로 설명할 수 없는 분산 구조가 포함되어 정확한 모수 추정이 어려운 경우 체계적인 분석을 위해 일반화 선형 모형은 임의효과가 포함된 일반화 선형 혼합 모형으로 확장되었다. 본 연구에서는 일반화 선형 모형 중에서도 이분적인 반응변수를 다루는 로지스틱 회귀모형에 임의효과를 포함한 최대 우도 추정 방법을 설명한다. 그중에서도 라플라스 근사법, 가우스-에르미트 구적법, 적응 가우스-에르미트 구적법 그리고 유사가능도 우도에 대한 최대우도 추정법을 자세히 알아본다. 또한 제안한 방법을 사용하여 한국 복지 패널 데이터에서 정신건강과 생활만족도가 자원봉사활동에 미치는 영향에 대해 분석한다.

AUC 차이를 이용한 미결정자 추론방법 (Undecided inference using the difference of AUCs)

  • 홍종선;나해린
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.141-152
    • /
    • 2021
  • 미결정자 추론을 재평가하기 위해 기존 변수에 새로운 변수들을 추가하는 통계 모형이 필요하다. 미결정자와 결정자의 양성률은 다르게 계산되기 때문에 MNAR 가정이 필요하다. 본 연구에서는 두 통계적 모형이 계층 관계를 가지고 있으므로, 두 AUC 차이의 신뢰구간을 이용하여 MNAR 가정하에서 미결정자를 추론한다. AUC 차이 신뢰구간의 추정방법 중에서 모의실험을 통하여 네 종류의 방법의 성능이 우수함을 발견하였다. 그리고 네 종류의 방법을 바탕으로 로지스틱 회귀를 이용한 미결정자 추론에 도움이 되는 변수를 선택하는 방법을 제안한다.

연속형의 텐서곱과 범주형의 직합을 사용한 다항 로지스틱 회귀모형 (A polychotomous regression model with tensor product splines and direct sums)

  • 심송용;강희모
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.19-26
    • /
    • 2014
  • 다항 로지스틱 회귀모형의 설명변수가 연속형과 범주형을 모두 포함할 때 범주형 설명변수는 직합을 적용하고 연속형 설명변수는 텐서곱을 적용하는 모형을 제안한다. 변수선택의 기준으로 BIC를 사용하고, 제안된 모형의 알고리즘을 구현하였다. 구현된 알고리즘을 실제 자료에 적용하여 기존의 방법과 비교하여 제안된 모형이 더 좋은 분류율을 보임을 확인하였다.

수량화 분석과 AHP를 이용한 산사태 예측모형 개발

  • 남은미;전경호;유혜경;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.114-119
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 달리 AHP(Analytic Hierarchy Process) 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

  • PDF

통계적 분류방법을 이용한 문화재 정보 분석

  • 강민구;성수진;이진영;나종화
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

산재보험 부정수급 식별모형에 관한 연구 (A Study on the Fraud Detection of Industrial Accident Compensation Insurance)

  • 함승오;홍정식
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2008년도 추계학술대회 및 정기총회
    • /
    • pp.342-345
    • /
    • 2008
  • 산재 발생 시 산재근로자는 근로복지공단을 통해서 각종 급여를 받게 된다. 본 논문은 심사 과정과 급여지급 후에 부정수급으로 판명된 산재 청구 건을 데이터 마이닝을 통해서 분석하여 부정수급의 유형을 발견하고자 한다. 이 연구에서는 서울관내 4개 지사에서 8년 동안(2000년$\sim$2007년)의 총 61,536명의 최초요양 신청을 한 산재근로자 자료를 대상으로 하였고, 종속변수에 영향을 미치는 8개의 독립변수를 선택해서 사용한다. 데이터 마이닝을 적용함에 있어서 가장 효율적인 허위 부정 탐지 모델을 만들기 위해 의사결정나무분석(Decision Tree)과 로지스틱 회귀분석(Logistic Regresion)등의 다양한 기법을 적용하여 결과를 비교분석 하고, 오분류 비용을 적용하여, 최적의 분류결정 값을 가지는 모델을 도출한다. 분석결과, 로지스틱 회귀분석이 산재보험 부정수급 유형 발견에 보다 효과적인 모델로 판명되었다. 또한 판별점(Cut-Off) 0.01로 했을 때 4개변수(요양기간, 업종형태, 의료기관, 재해발생형태)가 부정수급에 탐지하는데 영향력이 큰 변수로 선정되었다.

  • PDF

로지스틱 회귀분석을 활용한 옥외공간에서의 온열쾌적감에 대한 피험자 설문 분석 (Thermal Comfort in Outdoor Environment by Questionnaire Survey : Using the Logistic Regresstion)

  • 임종연;황효근;류민경;송두삼
    • 한국태양에너지학회:학술대회논문집
    • /
    • 한국태양에너지학회 2009년도 춘계학술발표대회 논문집
    • /
    • pp.97-101
    • /
    • 2009
  • Calculating and predicting the thermal comfort in outdoor environment are difficult than in indoor environment because composition parameters are variable, interrelations among parameters are very complex and human activities in outdoor are diverse. Moreover, the thermal expectancy of subject in outdoor environment is different from that of indoor environment. The aims of this study are to examine the difference between indoor and outdoor thermal comfort range. With this in mind, field measurement for estimating outdoor thermal environment and a questionnaire survey with simultaneous measurement around the subject were conducted.

  • PDF

생활시간소비형태에 따른 피로도에 대한 연관성 분석

  • 최종후;이동희;소선하
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.41-47
    • /
    • 2006
  • 통계청은 1999과 2004년 두 차례에 걸쳐 '생활시간조사(Time Use Survey)'를 실시한 바 있다. 이 조사는 우리나라 국민이 하루 24시간을 어떠한 이용 행태로 시간 사용을 하고 있는 지를 조사함으로써 오늘의 국민들의 평균적인 생활방식과 삶의 질을 파악하고, 시간자원의 효율적 활용에 필요한 기초자료를 제공하는데 그 의의를 두고 있다. 특히 생활시간조사는 각 개인의 시간별 활동내용 뿐 아니라 개인의 여러 가지 인구통계학적 특성들을 함께 조사함으로써 이와 관련된 실증적 연구를 가능하게 한다. 본 연구에서 관심을 가지고 살펴보고자 하는 것은 개인의 생활시간소비 행태는 성별 및 사회적 역할과 연관되어 있다고 생각되기 때문이다. 특히 개인의 피로도의 정도와 생활시간 소비 형태와의 관련성에 초점을 두고 로지스틱 회귀, 대응분석을 통하여 살펴보고자 한다.

  • PDF