• Title/Summary/Keyword: 로지스틱모형

Search Result 534, Processing Time 0.027 seconds

통계적 분류방법을 이용한 문화재 정보 분석

  • Kang, Min-Gu;Sung, Su-Jin;Lee, Jin-Young;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.120-125
    • /
    • 2009
  • 본 논문에서는 통계적 분류방법을 이용하여 문화재 자료의 분석을 수행하였다. 분류방법으로는 선형판별분석, 로지스틱회귀분석, 의사결정나무분석, 신경망분석, SVM분석을 사용하였다. 각각의 분류방법에 대한 개념 및 이론에 대해 간략히 소개하고, 실제자료 분석에서는 "지역별 문화재 통계분석 및 모형개발 연구 1차(2008)"에 사용된 자료 중 익산시 자료를 근거로 매장문화재에 대한 분류방법별 적합모형을 구축하였다. 구축된 모형과 모의실험의 결과를 통해 각각의 적합모형에 대한 비교를 수행하여 모형의 성능을 비교하였다. 분석에 사용된 도구로는 최근 가장 관심을 갖는 R-project를 사용하였다.

  • PDF

Prediction of Snow Damage Using Machine Learning Technique (머신러닝 기법을 이용한 대설피해 예측 및 적합성 검토)

  • Lee, Hyeong Joo;Chung, Gunhui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.192-192
    • /
    • 2020
  • 취약성 분석의 결과로 폭설에 의한 기후노출은 현재에는 강원권이 가장 취약한 것으로 나타났다. 그러나 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 다양한 머신러닝 기법을 이용하여 대설피해 예측을 실시하였다. 머신러닝 기법으로는 로지스틱회귀모형, 서포트벡터 머신, 의사결정트리 모형을 적용하였다. 종속변수로 대설피해액 자료를 이용하였고, 독립변수로 기상관측자료, 사회·경제적 요소를 사용하였다. 결과적으로 기존에 사용했던 다중회귀모형과 머신러닝 기법으로 예측한 예측력을 비교 및 분석하였고, 예측력이 가장 높은 머신러닝 기법을 제시하였다. 본 연구에서 대설피해 예측을 위해 사용된 예측력이 가장 높은 기법을 활용하여 대설피해를 예측한다면, 미래에 전국적으로 확대될 대설피해에 대해 효과적으로 대비할 수 있을 것으로 기대된다.

  • PDF

Undecided inference using logistic regression for credit evaluation (신용평가에서 로지스틱 회귀를 이용한 미결정자 추론)

  • Hong, Chong-Sun;Jung, Min-Sub
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.2
    • /
    • pp.149-157
    • /
    • 2011
  • Undecided inference could be regarded as a missing data problem such as MARand MNAR. Under the assumption of MAR, undecided inference make use of logistic regression model. The probability of default for the undecided group is obtained with regression coefficient vectors for the decided group and compare with the probability of default for the decided group. And under the assumption of MNAR, undecide dinference make use of logistic regression model with additional feature random vector. Simulation results based on two kinds of real data are obtained and compared. It is found that the misclassification rates are not much different from the rate of rawdata under the assumption of MAR. However the misclassification rates under the assumption of MNAR are less than those under the assumption of MAR, and as the ratio of the undecided group is increasing, the misclassification rates is decreasing.

Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model (로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구)

  • Jin, Soo-Bong;Lee, Jong-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.20 no.4
    • /
    • pp.482-490
    • /
    • 2017
  • This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.

Parameter estimation of linear function using VUS and HUM maximization (VUS와 HUM 최적화를 이용한 선형함수의 모수추정)

  • Hong, Chong Sun;Won, Chi Hwan;Jeong, Dong Gil
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.6
    • /
    • pp.1305-1315
    • /
    • 2015
  • Consider the risk score which is a function of a linear score for the classification models. The AUC optimization method can be applied to estimate the coefficients of linear score. These estimates obtained by this AUC approach method are shown to be better than the maximum likelihood estimators using logistic models under the general situation which does not fit the logistic assumptions. In this work, the VUS and HUM approach methods are suggested by extending AUC approach method for more realistic discrimination and prediction worlds. Some simulation results are obtained with both various distributions of thresholds and three kinds of link functions such as logit, complementary log-log and modified logit functions. It is found that coefficient prediction results by using the VUS and HUM approach methods for multiple categorical classification are equivalent to or better than those by using logistic models with some link functions.

Estimation of Logistic Regression for Two-Stage Case-Control Data (2단계 사례-대조자료를 위한 로지스틱 회귀모형의 추론)

  • 신미영;신은순
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.237-245
    • /
    • 2000
  • In this paper we consider a logistic regression model based on two-stage case-control sampling and study the Weighted Exogeneous Sampling Maximum Likelihood(WESML) method to get an asymptotically normal estimates of the parameters in a logistic regression model. A numerical example is carried out to demonstrate the differences between the Conditional Maximum Likelihood(CML) estimates and the WESML estimates for two-stage case-control data.

  • PDF

Likelihood-Based Inference of Random Effects and Application in Logistic Regression (우도에 기반한 임의효과에 대한 추론과 로지스틱 회귀모형에서의 응용)

  • Kim, Gwangsu
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.2
    • /
    • pp.269-279
    • /
    • 2015
  • This paper considers inferences of random effects. We show that the proposed confidence distribution (CD) performs well in logistic regression for random intercepts with small samples. Real data analyses are also done to identify the subject effects clearly.

Assessment of the Distributional Probability for Evergreen Broad-Leaved Forests(EBLFs) Using a Logistic Regression Model (로지스틱 회귀모형을 이용한 상록활엽수림 생육분포 확률 평가)

  • YOO, Byung-Oh;PARK, Joon-Hyung;PARK, Yong-Bae;JUNG, Su-Young;LEE, Kwang-Soo
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.19 no.1
    • /
    • pp.94-105
    • /
    • 2016
  • This study was carried out to assess the distributional probability for Evergreen Broad-Leaved Forests(EBLFs) using the field data and digital climate data that were occurred during the period of 1980 to 2010. For the validation of logistic regression model, the probabilistic value ranged from 33 to 84%, especially the probabilistic value of growing distribution becomes lower patterns with higher altitude. In addition, it has been estimated that the probabilistic value of growing distribution is the highest with 63~83% among the regional units in temperate/warm-temperate forests.

Principal Components Logistic Regression based on Robust Estimation (로버스트추정에 바탕을 둔 주성분로지스틱회귀)

  • Kim, Bu-Yong;Kahng, Myung-Wook;Jang, Hea-Won
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.3
    • /
    • pp.531-539
    • /
    • 2009
  • Logistic regression is widely used as a datamining technique for the customer relationship management. The maximum likelihood estimator has highly inflated variance when multicollinearity exists among the regressors, and it is not robust against outliers. Thus we propose the robust principal components logistic regression to deal with both multicollinearity and outlier problem. A procedure is suggested for the selection of principal components, which is based on the condition index. When a condition index is larger than the cutoff value obtained from the model constructed on the basis of the conjoint analysis, the corresponding principal component is removed from the logistic model. In addition, we employ an algorithm for the robust estimation, which strives to dampen the effect of outliers by applying the appropriate weights and factors to the leverage points and vertical outliers identified by the V-mask type criterion. The Monte Carlo simulation results indicate that the proposed procedure yields higher rate of correct classification than the existing method.

Development of heavy rain damage prediction function using logistic regression model (로지스틱 회귀모형을 이용한 호우피해 예측함수 개발)

  • Choi, Chang Hyun;Kim, Jong Sung;Kim, Dong Hyun;Lee, Jong So;Kim, Hung Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.41-41
    • /
    • 2017
  • 자연재난으로 인한 피해의 대형화, 다양화, 집중화 현상이 일어나고 있으며, 이로 인한 사회 경제적 피해가 과거에 비해 계속적으로 증가하고 있다. 만약 기존에 발생하였던 재난 피해 자료와 기상현상간의 통계적 분석을 통해 재난의 발생 가능성과 피해 범위를 예측할 수 있다면, 효율적으로 재난관리를 할 수 있을 것이다. 따라서 본 연구에서는 대표적인 자연재난 피해인 호우피해를 대상으로 낙동강 권역 69개 시군구별 재해통계 자료를 기반으로 수문기상자료와의 통계적 분석을 통해 호우피해 예측함수를 개발하였다. 국민안전처에서 발간하는 재해연보 자료를 통해 호우피해 발생기간별 호우피해액 자료를 분석하였고, 이를 호우피해 예측함수의 종속변수로 사용하였다. 종관기상관측소의 시강우 자료를 분석하여 선행강우, 지속시간별 최대강우, 총강우량을 구축하였고, 시군구별 면적 등의 지역 특성을 수집하여 설명변수로 사용하였다. 기존의 피해예측함수 관련 연구에서 제기되었던 피해액이 큰 부분에서 예측력이 떨어지는 문제를 해결하기 위해, 피해액이 큰 집단과 피해액이 작은 집단을 구분하여 함수식을 개발할 수 있는 로지스틱 회귀모형을 사용하여 호우피해 예측함수를 개발하였다. 개발된 호우피해 예측함수의 NRMSE는 6.34~18.79%로 나타났으며, 대부분 호우피해를 적절하게 예측하는 것으로 나타났다. 본 연구에서는 호우피해액이 큰 집단과 피해액이 작은 집단으로 구분할 수 있는 로지스틱 회귀모형을 이용하여 낙동강 권역의 시군구별 호우피해 예측함수를 개발하였다. 본 연구에서 제시한 시군구별 호우피해 예측함수를 이용하여 사전에 호우피해를 예측할 수 있다면 호우피해액이 크게 줄어들 것으로 사료된다.

  • PDF