• 제목/요약/키워드: multicollinearity measures

검색결과 9건 처리시간 0.021초

Multicollinarity in Logistic Regression

  • Jong-Han lee;Myung-Hoe Huh
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.303-309
    • /
    • 1995
  • Many measures to detect multicollinearity in linear regression have been proposed in statistics and numerical analysis literature. Among them, condition number and variance inflation factor(VIF) are most popular. In this study, we give new interpretations of condition number and VIF in linear regression, using geometry on the explanatory space. In the same line, we derive natural measures of condition number and VIF for logistic regression. These computer intensive measures can be easily extended to evaluate multicollinearity in generalized linear models.

  • PDF

ILL-CONDITIONING IN LINEAR REGRESSION MODELS AND ITS DIAGNOSTICS

  • Ghorbani, Hamid
    • 한국수학교육학회지시리즈B:순수및응용수학
    • /
    • 제27권2호
    • /
    • pp.71-81
    • /
    • 2020
  • Multicollinearity is a common problem in linear regression models when two or more regressors are highly correlated, which yields some serious problems for the ordinary least square estimates of the parameters as well as model validation and interpretation. In this paper, first the problem of multicollinearity and its subsequent effects on the linear regression along with some important measures for detecting multicollinearity is reviewed, then the role of eigenvalues and eigenvectors in detecting multicollinearity are bolded. At the end a real data set is evaluated for which the fitted linear regression models is investigated for multicollinearity diagnostics.

Comparing Fault Prediction Models Using Change Request Data for a Telecommunication System

  • Park, Young-Sik;Yoon, Byeong-Nam;Lim, Jae-Hak
    • ETRI Journal
    • /
    • 제21권3호
    • /
    • pp.6-15
    • /
    • 1999
  • Many studies in the software reliability have attempted to develop a model for predicting the faults of a software module because the application of good prediction models provides the optimal resource allocation during the development period. In this paper, we consider the change request data collected from the field test of the software module that incorporate a functional relation between the faults and some software metrics. To this end, we discuss the general aspect if regression method, the problem of multicollinearity and the measures of model evaluation. We consider four possible regression models including two stepwise regression models and two nonlinear models. Four developed models are evaluated with respect to the predictive quality.

  • PDF

Prediction of extreme PM2.5 concentrations via extreme quantile regression

  • Lee, SangHyuk;Park, Seoncheol;Lim, Yaeji
    • Communications for Statistical Applications and Methods
    • /
    • 제29권3호
    • /
    • pp.319-331
    • /
    • 2022
  • In this paper, we develop a new statistical model to forecast the PM2.5 level in Seoul, South Korea. The proposed model is based on the extreme quantile regression model with lasso penalty. Various meteorological variables and air pollution variables are considered as predictors in the regression model, and the lasso quantile regression performs variable selection and solves the multicollinearity problem. The final prediction model is obtained by combining various extreme lasso quantile regression estimators and we construct a binary classifier based on the model. Prediction performance is evaluated through the statistical measures of the performance of a binary classification test. We observe that the proposed method works better compared to the other classification methods, and predicts 'very bad' cases of the PM2.5 level well.

Health Information Managers' Job Stress in an Electronic Medical Record Environment

  • Noh, Jin-Won;Choi, Hyo-Jin;Hong, Jin-Hyuk;Boo, Yoo-Kyung
    • International Journal of Contents
    • /
    • 제13권2호
    • /
    • pp.35-43
    • /
    • 2017
  • This study sought to measure the influence of HIMs' work environment changes on job stress, and to explore measures for improving job satisfaction among them. A total of 275 hospital HIMs' were surveyed using a structured questionnaire. Significant job stress impact variables were sorted out using a simple linear regression analysis. Then, through multiple linear regression analysis, multicollinearity was tested. Significant impact factors were identified from among the control variables, and job stress impact was measured. The survey revealed that in public hospitals where the EMR system has been implemented for a longer period, depression scores in HIMs' were increased. HIMs' job stress level was found to be affected by the following factors: computerization of their working environment, experience of depression, unemployment, and manpower reduction, as well as, their lifestyles, including leisure activities. The results of this study suggest that HIMs' job stress can be reduced through work environment improvement and improvement of their personal lifestyle habits.

산학협력 밀착도, 협력도 구성변수가 만족도에 미치는 영향 분석 (Impact analysis of Industrial-University cooperation adherency degree and cooperation degree configuration variable on satisfaction)

  • 김영부
    • 한국산학기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.359-368
    • /
    • 2016
  • 21세기에 들어 우리나라 대학교육체제는 혁신과 변화의 국면에 놓여 있다. 이러한 상황에서 주목하는 바는 산학협력이다. 대학과 산업간의 상호관계를 통해 공진화하는 산학협력 생태계를 조성해 나가는 것이 서로의 목표가 되어야 한다. 따라서 산학협력의 관계도를 측정하는 것이 중요시되며, 산학협력의 최종결과물인 성과도 어떻게 측정해야 바람직한지가 중요하다. 본 논문은 교육부가 평가실시하고 있는 산학협력관계 측정지표인 밀착도, 협력도, 만족도를 대상으로 산학협력의 성과를 기업의 만족도로 설정하고, 산학협력 만족도에 영향을 미치는 상호관계를 밀착도와 협력도로 측정하였다. 따라서 본 연구에서는 대학과 기업 간의 산학협력관계요인에 따른 산학협력 만족도에 영향력을 분석하기 위하여 회귀방정식을 통한 분석을 시도하였다. 더불어 다중회귀분석을 하기 전에 다중공선성 문제를 사전 점검한 결과, 다중공선성 문제는 낮은 것으로 나타났다. 특히, 만족도 변수는 어느 항목으로 설정할 수 있는 종속변수이지만 여기서는 5개의 개별 변수로 다차원의 종속변수를 구성하고, 이들 각 개별 종속변수인 만족도에 밀착도 변수 구성변인과 협력도 구성변인이 어느 정도 영향관계를 형성하고 있는지를 분석하였다. 그 결과, 지역맞춤형 프로그램 실현정도가 가장 유의미한 변수로 나타났고. 산학협력을 통해 양성된 인력 만족도에 영향을 미치는 가장 큰 요인은 교육/연구/기술지도 등 지역의 여건에 적합한 프로그램 실현정도로 나타났다.

주성분 분석기법을 이용한 선박의 연료소비 예측에 관한 연구 (A Study on the Prediction of Fuel Consumption of a Ship Using the Principal Component Analysis)

  • 김영롱;김구종;박준범
    • 한국항해항만학회지
    • /
    • 제43권6호
    • /
    • pp.335-343
    • /
    • 2019
  • 최근 선박의 배기가스 규제가 강화되면서 연료소비량을 저감하기 위한 많은 방안들이 검토되고 있다. 그중에서도 선박으로부터 수집한 데이터를 활용하여 연료소모량을 예측하는 기계학습 모델을 개발하고자 하는 연구가 활발히 수행되고 있다. 하지만 많은 연구들이 학습모델의 주요 변수 선정이나 수집데이터의 처리 방법에 대한 고려가 미흡하였으며, 무분별한 데이터의 활용은 변수 간의 다중공선성 문제를 야기할 수도 있다. 본 연구에서는 이러한 문제점을 해결하기 위하여 주성분 분석을 이용하여 선박의 연료소비를 예측하는 방법을 제시하였다. 13K TEU 컨테이너 선박의 운항데이터에 주성분 분석을 수행하였으며, 추출한 주성분으로 회귀분석을 수행하여 연료소비 예측모델을 구현하였다. 평가용 데이터에 대한 모델의 설명력은 82.99%이었으며, 이러한 예측모델은 항해 계획 수립 시 운항자의 의사결정을 지원하고 항해 중 에너지 효율적인 운항상태 모니터링에 기여할 수 있을 것으로 기대된다.

긴급재난문자 만족도에 영향을 미치는 요인 규명 -인천광역시 서비스 대상자를 중심으로- (An Investigation of the Factors Affecting Satisfaction with Cell Broadcast Service(CBS) -Focusing on Users in Incheon-)

  • 박근오;박재영
    • 한국환경과학회지
    • /
    • 제33권3호
    • /
    • pp.193-203
    • /
    • 2024
  • This study aims to determine the factors affecting the level of satisfaction with the Cell Broadcast Service (CBS) among citizens in Incheon. Partial least squares (PLS) regression, instead of multiple regression, was used for the analysis because it can solve multicollinearity and sample size issues. The analysis results are as follows: The factor with the greatest effect on satisfaction with CBS among Incheon citizens, was the elimination of redundancies (VIP=1.185). Therefore, local governments, government agencies, and public organizations must coordinate their ideas and collectively create guidelines to eliminate redundancies. The second most influential factor was the expansion in the broadcast medium from legal, institutional, and policy aspects (VIP=1.087). This is because differences in generation, age, gender, and personal characteristics were not considered. Therefore, it is necessary to devise a customized messaging tool through the expansion of broadcast media. The broadcast criteria of the legal, institutional, and policy perspectives comprised the third most influential factor, with a high VIP value of 1.053. Consequently, it is essential to devise a plan to avoid distributing unnecessary cell broadcast services, by establishing criteria for areas and sections, time, and the direct and indirect impact zones of a disaster. In the future, this study could be used as base data to develop policies, guidelines, and response measures for Incheon CBS. Given the lack of research on the diverse characteristics of each social class and the city traits of each region, and a lack of concrete empirical research on each factor, continuous and in-depth studies are required in the future.

프랜차이즈시스템의 사회연결망 특성이 정보공유에 미치는 영향 (The Effect of Social Network on Information Sharing in Franchise System)

  • 윤한성;배상욱;노정구
    • 한국유통학회지:유통연구
    • /
    • 제16권2호
    • /
    • pp.95-118
    • /
    • 2011
  • 본 연구는 다음과 같은 연구목적을 가진다. 첫째, 프랜차이즈 시스템에서 사회연결망 밀도와 중앙성이 가맹점의 가맹본부와의 정보공유와 다른 가맹점들과의 정보공유에 미치는 영향에 대한 관계를 실증적으로 밝히고자 한다. 둘째, 앞서 제시한 관계들에 있어 가맹점과 가맹본부 간의 유대강도의 조절역할을 하는지에 대하여 탐색적으로 확인하고자 한다. 셋째, 실증분석의 결과를 토대로 학문적 실무적 시사점을 제시하고자 한다. 본 연구는 실증분석을 하기 위하여 부산지역에 소재한 프랜차이즈 가맹점들을 대상으로 설문조사를 실시하였으며, 설문응답의 신뢰성을 높이기 위해서 가맹점의 점주와 점장을 중심으로 설문조사 하였다. 회수된 설문지는 총 200부이며, 이 중 무성의하게 응답한 11부를 제외한 189부를 실증분석에 사용하였다. 평균변환법과 위계적 다중회귀분석법을 사용하여 가설들을 검증한 결과는 다음과 같다. 첫째, 정보공유 대상이 가맹본부인 경우 사회연결망 중앙성, 유대강도, 밀도 및 중앙성과 유대강도의 상호작용이 정보공유에 유의하게 영향을 미치는 것으로 나타났다. 둘째, 정보공유 대상이 다른 가맹점인 경우 사회연결망 중앙성이 정보공유에 유의한 영향을 미치는 것으로 나타났다. 마지막으로 본 연구의 실증분석 결과를 토대로 학문적 실무적 시사점과 본 연구의 한계점 및 향후 과제를 제시하였다.

  • PDF