• 제목/요약/키워드: Multiple Regression Analysis with Dummy Variable

검색결과 11건 처리시간 0.024초

Price Monitoring Automation with Marketing Forecasting Methods

  • Oksana Penkova;Oleksandr Zakharchuk;Ivan Blahun;Alina Berher;Veronika Nechytailo;Andrii Kharenko
    • International Journal of Computer Science & Network Security
    • /
    • 제23권9호
    • /
    • pp.37-46
    • /
    • 2023
  • The main aim of the article is to solve the problem of automating price monitoring using marketing forecasting methods and Excel functionality under martial law. The study used the method of algorithms, trend analysis, correlation and regression analysis, ANOVA, extrapolation, index method, etc. The importance of monitoring consumer price developments in market pricing at the macro and micro levels is proved. The introduction of a Dummy variable to account for the influence of martial law in market pricing is proposed, both in linear multiple regression modelling and in forecasting the components of the Consumer Price Index. Experimentally, the high reliability of forecasting based on a five-factor linear regression model with a Dummy variable was proved in comparison with a linear trend equation and a four-factor linear regression model. Pessimistic, realistic and optimistic scenarios were developed for forecasting the Consumer Price Index for the situation of the end of the Russian-Ukrainian war until the end of 2023 and separately until the end of 2024.

도시근린공원의 적정조도모형 (Model on the Suitable Illuminance at Urban Neighborhood Park)

  • 최연철;김진선
    • 한국조경학회지
    • /
    • 제29권3호
    • /
    • pp.29-37
    • /
    • 2001
  • The purpose of this study is to determine the suitable illuminance model of an urban neighborhood park. To this end, 1 dependent variable and 11 independent variables were set, and multiple regression analysis was applied to find correlation between variables and the model. The results of this study are as follows; 1) Among 11 independent variables abstracted to study suitable illuminance model of an urban neighborhood park, as a result of analysis on correlation between suitable illuminance of a dependent variable and activity space by using dummy variables, activity type and illuminance by spaces the suitable illuminance required for an urban neighborhood park was much influenced by activity type, and the fact that the activity was not limited to a specific space. 2) As a result of multiple regression analysis, independent variables influencing the suitable illuminance model of an urban neighborhood park were activity space, illuminance by spaces, seated activity, standing activity, and sporting activity. And, for relative contribution of independent variables to suitable illuminance, activity with sporting showed an importance 22 times higher than seated activity. When the central square(Sp_1) of activity spaces was set to reference category using dummy variables, it showed a contribution 52 times higher than sorting space(Sp_7) and the central square as the most important variable. 3) It was analyzed that suitable illuminance of an urban neighborhood part was most influenced by sporting activity but the relative contribution of a sporting space where activity with sporting occurs was least in view of the function of the space. Very high illuminance is required to accept high activity, and if illuminance at a certain space becomes too high, it may influence the illuminance of other spaces, and may consequently have a negative effect on the suitable illuminance of an urban neighborhood park. The results of this study were mainly for teenagers and young adults in their twenties, so further concrete studies which consider gender and a wider age range are needed in the future. Based on subsequent study, suitable illuminance by spaces shall be suggested.

  • PDF

Models for Estimating Yield of Italian Ryegrass in South Areas of Korean Peninsula and Jeju Island

  • Peng, Jing Lun;Kim, Moon Ju;Kim, Byong Wan;Sung, Kyung Il
    • 한국초지조사료학회지
    • /
    • 제36권3호
    • /
    • pp.223-236
    • /
    • 2016
  • The objective of this study was to construct Italian ryegrass (IRG) dry matter yield (DMY) estimation models in South Korea based on climatic data by locations. Obviously, the climatic environment of Jeju Island has great differences with Korean Peninsula. Meanwhile, many data points were from Jeju Island in the prepared data set. Statistically significant differences in both DMY values and climatic variables were observed between south areas of Korean Peninsula and Jeju Island. Therefore, the estimation models were constructed separately for south areas of Korean Peninsula and Jeju Island separately. For south areas of Korean Peninsula, a data set with a sample size of 933 during 26 years was used. Four optimal climatic variables were selected through a stepwise approach of multiple regression analysis with DMY as the response variable. Subsequently, via general linear model, the final model including the selected four climatic variables and cultivated locations as dummy variables was constructed. The model could explain 37.7% of the variations in DMY of IRG in south areas of Korean Peninsula. For Jeju Island, a data set containing 130 data points during 17 years were used in the modeling construction via the stepwise approach of multiple regression analysis. The model constructed in this research could explain 51.0% of the variations in DMY of IRG. For the two models, homoscedasticity and the assumption that the mean of the residuals were equal to zero were satisfied. Meanwhile, the fitness of both models was good based on most scatters of predicted DMY values fell within the 95% confidence interval.

도시 및 기후특성이 에너지 회복력에 미치는 영향 - 정전발생시간을 중심으로 - (The Effect of Urban and Climate Characteristics on Energy Resilience - Focusing on Blackout Time -)

  • 이동성;문태훈
    • 국토계획
    • /
    • 제54권4호
    • /
    • pp.122-130
    • /
    • 2019
  • The purpose of this study is to analyze effect of climate and urban factors on energy resilience, and to explore policy alternatives to strengthen resilience of energy system. For this purpose, this study used extensive literature review on resilience studies and multiple regression analysis. In this study, blackout time was set as a dependent variable. And the independent variables were divided into climate and urban (robustness, countermeasure capacity) characteristics. As a result of the analysis, in terms of climate characteristics, maximum wind speed and cooling/heating degree-day have statistically significant impact on blackout time. With regard to urban characteristics, number of consumer, ratio of deteriorated housing and coast dummy variables have statistically significant impact on blackout time. And the ratio of government employees and road ratio were found to be the most influencing factors to shorten time taken to restore original level of electricity supply. Based on the study results, several policy suggestions to improve energy resilience were made such as continuous management of vulnerable areas and strengthening disaster response services. This study only considered engineering dimension of resilience. Further studies need to be approached on ecological & social-ecological dimension.

A Yield Estimation Model of Forage Rye Based on Climate Data by Locations in South Korea Using General Linear Model

  • Peng, Jing Lun;Kim, Moon Ju;Kim, Byong Wan;Sung, Kyung Il
    • 한국초지조사료학회지
    • /
    • 제36권3호
    • /
    • pp.205-214
    • /
    • 2016
  • The objective of this study was to construct a forage rye (FR) dry matter yield (DMY) estimation model based on climate data by locations in South Korea. The data set (n = 549) during 29 years were used. Six optimal climatic variables were selected through stepwise multiple regression analysis with DMY as the response variable. Subsequently, via general linear model, the final model including the six climatic variables and cultivated locations as dummy variables was constructed as follows: DMY = 104.166SGD + 1.454AAT + 147.863MTJ + 59.183PAT150 - 4.693SRF + 45.106SRD - 5230.001 + Location, where SGD was spring growing days, AAT was autumnal accumulated temperature, MTJ was mean temperature in January, PAT150 was period to accumulated temperature 150, SRF was spring rainfall, and SRD was spring rainfall days. The model constructed in this research could explain 24.4 % of the variations in DMY of FR. The homoscedasticity and the assumption that the mean of the residuals were equal to zero was satisfied. The goodness-of-fit of the model was proper based on most scatters of the predicted DMY values fell within the 95% confidence interval.

골든타임 확보를 위한 소방차 통행시간 예측모형 개발 (Development of Fire Engine Travel Time Estimation Model for Securing Golden Time)

  • 장기훈;조성범;조용성;손승녀
    • 한국ITS학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1-13
    • /
    • 2020
  • 화재 발생 시 골든타임 내 화재를 진압해야 인명 및 재산 피해를 최소화할 수 있다. 이를 위해 소방차의 신속한 현장 도착이 필요하다. 본 연구에서는 화재발생 자료와 교통 GIS DB 자료를 융합하여 화재발생 시 소방차 통행시간에 영향을 주는 도로 및 환경요인을 모색하고, 골든타임을 확보하기 위한 소방차 통행시간 예측 모형을 구축하고자 한다. 상관분석과 더미 변수를 이용한 회귀분석을 적용하여 소방차 통행시간 예측 통합 모형(모형1)과 화재발생지 토지이용행태별로 분석한 소방차 통행시간 예측 모형(모형 2, 3, 4)을 구축하였다. 분석 결과, 모형 1에서는 유의성이 있는 독립변수 17개를 도출하였으며, 토지이용행태에 따라 소방차 통행시간에 주는 영향이 차이가 있는 것으로 분석되었다. 4가지 모형에서 공통 핵심 변수(통행거리, 차로 수, 도로등급)를 도출하였다. 본 연구를 통해 긴급차량 통행시간 관련 연구에서 지표로써 변수를 활용할 수 있으며, 긴급차량 골든타임 확보에 기여할 것으로 사료된다.

고속도로 돌발상황 지속시간 예측모형 개발 (Development of Freeway Incident Duration Prediction Models)

  • 신치현;김정훈
    • 대한교통학회지
    • /
    • 제20권3호
    • /
    • pp.17-30
    • /
    • 2002
  • 반복정체와 함께 돌발상황은 고속도로 교통혼잡의 주요 원인이 되고 있다. 발생된 돌발상황에 대해 즉각 정보를 제공하고 신속히 교통류를 관리하는 정도는 그 교통류관리시스템의 수준을 의미하는 것으로, 돌발상황에 의해 차로가 차단될 시간을 속히 예측하는 것은 돌발상황관리에서 매우 기본적인 사항이라 하지 않을 수 없다. 돌발상황에 따라 교통류관리대책을 수립·실시하고 교통정보를 제공하자면 돌발상황으로 인한 교통영향(지체와 대기행렬 길이)을 먼저 산정해 보아야 하며 그러기 위해서는 지속시간의 예측이 반드시 필요하다. 통상 돌발 상황의 지속시간은 그 유형 및 심각도에 따라 다양해지며 교통, 도로, 환경 등과 같은 복합적인 조건에 영향을 받는다. 따라서 돌발상황 지속시간 예측모형에 사용되는 독립변수는 돌발상황 확인시점에서 수집 가능한 변수이어야 하며 모형의 현장적용을 위해서는 해당도로의 교통관제시스템의 수준과 함께 정보원(CCTV, 순찰반 등)의 특성을 고려하여야 한다. 본 연구는 고속도로 돌발상황 지속시간 예측모형 개발을 목표로 하며, 한국도로공사 수원지사의 교통사고발생 속보 21개월 분의 자료를 정리하여 본선에서 발생한 각종 돌발상황 168건을 사용자료로 추려냈다. 이를 DB화하여 통계분석을 수행하였으며 고속도로에서의 돌발상황 지속시간 예측을 위한 다중선형회귀모형을 구축하였다. 그리고 모델링에 사용되지 않은 자료를 이용해 개발모형의 정확성 평가를 수행하였다.

다중회귀분석을 이용한 서울시 1인 가구의 연령별 분포요인에 관한 연구 (A Study on the Age Distribution Factors of One Person Household in Seoul using Multiple Regression Analysis)

  • 이선희;윤동현;고준환
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.11-21
    • /
    • 2015
  • 최근 몇 년간 서울시는 총 인구 수가 꾸준히 감소하고 있으나, 소형가구의 증가로 인해 총 가구 수는 증가하는 양상을 보이고 있다. 수도권 내 소형가구는 2010년 기준 전체가구의 44%를 차지하고 있으며, 통계청에서는 2020년에는 전국의 1인 가구 수가 전체가구의 약 30%이상을 차지할 것이라고 예상하였다. 1인 가구 관련 선행연구에 따르면 1인 가구가 연령별로 선호하는 주택유형이나 주변 환경 등이 다르게 나타나며, 본 연구에서는 연령별 차이가 1인 가구의 공간적 분포로 이어질 것이라는 연구가설을 제시하고자 한다. 따라서 1인 가구의 공간적 분포 요인이 되는 시설들을 대상으로 네트워크에 기초한 서비스 권역 분석 후 도출된 면적을 공간적 단위의 면적 비율로 계산하여 이를 독립변수로 적용한 다중회귀분석을 실시하였다. 공간적 단위는 서울시 집계구이며, 이를 토대로 연령별 1인 가구 수와 분포요인간의 상호작용을 살펴보았다. 또한 더미변수로 서울시 공간권역인 도심권, 동북권, 동남권, 서북권, 서남권으로 설정하고 각각의 권역별 결과를 도출하였다. 그 결과, 연령별로 주로 분포하고 있는 공간권역이 각기 다르게 나타났으며, 20대는 대학가 근처 주택, 30대는 전월세 주택, 40~50대는 월세주택, 60대 이상은 연면적 $40m^2$ 이하의 주택을 선호하는 것으로 나타났다. 이와 같이 1인 가구는 연령별로 선호하는 주택환경이 다르기 때문에, 이를 고려한 주택정책이 제시되어야 할 것이다.

행려환자의 응급의료기관 체류시간 분석을 통한 의료서비스 개선방안에 대한 연구 (The Study on Improving Medical Care Service by Analyzing the Time While the Homeless Patients Length of Stay Emergency Medical Institution)

  • 이진우;김광환
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.619-627
    • /
    • 2013
  • 본 연구는 응급의료기관을 내원 한 행려환자들의 내원, 진료, 발생특성에 따라 체류시간을 살펴본 후 영향을 미치는 관련요인을 파악하여 향후 의료서비스 개선방안을 위한 기초자료를 제공하고자 하는데 그 의의가 있다. 조사대상은 2012년 1월 1일부터 동년 12월 31일까지 1년 동안 충남소재의 응급의료기관을 내원한 행려환자 691명으로 하였으며, 분석방법은 빈도분석, ANOVA, 상관관계분석 후 독립변수를 더 미화하여 다중회귀분석을 실시하였다. 결론을 보면 첫째, 의료기관은 행려환자에 대한 부정적인 인식에서 벗어날 필요가 있으며, 질 좋은 의료서비스 제공 및 응급진료지원체계를 갖추고 있어야 한다. 둘째, 행려환자의 대부분이 남자이고, 40,50대가 절반이상을 차지하고 있어, 이들이 사회적으로 아직까지는 생산성이 높은 연령층이라고 할 수 있으며, 향후 의료적지원 뿐만 아니라 사회복귀프로그램이 포함된 정부 정책의 관리구축 방안이 필요하다.

지방자치단체 자체 복지사업 지출 영향요인 분석 : 사회보장정보시스템을 통한 접근 (Analysis on Factors Influencing Welfare Spending of Local Authority : Implementing the Detailed Data Extracted from the Social Security Information System)

  • 김경준;함영진;이기동
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.141-156
    • /
    • 2013
  • 그 동안 한국 사회에서 지방자치단체(이하 지자체) 복지사업과 재정지출에 대한 연구는 장애인, 노인, 보육 등 복지사업 대상 등을 중심으로 부문별 복지지출에 대한 영향요인 연구가 대부분 이루어져 왔다. 최근 지자체의 자체적인 복지노력도 측면에서 자체 사업에 대한 연구가 특정 지역의 사례를 중심으로 이루어지기는 하고 있지만, 자료에 대한 접근과 조사의 한계로 여러 요인이 실증적으로 고려되지 못하여 정책적 함의를 도출해 내기 어려웠다. 현재 우리사회의 복지예산과 그 지출규모는 국가 예산의 30%에 이를 만큼 높은 비중을 차지하고 있다. 이에 따라 국가적 차원에서 공공복지 전달체계의 효율적 운영과 관리를 위해 사회보장 정보시스템을 구축, 운영하고 있다. 본 연구에서는 기존 연구에서 사용하는 지방재정시스템이 아닌 사회보장 정보시스템을 통하여 지자체 복지재정 지출과 관련, 기존 연구에서 한계점으로 지적되었던 전수데이터에 대한 접근과 조사를 실시하여 학문적이고 정책적인 함의를 도출해 내고자 한다. 사회보장정보시스템은 복지전달체계의 효율화를 위해 구축되었으며, 이를 통해 17개 부처 292개 복지사업이 집행되며, 230개 지자체 4만여 개 복지사업의 정보가 관리되고 있다. 이에 따라 본 연구는 사회보장정보시스템을 통해 관리되는 지자체 복지사업을 중심으로 지자체 복지지출에 미치는 영향요인을 탐색하고자 한다. 이를 위해 지자체 복지노력도로 대변되는 순수 시 군 구 복지예산액을 종속변수로 설정하였으며, 기존문헌 검토를 바탕으로 인구사회학적, 지역 경제적 그리고 지자체 재정적 요인을 독립변수로 설정하였다. 또한 독립변수 요인간 다중공선성 문제를 점검하였고, 다중공선성의 문제가 없는 것으로 확인된 수급자 비율, 영유아 비율, 아동청소년 비율, 복지비 비율, 구인배율, 재정자립도, 재정자주도의 총 7개 독립변수와, 소속 정당을 통제변수로 사용하여 결정요인의 변화를 분석하였다. 연구결과를 살펴보면 기본모델에서는 복지비 비율, 영유아 비율, 재정자립도, 재정자주도, 구인배율이 유의한 영향을 미치는 것으로 분석되었다. 그리고 기존 문헌에서 분석되지 못했던 시 군 구별 복지지출 영향요인의 차이점을 분석하였다. 또한 복지예산 총량 데이터에 근거한 기존 연구들이 논의하지 못했던 자체 복지사업 예산에 미치는 영향요인을 구체적으로 밝혀내는데 의의가 있다.