• Title/Summary/Keyword: 회귀수

Search Result 7,915, Processing Time 0.045 seconds

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.27 no.9
    • /
    • pp.13-20
    • /
    • 2022
  • It's proposed and analyzed ML(Machine Learning) models to predict vehicle FC(Fuel Consumption) in real-time. The test driving was done for a car to measure vehicle speed, acceleration, road gradient and FC for training dataset. The various ML models were trained with feature data of speed, acceleration and road-gradient for target FC. There are two kind of ML models and one is regression type of linear regression and k-nearest neighbors regression and the other is classification type of k-nearest neighbors classifier, logistic regression, decision tree, random forest and gradient boosting in the study. The prediction accuracy is low in range of 0.5 ~ 0.6 for real-time FC and the classification type is more accurate than the regression ones. The prediction error for total FC has very low value of about 0.2 ~ 2.0% and regression models are more accurate than classification ones. It's for the coefficient of determination (R2) of accuracy score distributing predicted values along mean of targets as the coefficient decreases. Therefore regression models are good for total FC and classification ones are proper for real-time FC prediction.

Analysis of Water Balance in Paddy Fields using Open Source SWMMModel (Open source SWMM모형을 활용한 논배수로 물수지 분석)

  • Kim Beom gu;Choo In Kyo;Kareem Kola Yusuff;Jung Young Hun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.403-403
    • /
    • 2023
  • 도시화로 인한 생활, 공업, 농업용수의 수요는 증가하지만, 이를 해결하기 위한 댐 건설은 생태계의 단절, 수몰 지역 생성 등의 이유로 비판적인 여론이 많아 신규 수자원 확보가 어려워지고 있다. 따라서 우리는 신규 수자원을 확보하기보다 기존 수자원의 물관리 체계를 개선하고 합리적인 물 배분 기술을 개발할 필요가 있다. 이중 농업용수의 회귀 수량에 대하여 알아볼 필요가 있다. 수리 시설물에서 공급된 농업용수는 전량 작물에 의해 소비되는 것이 아니며, 포장으로 공급되지 않고 용수로를 통해 배수되기도 한다. 포장으로 공급된 수량은 물꼬를 넘어 배수되기도 하고, 일부는 침투되어 지하수를 통해 흘러나가기도 한다. 이 와 같이, 농업용수 공급량 중 소모되지 않고 하천으로 유입되는 수량을 관계 회귀 수량이라 한다. 따라서 본연구에서는 농업에 소모되지 않고 하천으로 유입되는 회귀수량을 정확히 조절할 수 있도록 농업용수 회귀수량을 계산하는 모델을 구현하였다. SWMM(Storm Water Management Model)은 도로, 도랑, 관로, 초지 등 주로 도시지역의 강우-유출-지표면 유출을 해석하는 모델이며 농지의 수로네트워크 특성을 잘 반영할 수 있다는 장점이 있다. 이번 연구에서는 용수로를 개수로로 고려하여 테스트베드 모형을 구축할 것이다. SWMM은 농업용수 물순환 모의를 위해 이미 활용되고 있으나 논에서의 증산량이 미반영되며 수혜지역 내의 지하수위가 미반영 되는 등 정확한 물순환 모의를 위해서 한계점 개선이 필요하다. 이 한계점 개선을 위해서 회귀수량 공식을 c언어로 구현 후 EPA SWMM의 소스코드를 활용하여 회귀수량 추정이 가능한 SWMM을 구현하였다. 해당 연구를 통해 농업용수의 회귀수량을 계산하여 정확한 물수지 분석이 가능하여 농업지역의 수자원 확보에 도움을 줄 것이다.

  • PDF

Analysis of Landslide Hazard Area using Logistic Regression Analysis and AHP (Analytical Hierarchy Process) Approach (로지스틱 회귀분석 및 AHP 기법을 이용한 산사태 위험지역 분석)

  • Lee, Yong-jun;Park, Geun-Ae;Kim, Seong-Joon
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.26 no.5D
    • /
    • pp.861-867
    • /
    • 2006
  • The objective of this study is to analyze the landslide hazard areas by combining LRA (Lgistic Regression Analysis) and AHP (Analytic Hierarchy Program) methods with Remote Sensing and GIS data in Anseong-si. In order to classify landslide hazard areas of seven levels, six topographic factors (slope, aspect, elevation, soil drain, soil depth, and land use) were used as input factors of LRA and AHP methods. As results, high-risk areas for landslide (1 and 2 levels) by LRA and AHP of its own were classified as 46.1% and 48.7%, respectively. A new method by applying weighting factors to the results of LRA and AHP was suggested. High-risk areas for landslide (1 and 2 levels) form the new method was classified as 58.9%.

Stream Discharge Estimation by Runoff Component Analysis on the Control Point (유출성분 분석에 의한 제어지점의 유출량 산정)

  • Lee, Sang-Jin;Hwang, Man-Ha;Lee, Bae-Sung;Park, Joo-Seong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.785-789
    • /
    • 2006
  • 유역 수자원의 효율적인 관리 및 배분을 위해서는 세밀한 강우-유출관계의 규명이 무엇보다 중요하다. 이를 위해서는 먼저 하천 유출지점의 정확한 유량정보가 획득되어야 하며, 장기간에 걸쳐 신뢰성 있는 유량자료의 확보는 더욱 중요한 사항이다. 본 연구에서는 하천에서 관측된 유량자료를 장기간(1983년${\sim}$2004년)에 걸친 유출성분으로 분리하는 기법을 활용하여 제어지점의 유출량을 검증하였다. 유량자료를 출구지점의 관측유량$(Q_{ob})$을 회귀수$({\alpha}Q_e)$, 상류유입량$(Q_{up})$ 및 관측강우-유출량$({\beta}Q_{Rain})$의 성분으로 구분하여 산정하는 방식으로 유출량을 추정하였다. 여기서, 회귀수$({\alpha}Q_e)$란 유역 및 하도내 용수이용량의 회귀수, 상류유입량$(Q_{up})$은 상류 유출 제어지점의 관측유량으로 대청댐 방류량, 관측강우-유출량$({\beta}Q_{Rain})$은 유역내 강우에 의한 자연유출량이다. 여기서 사용된 수문기초자료는 대청댐 방류량, 대전 및 청주권 취수량, 강우에 의한 자연유출량, 공주관측유량 등으로 각 성분별로 생성된 일자료를 이용하여 공주지점의 월별, 분기별, 년도별 유출량을 산정하였다. 이 결과는 금강유역에 이미 구축되어있는 SSARR모형을 기반으로 한 RRFS(Rainfall Runoff Forecasting System, 유출예측 시스템)의 결과 및 관측치와 비교되었다. 계산결과 RRFS에 의한 유출량과 대청-공주구간의 유출성분분리에 의한 유출량은 관측값과 전반적으로 근사함을 확인하였으며, 검증지점의 정확한 유출율을 산정할 수 있다면, 관측자료의 연속성 및 신뢰도를 파악하는 척도를 제공할 수 있을 것으로 판단된다.측결과 있는 대상유역에 대한 적용이 요구된다.-Moment 방법에 의해 추정된 매개변수를 사용한 Power 분포를 적용하였으며 이들 분포의 적합도를 PPCC Test를 사용하여 평가해봄으로써 낙동강 유역에서의 저수시의 유출량 추정에 대한 Power 분포의 적용성을 판단해 보았다. 뿐만 아니라 이와 관련된 수문요소기술을 확보할 수 있을 것이다.역의 물순환 과정을 보다 명확히 규명하고자 노력하였다.으로 추정되었다.면으로의 월류량을 산정하고 유입된 지표유량에 대해서 배수시스템에서의 흐름해석을 수행하였다. 그리고, 침수해석을 위해서는 2차원 침수해석을 위한 DEM기반 침수해석모형을 개발하였고, 건물의 영향을 고려할 수 있도록 구성하였다. 본 연구결과 지표류 유출 해석의 물리적 특성을 잘 반영하며, 도시지역의 복잡한 배수시스템 해석모형과 지표범람 모형을 통합한 모형 개발로 인해 더욱 정교한 도시지역에서의 홍수 범람 해석을 실시할 수 있을 것으로 판단된다. 본 모형의 개발로 침수상황의 시간별 진행과정을 분석함으로써 도시홍수에 대한 침수위험 지점 파악 및 주민대피지도 구축 등에 활용될 수 있을 것으로 판단된다. 있을 것으로 판단되었다.4일간의 기상변화가 자발성 기흉 발생에 영향을 미친다고 추론할 수 있었다. 향후 본 연구에서 추론된 기상변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전략은 존재하므로 이러한 전략을 개발 및 활용할 수 있으며, 특히, 한국주식시장에 적합한 거래전략은 반전거래전략이고, 이 전략의 유용성은 투자자가 설정한 투자기간보다 더욱 긴

  • PDF

Determination of Dimensionless Daily Unit Hydrograph for Groundwater Flow by Autoregressive Model (자기회귀모형에 의한 무차원 일 지하수단위도 결정)

  • 김재한;전민우
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 1986.07a
    • /
    • pp.23-33
    • /
    • 1986
  • 일강우를 여러가지 성분들이 포함된 백색잡음으로 가정하면, 이로부터 기저유출 성분을 분리하기 위하여 선형론이 적용될 수 있다. 선형론에는 단위충격응답이 요구 되어지므로, 본 연구에서는 이를 추계학적 자기회귀모형에 의하여 추정한다. 자기회귀계수는 기지의 기저유출성분과 이에 해당되는 강우의 지하침투량으로부터 모멘트법에 의하여 결정한다. 기지의 기저유출성분은 주 지하수감수곡선에 의하여 추정되어지며, 지하침투량은 $\Phi$-지수 개념하에 전 강우기간에 걸쳐 일정 침투율의 방법으로부터 구한다. 본 연구방법을 금강유역내 용담집수면적(937$\textrm{km}^2$)에 적용한 결과 상당히 미끈한 수문곡선을 얻을 수 있었으며, 각 호우-유출 사상별 회귀계수의 차수는 공히 2차로 나타났다.

  • PDF

Graphical regression and model assessment in logistic model (로지스틱모형에서 그래픽을 이용한 회귀와 모형평가)

  • Kahng, Myung-Wook;Kim, Bu-Yong;Hong, Ju-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.1
    • /
    • pp.21-32
    • /
    • 2010
  • Graphical regression is a paradigm for obtaining regression information using plots without model assumptions. The general goal of this approach is to find lowdimensional sufficient summary plots without loss of important information. Model assessments using residual plots are less likely to be successful in models that are not linear. As an alternative approach, marginal model plots provide a general graphical method for assessing the model. We apply the methods of graphical regression and model assessment using marginal model plots to the logistic regression model.

A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis (회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델)

  • Kim, Chaehyeon;Ryoo, Euirim;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.

Frequent Items Mining based on Regression Model in Data Streams (스트림 데이터에서 회귀분석에 기반한 빈발항목 예측)

  • Lee, Uk-Hyun
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.1
    • /
    • pp.147-158
    • /
    • 2009
  • Recently, the data model in stream data environment has massive, continuous, and infinity properties. However the stream data processing like query process or data analysis is conducted using a limited capacity of disk or memory. In these environment, the traditional frequent pattern discovery on transaction database can be performed because it is difficult to manage the information continuously whether a continuous stream data is the frequent item or not. In this paper, we propose the method which we are able to predict the frequent items using the regression model on continuous stream data environment. We can use as a prediction model on indefinite items by constructing the regression model on stream data. We will show that the proposed method is able to be efficiently used on stream data environment through a variety of experiments.

An Analysis on the Phoneme Duration Modeling For the Trainable TTS System (Trainable TTS System을 위한 음운 지속시간 모델링)

  • Seo Jiln;Lee Yanghee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.109-112
    • /
    • 2001
  • 본 논문에서는 한국어 Trainable TTS System의 자연스러운 음성 합성을 위해 400문장(어절수 : 6,220, 음운수: 총43,701: 자음 23,899,모음: 19,802)에 대하여 단일 남성화자가 발성한 문 음성 데이터를 음운레벨세그먼트, 음운 라벨링 ,어절간의 띄어쓰기 ,어절에 대한 음운별 품사가 태깅된 문 음성 코퍼스를 사용하여 음운 환경과 품사에 의하여 음운의 지속시간이 어떻게 변화하는가에 대하여 통계적으로 분석하였다. 그리고 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운에 대한 고유 지속시간의 영향이 배제된 정규화 음운지속시간에 대한 회귀트리를 이용하여 정규화 지속시간에 영향을 미치는 특징요소들 간의 관계를 통계적인 방법으로 분석하였다. 그 결과 문법적인 특징요소를 나타내는 요소들간에 서로 상관이 높게 나타나는 것을 알 수 있었다 그리고 이러한 경우 유사한 특징 요소들간에 상관이 1에 가까울 정도로 상관이 높은 요소들의 경우 예측지수가 낮은 요소들을 제거하여도 지속시간변화에 영향을 미치지 못하는 것으로 나타났다. 그 결과 문법적 성질이 유사한 특징 요소들을 회귀트리를 통해 모델링할 경우에 요소들간의 상관정도를 분석하여 최소한의 특징요소들을 선택 할 수 있는 방법을 제시하였다 그리고 이를 토대로 한 정규화 회귀트리의 모델링이 지속시간 회귀트리 모델링보다 우수함을 입증하였다.

  • PDF