• Title/Summary/Keyword: 회귀 모형 함수

Search Result 294, Processing Time 0.026 seconds

Effects of Porosity and Water Content on Thermal Conductivity of Soils (토양의 공극률 및 함수비가 열전도도에 미치는 영향)

  • Cha, Jang-Hwan;An, Sun-Joon;Koo, Min-Ho;Kim, Hyoung-Chan;Song, Yoon-Ho;Suh, Myoung-Seok
    • Journal of Soil and Groundwater Environment
    • /
    • v.13 no.3
    • /
    • pp.27-36
    • /
    • 2008
  • This paper presents a comprehensive laboratory study that examines the effects of porosity, water content, density and grain size distribution on the thermal conductivity of soils which were sampled from 16 synoptic stations of Korea. The experimental results clearly demonstrate that porosity and water content are important parameters which strongly affect the thermal conductivity of soils. Soils with lower porosities and higher water contents have higher thermal conductivities. On the contrary, increase of the matrix density slightly increases the thermal conductivity, and grain size distribution hardly affects the thermal conductivity. Dry soils with the same porosity tend to have more scattered values of thermal conductivity than wet soils. Based on the experimental results, a multiple linear regression model and a nonlinear regression model, having two regression variables of porosity and water content, were presented to predict thermal conductivity. Both models show a high accuracy of prediction with $R^2$ values of 0.74 and 0.82, respectively. Thus, it is expected that the suggested empirical models can be used for predicting thermal conductivity of soils by measuring porosity and water content.

Penalized variable selection in mean-variance accelerated failure time models (평균-분산 가속화 실패시간 모형에서 벌점화 변수선택)

  • Kwon, Ji Hoon;Ha, Il Do
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.3
    • /
    • pp.411-425
    • /
    • 2021
  • Accelerated failure time (AFT) model represents a linear relationship between the log-survival time and covariates. We are interested in the inference of covariate's effect affecting the variation of survival times in the AFT model. Thus, we need to model the variance as well as the mean of survival times. We call the resulting model mean and variance AFT (MV-AFT) model. In this paper, we propose a variable selection procedure of regression parameters of mean and variance in MV-AFT model using penalized likelihood function. For the variable selection, we study four penalty functions, i.e. least absolute shrinkage and selection operator (LASSO), adaptive lasso (ALASSO), smoothly clipped absolute deviation (SCAD) and hierarchical likelihood (HL). With this procedure we can select important covariates and estimate the regression parameters at the same time. The performance of the proposed method is evaluated using simulation studies. The proposed method is illustrated with a clinical example dataset.

Asymptotic Relative Efficiency for New Score Functions in Rank Regression Models (순위회귀모형의 새로운 스코어 함수의 효율성 연구)

  • 최영훈
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.2
    • /
    • pp.269-280
    • /
    • 2004
  • We explore the selection of r and s that provides improvement over the Wilcoxon scores under the asymmetric distributions we encounter in practice. We select 0 〈 r 〈 1, s 〉 1 for right-skewed distribution and r 〉 1,0 〈 s 〈 1 for left-skewed distributions from the perspective plots. We also study the association between the desirable r and s and the test statistic for skewness.

Rational Estimation of Dam Low-flow Frequency Inflow (가뭄대응력 평가를 위한 합리적 댐 유입량 산정 연구)

  • Kim, Ji-Heun;Lee, Jae-Hwang;Kim, Yeong-O
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.178-178
    • /
    • 2021
  • 최근 들어 기후변화로 인한 극심한 가뭄 피해가 한반도에 발생하고 있다. 가뭄 상황에 대비하여 댐을 안정적으로 운영하기 위해서는 갈수빈도 유입량에 대한 분석이 필수적이다. 갈수빈도해석의 경우, 홍수빈도해석과 유사하게 확률밀도함수의 극값에 대한 확률값을 산정하며, 확률 분포형의 역함수에 비초과확률을 대입하여 산정한다. 그러나 홍수와 달리 가뭄은 지속기간이 긴 특성 탓에 자기상관을 고려해야하며, 댐 및 저수지 등 대규모 시설물의 경우 일반적인 하천과 달리 저류효과로 인해 누적 유량에 대한 고려가 필요하다. 이에 K-water는 자체 제작한 누가차분법 및 Disaggregation 두 가지 방법을 채택하여 실무에서 사용해왔다. 그러나 누가차분법을 사용할 경우, 빈도유입량이 지나치게 크게 산정되는 문제가 있으며, Disaggregation 방법을 사용하는 경우, 특정 빈도 이상의 극한가뭄에서 유입량의 차이가 유의미하지 않아 산정된 빈도유입량과 최근 발생한 극심한 가뭄의 실측유입량간 큰 차이가 발생하고 있다. 따라서 본 연구에서는 자기상관을 고려한 선형회귀모형에 근거하여 빈도유입량을 배분하는 방법을 제안한다. 또한, 앞서 서술한 네 가지 빈도유입량 방법(월빈도분석, 누가차분법, K-water Disaggregation, 자기상관 선형회귀모형)에 대한 수식적 비교를 수행하며, 국내 댐 유역에 적용 및 평가를 통해 자료 특성에 따른 적절한 빈도유입량 산정방식에 대한 기준을 제안한다. 본 연구를 통해 가뭄특성을 고려한 합리적인 댐 유입량을 산정함으로써 보다 유연한 수자원시설물의 가뭄대응이 이루어질 것으로 기대된다.

  • PDF

Analysis of Probability Density Function of Deposition Spot in Open Channel Flow (하천에서 유사의 침전 위치에 대한 확률밀도함수 분석)

  • Oh, Jungsun;Choi, Sung-Uk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.50-50
    • /
    • 2016
  • 하천에서 유사 및 오염물질의 이동을 예측하기 위하여 초점을 두는 것에는 두 가지 요소가 있다. 입자의 농도로 나타낼 수 있는 양의 개념과 입자의 위치로 나타낼 수 있는 공간의 개념이 그것이다. 유사 입자와 같이 그 비중이 물보다 큰 경우, 흐름 내에서 침전과 부상의 메커니즘을 반복하게 되는데 최종적으로 바닥에 침적하는 위치는 하상변동, 서식처 등 하천관리의 다양한 측면에서 매우 중요하다. 유사 입자가 바닥에 침적하는 위치를 예측하는 데에는 난류와 지형 같은 많은 불확실한 요소가 내포되어 있어, 같은 크기의 유사 입자라 하여도 하나의 exact point로 도달하지 않는다. 이러한 불확실한 요소를 고려하여 침전 위치를 산정하는 방법에 대한 연구가 필요하다. 따라서 본 연구에서는 침전 위치를 확률밀도함수로 나타내어 분석하고자 한다. 입자의 침전 위치를 확률밀도함수로 나타내기 위하여 입자 기반의 추적 모형을 사용하여 위치 데이터를 얻었으며, 이를 실험데이터와 비교하여 검증 후 확률밀도함수로 나타내었다. 그 결과 입자의 침적 위치에 대한 확률밀도함수는 로그정규분포를 띠고 있음을 확인하였으며, 확률밀도함수를 나타내는 매개변수를 물리 기반 회귀모형식으로 일반화 하여 나타낼 수 있었다.

  • PDF

Locally Weighted Polynomial Forecasting Model (지역가중다항식을 이용한 예측모형)

  • Mun, Yeong-Il
    • Journal of Korea Water Resources Association
    • /
    • v.33 no.1
    • /
    • pp.31-38
    • /
    • 2000
  • Relationships between hydrologic variables are often nonlinear. Usually the functional form of such a relationship is not known a priori. A multivariate, nonparametric regression methodology is provided here for approximating the underlying regression function using locally weighted polynomials. Locally weighted polynomials consider the approximation of the target function through a Taylor series expansion of the function in the neighborhood of the point of estimate. The utility of this nonparametric regression approach is demonstrated through an application to nonparametric short term forecasts of the biweekly Great Salt Lake volume.volume.

  • PDF

Analysis of market share attraction data using LS-SVM (최소제곱 서포트벡터기계를 이용한 시장점유율 자료 분석)

  • Park, Hye-Jung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.5
    • /
    • pp.879-886
    • /
    • 2009
  • The purpose of this article is to present the application of Least Squares Support Vector Machine in analyzing the existing structure of brand. We estimate the parameters of the Market Share Attraction Model using a non-parametric technique for function estimation called Least Squares Support Vector Machine, which allows us to perform even nonlinear regression by constructing a linear regression function in a high dimensional feature space. Estimation by Least Squares Support Vector Machine technique makes it a good candidate for solving the Market Share Attraction Model. To illustrate the performance of the proposed method, we use the car sales data in South Korea's car market.

  • PDF

자기회귀계수에 대한 소표본 점근추론

  • Na, Jong-Hwa;Kim, Jeong-Suk;Jang, Yeong-Mi
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.209-213
    • /
    • 2005
  • 본 논문에서는 1차 자기회귀모형에서 자기회귀계수에 대한 여러 가지 추정량들의 분포함수에 대한 근사적추론 방법에 대해 연구하였다. 이차형식에 대한 안장점근사의 결과를 이용한 이 근사법은 여러 형태의 추정량들에 대해 근사분포의 유도과정이 불필요하며, 소표본은 물론 통계적 추론의 주요 관심영역에서의 근사정도가 매우 뛰어난 장점을 가지고 있다. 모의실험을 통해 Edgeworth근사를 비롯한 기존의 여러 근사법보다 효율이 뛰어남을 확인하였다.

  • PDF

Fuzzy Nonlinear Regression Model (퍼지비선형회귀모형)

  • Hwang, Seung-Gook;Park, Young-Man;Seo, Yoo-Jin;Park, Kwang-Pak
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.8 no.6
    • /
    • pp.99-105
    • /
    • 1998
  • This paper is to propose the fuzzy regression model using genetic algorithm which is fuzzy nonlinear regression model. Genetic algorithm is used to classify the input data for better fuzzy regression analysis. From this partition. each data can be have the grade of membership function which is belonged to a divided data group. The data group, from optimal partition of the region of each variable, have different fuzzy parameters of fuzzy linear regression model one another. We compound the fuzzy output of each data group so as to obtain the final fuzzy number for a data. We show the efficiency of this method by means of demonstration of a case study.

  • PDF

Assessing the accuracy of the maximum likelihood estimator in logistic regression models (로지스틱 회귀모형에서 최우추정량의 정확도 산정)

  • 이기원;손건태;정윤식
    • The Korean Journal of Applied Statistics
    • /
    • v.6 no.2
    • /
    • pp.393-399
    • /
    • 1993
  • When we compute the maximum likelihood estimators of the parameters for the logistic regression models, which are useful in studying the relationship between the binary response variable and the explanatory variable, the standard error calculations are usually based on the second derivative of log-likelihood function. On the other hand, an estimator of the Fisher information motivated from the fact that the expectation of the cross-product of the first derivative of the log-likelihood function gives the Fisher information is expected to have similar asymptotic properties. These estimators of Fisher information are closely related with the iterative algorithm to get the maximum likelihood estimator. The average numbers of iterations to achieve the maximum likelihood estimator are compared to find out which method is more efficient, and the estimators of the variance from each method are compared as estimators of the asymptotic variance.

  • PDF