• Title/Summary/Keyword: 선택변수모형

Search Result 608, Processing Time 0.028 seconds

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.2
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF

Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise (OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정)

  • Kim, Kyung-Tak;Kim, Joo-Hun;Park, Jung-Sool
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

Subset Selection in the Poisson Models - A Normal Predictors case - (포아송 모형에서의 설명변수 선택문제 - 정규분포 설명변수하에서 -)

  • 박종선
    • The Korean Journal of Applied Statistics
    • /
    • v.11 no.2
    • /
    • pp.247-255
    • /
    • 1998
  • In this paper, a new subset selection problem in the Poisson model is considered under the normal predictors. It turns out that the subset model has bigger valiance than that of the Poisson model with random predictors and this has been used to derive new subset selection method similar to Mallows'$C_p$.

  • PDF

A Development of Transport Choice Models using Fuzzy Approximate Reasoning Methods (퍼지근사추론을 이용한 교통수단 선택모형 구축)

  • 원제무;손기복
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.1
    • /
    • pp.99-110
    • /
    • 1998
  • 본 연구에서는 인간의 판단과 유산한 구조를 갖는 퍼지근사추론모형(FARM)을 구축하여 교통수단 선택형태에 적용하고자 하였다. 이를 위해 먼저 근사추론모형의 이론적 배경을 살펴보고 버스와 지하철간의 수단선택 모형을 구축하였다. 입력변수로 버스와 지하철간의 총통행시간의 차이와 총통행비용의 차이를 선정하였으며 출력변수로 버스이용확률을 사용하였다. 각 변수에 대한 퍼지집합은 각각 5개씩의 언어적 인 표현으로 구성하였으며, 규칙은 총 25개로 설정하였다, 구축된모형의 현실적 타당성을 검토하기 위해 서 실제 조사자료와 비교하였다. 분석결과 본 연구에서 구축된 퍼지근사추론모형이 통행자들의 수단선택 행태를 현실적으로 설명하는 것으로 나타났다.

  • PDF

Variable Selection in PLS Regression with Penalty Function (벌점함수를 이용한 부분최소제곱 회귀모형에서의 변수선택)

  • Park, Chong-Sun;Moon, Guy-Jong
    • Communications for Statistical Applications and Methods
    • /
    • v.15 no.4
    • /
    • pp.633-642
    • /
    • 2008
  • Variable selection algorithm for partial least square regression using penalty function is proposed. We use the fact that usual partial least square regression problem can be expressed as a maximization problem with appropriate constraints and we will add penalty function to this maximization problem. Then simulated annealing algorithm can be used in searching for optimal solutions of above maximization problem with penalty functions added. The HARD penalty function would be suggested as the best in several aspects. Illustrations with real and simulated examples are provided.

Variable selection in partial linear regression using the least angle regression (부분선형모형에서 LARS를 이용한 변수선택)

  • Seo, Han Son;Yoon, Min;Lee, Hakbae
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.6
    • /
    • pp.937-944
    • /
    • 2021
  • The problem of selecting variables is addressed in partial linear regression. Model selection for partial linear models is not easy since it involves nonparametric estimation such as smoothing parameter selection and estimation for linear explanatory variables. In this work, several approaches for variable selection are proposed using a fast forward selection algorithm, least angle regression (LARS). The proposed procedures use t-test, all possible regressions comparisons or stepwise selection process with variables selected by LARS. An example based on real data and a simulation study on the performance of the suggested procedures are presented.

Development of a Behavioral Mode Choice Model for Road Goods Movement (형태요소를 적용한 화물수송수단 선택 모형의 개발)

  • 최창호
    • Proceedings of the KOR-KST Conference
    • /
    • 1999.03a
    • /
    • pp.95-109
    • /
    • 1999
  • 기존의 추정된 화물 수요모형은 화물의 출하특성과 관련된 설명변수를 중심으로 추정되었으며, 이에 따라 수송수단 선택 과정에서 화주가 느끼는 실제의 인식 상황을 모형내에 적절히 반영하지 못하였다. 본 연구는 기존 연구가 갖는 한계점을 극복하고자 화주가 수송수단을 선택할 때 느끼는 인식상황을 모형 내에 적용시켜 수단 선택 특성을 분석하였다. 연구대상은 우리나라의 188개 제조업체에서 화물자동차로 출하한 내수용 화물이며, 연구의 범위도 현실 운송체계 내에서 화주의 수단선택 행태를 설명하는 단기간의 예측으로 제한하였다. 모형추정결과 우리나라의 공로화물수송을 해석하기 위해서는, 출하중량까지를 고려한 다항로짓모형 형태이면서 인식 요소를 행태변수로 추가한 모형을 이용하는 것이 가장 적절하다는 결론을 내렸다. 그리고 이에 따라 주요한 설명 변수들의 탄력성과 화주의 인식 요소에 대한 특성값을 분석하여 제시하였다. 연구결과는 활용성 측면에서 직접 활용이 가능한 것과 잠재적인 변화를 예측하는데 이용되는 것으로 구분된다. 먼저 직접활용이 가능한 것은 수송수단과 관계된 변수들을 해석하여 얻는데, 수송비용과 수송시간에 대한 계수값의 크기와 부호, 그리고 탄력성은 정부의 정책부서나 운송인의 계획수립에 직접 적용된다. 다음으로 화주의 인식 요소는 잠재적인 변화를 예측하는데 이용되며 각 요소가 갖는 탄력성 및 특징은 운송인의 고객관리 기준이된다.

Design and Implementation of Travel Mode Choice Model Using the Bayesian Networks of Data Mining (데이터마이닝의 베이지안 망 기법을 이용한 교통수단선택 모형의 설계 및 구축)

  • Kim, Hyun-Gi;Kim, Kang-Soo;Lee, Sang-Min
    • Journal of Korean Society of Transportation
    • /
    • v.22 no.2 s.73
    • /
    • pp.77-86
    • /
    • 2004
  • In this study, we applied the Bayesian Network for the case of the mode choice models using the Seoul metropolitan area's house trip survey Data. Sex and age were used lot the independent variables for the explanation or the mode choice, and the relationships between the mode choice and the travellers' social characteristics were identified by the Bayesian Network. Furthermore, trip and mode's characteristics such as time and fare were also used for independent variables and the mode choice models were developed. It was found that the Bayesian Network were useful tool to overcome the problems which were in the traditional mode choice models. In particular, the various transport policies could be evaluated in the very short time by the established relation-ships. It is expected that the Bayesian Network will be utilized as the important tools for the transport analysis.

Analysis of Green Vehicle Purchasing Behavior Using Logit Model (로짓모형을 이용한 친환경차 구매행태 분석)

  • HAHN, Jin-Seok;LEE, Jang-Ho
    • Journal of Korean Society of Transportation
    • /
    • v.34 no.2
    • /
    • pp.135-145
    • /
    • 2016
  • This study assumes a vehicle choice model based on the multinomial model and analyzes the vehicle choice behaviors of consumer. An SP survey targeting drivers was implemented and data was collected for model estimates, with the possible choice options of the survey takers limited to gasoline, HEV, PHEV, and EV vehicles. The explanatory variable mostly displayed a significance level of under 5%, and excluding variables for price and fuel the remaining variables were all consistent with the logical direction with the plus (+) sign and the results were determined to be rational. Consumers selecting mid-size & full-size vehicles are able to afford more than consumers that selected other vehicle types, so there was relatively little consideration given to low fuel costs when compared to vehicle price. For this reason, it was determined that for the full-size vehicle model the fuel variable could be disregarded. Socio-economic variables that were statistically significant were the age and infor variables for the sub-compact & compact, the age, infor and inc3 variables for the mid-sized & full-size vehicles.

Joint penalization of components and predictors in mixture of regressions (혼합회귀모형에서 콤포넌트 및 설명변수에 대한 벌점함수의 적용)

  • Park, Chongsun;Mo, Eun Bi
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.2
    • /
    • pp.199-211
    • /
    • 2019
  • This paper is concerned with issues in the finite mixture of regression modeling as well as the simultaneous selection of the number of mixing components and relevant predictors. We propose a penalized likelihood method for both mixture components and regression coefficients that enable the simultaneous identification of significant variables and the determination of important mixture components in mixture of regression models. To avoid over-fitting and bias problems, we applied smoothly clipped absolute deviation (SCAD) penalties on the logarithm of component probabilities suggested by Huang et al. (Statistical Sinica, 27, 147-169, 2013) as well as several well-known penalty functions for coefficients in regression models. Simulation studies reveal that our method is satisfactory with well-known penalties such as SCAD, MCP, and adaptive lasso.