• Title/Summary/Keyword: 주요 변수 선택

Search Result 569, Processing Time 0.028 seconds

Input Variable Selection by Principal Component Analysis and Mutual Information Estimation (주요성분분석과 상호정보 추정에 의한 입력변수선택)

  • Jo, Yong-Hyeon;Hong, Seong-Jun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.175-178
    • /
    • 2006
  • 본 논문에서는 주요성분분석과 상호정보 추정을 조합한 입력변수선택 기법을 제안하였다. 여기서 주요성분분석은 2차원 통계성을 이용하여 입력변수 간의 독립성을 찾기 위함이고, 상호정보의 추정은 적응적 분할을 이용하여 입력변수의 확률밀도함수를 계산함으로써 변수상호간의 종속성을 좀더 정확하게 측정하기 위함이다. 제안된 기법을 인위적으로 제시된 각 500개의 샘플을 가지는 6개의 독립신호와 1개의 종속신호를 대상으로 실험한 결과, 빠르고 정확한 변수의 선택이 이루어짐을 확인하였다.

  • PDF

The correlation and regression analyses based on variable selection for the university evaluation index (대학 평가지표들에 대한 상관분석과 변수선택에 의한 선형모형추정)

  • Song, Pil-Jun;Kim, Jong-Tae
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.3
    • /
    • pp.457-465
    • /
    • 2012
  • The purpose of this study is to analyze the association between indicators and to find statistical models based on important indicators at 'College Notifier' in Korea Council for University Education. First, Pearson correlation coefficients are used to find statistically significant correlations. By variable selection method, the important indicators are selected and their coefficients are estimated. As variable selection method, backward and stepwise methods are employed.

Variable selection with quantile regression tree (분위수 회귀나무를 이용한 변수선택 방법 연구)

  • Chang, Youngjae
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.6
    • /
    • pp.1095-1106
    • /
    • 2016
  • The quantile regression method proposed by Koenker et al. (1978) focuses on conditional quantiles given by independent variables, and analyzes the relationship between response variable and independent variables at the given quantile. Considering the linear programming used for the estimation of quantile regression coefficients, the model fitting job might be difficult when large data are introduced for analysis. Therefore, dimension reduction (or variable selection) could be a good solution for the quantile regression of large data sets. Regression tree methods are applied to a variable selection for quantile regression in this paper. Real data of Korea Baseball Organization (KBO) players are analyzed following the variable selection approach based on the regression tree. Analysis result shows that a few important variables are selected, which are also meaningful for the given quantiles of salary data of the baseball players.

Input Variables Selection by Principal Component Analysis and Mutual Information Estimation (주요성분분석과 상호정보 추정에 의한 입력변수선택)

  • Cho, Yong-Hyun;Hong, Seong-Jun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.2
    • /
    • pp.220-225
    • /
    • 2007
  • This paper presents an efficient input variable selection method using both principal component analysis(PCA) and adaptive partition mutual information(AP-MI) estimation. PCA which is based on 2nd order statistics, is applied to prevent a overestimation by quickly removing the dependence between input variables. AP-MI estimation is also applied to estimate an accurate dependence information by equally partitioning the samples of input variable for calculating the probability density function. The proposed method has been applied to 2 problems for selecting the input variables, which are the 7 artificial signals of 500 samples and the 24 environmental pollution signals of 55 samples, respectively. The experimental results show that the proposed methods has a fast and accurate selection performance. The proposed method has also respectively better performance than AP-MI estimation without the PCA and regular partition MI estimation.

자본시장심리지수와 금융투자자 휴리스틱에 관한 연구

  • Kim, Seok-Hwan;Gang, Hyeong-Gu
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2020.11a
    • /
    • pp.179-184
    • /
    • 2020
  • 본 연구는 확장된 합리적 행동이론(ETRA)을 이용하여 주식투자 시 자본시장심리지수를 기반으로 한 어플리케이션의 선택행동에 영향을 끼치는 요인들과 투자자의 휴리스틱과의 관계를 알아보는데 있다. 연구자는 개별 투자자의 휴리스틱이 선택행동에 영향을 미칠 것으로 추정하고 대표성 휴리스틱, 가용성 휴리스틱, 감정 휴리스틱을 측정하여 선택행동에 영향을 미치는 매개변수로 분석을 하였다. 연구모델의 경로계수 분석결과는 다음과 같다. 첫째, 독립변수인 투자기회확장 그리고 매개변수인 휴리스틱 중 대표성 휴리스틱이 행동의도에 영향을 미치는 것으로 나타났다. 둘째, 행동의도가 종속변수인 선택행동에 영향을 미치고 매개변수인 가용성 휴리스틱이 선택행동에 영향을 미치는 것으로 나타났다. 연구모형에서 대표성 휴리스틱에 영향을 주는 독립변수는 혁신적 성향, 투자기회확장, 사용비용, 그리고 인지된 효익이며 반면에 가용성 휴리스틱에 영향을 주는 독립변수는 혁신적 성향과 투자기회확장으로 밝혀졌다. 매개효과 검증결과에 의하면 서비스다양성은 선택행동에 영향을 미치는데 휴리스틱의 매개효과가 없고 직접효과만 있는 것으로 밝혀졌다. 반면에 투자기회확장은 선택행동에 미치는 직접효과는 통계적으로 유의하지 않고 매개변수 휴리스틱의 간접효과 값이 0.217이고 통계적으로 유의하여 매개효과가 있는 것으로 밝혀졌다. 휴리스틱의 매개효과를 개별적으로 확인한 결과 첫째, 대표성 휴리스틱은 매개효과를 통한 간접효과가 없는 것으로 확인되었다. 둘째, 가용성 휴리스틱은 매개효과의 크기가 0.1360이고 경로계수가 통계적으로 유의하게 나타나 매개효과를 통한 간접효과가 있다는 것을 확인하였다. 따라서 독립변수 투자기회확장은 시장 심리지수를 기반으로 한 어플리케이션에 대한 선택행동에 영향을 미치는데 직접적으로 영향을 미치지 않고 투자자의 가용성 휴리스틱이 매개가 되어 간접적으로 선택행동에 영향을 나타내는 것을 실증적으로 확인하였다.

  • PDF

Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise (OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정)

  • Kim, Kyung-Tak;Kim, Joo-Hun;Park, Jung-Sool
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

Valuing Recreational Benefits of Dam Lakes with a Combined Model of Revealed and Stated Preference Methods (댐호수의 특성별 휴양가치 분석 : 현시선호모형, 진술선호모형 및 그 혼합모형)

  • Kwon, Oh-Sang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.247-253
    • /
    • 2006
  • 본고는 주요 댐호수의 휴양가치를 댐호수의 특성별로 도출하고자 실제로 댐호수를 선택한 행위를 분석하고, 아울러 선택실험을 통해 가상적으로 설정된 특성을 가진 댐을 방문할지를 선택하도록 하여 그 결과를 분석하기도 하였다. 또한 현시선호된 선택과 진술선호선택을 모두 결합하여 분석하는 기법도 사용하였다. 분석결과 진술선호자료와 현시선호자료간의 이질성이 상당한 것으로 나타났으나 두 자료를 결합함으로써 모든 특성변수들이 만족도에 미치는 영향이 직관과 부합되도록 도출되었다. 댐호수의 수량과 수질 모두가 레크리에이션 가치에 영향을 미치는 것으로 나타났으나, 특히 수질개선의 편익 증가효과가 매우 크다는 것이 확인되었다. 그 외에도 홍보관, 주변 숙박시설 및 음식점, 인근 휴양지와의 연계성 등도 휴양가치 증가에 영향을 미치는 주요 변수로 파악되었다.

  • PDF

Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics (약물유전체학에서 약물반응 예측모형과 변수선택 방법)

  • Kim, Kyuhwan;Kim, Wonkuk
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.153-166
    • /
    • 2021
  • A main goal of pharmacogenomics studies is to predict individual's drug responsiveness based on high dimensional genetic variables. Due to a large number of variables, feature selection is required in order to reduce the number of variables. The selected features are used to construct a predictive model using machine learning algorithms. In the present study, we applied several hybrid feature selection methods such as combinations of logistic regression, ReliefF, TurF, random forest, and LASSO to a next generation sequencing data set of 400 epilepsy patients. We then applied the selected features to machine learning methods including random forest, gradient boosting, and support vector machine as well as a stacking ensemble method. Our results showed that the stacking model with a hybrid feature selection of random forest and ReliefF performs better than with other combinations of approaches. Based on a 5-fold cross validation partition, the mean test accuracy value of the best model was 0.727 and the mean test AUC value of the best model was 0.761. It also appeared that the stacking models outperform than single machine learning predictive models when using the same selected features.

ASPEN 코드를 이용한 석탄가스화기내 주요 변수들의 가스화 성능에 대한 영향

  • 이승종;마수만;윤용승;김형택
    • Proceedings of the Korea Society for Energy Engineering kosee Conference
    • /
    • 1993.11a
    • /
    • pp.37-41
    • /
    • 1993
  • ASPEN 코드를 이용하여 석탄가스화기에 영향을 주는 온도, 압력, 산화제 및 증기를 변수로 선택하여 각 변수의 변화에 따른 가스화기의 온도 및 생성가스의 조성 변화를 살펴보았다. 석탄가스화기는 combustion zone, char gasification zone 및 gas shift reaction zone의 3부분으로 나뉘어 각 영역의 특성에 맞게 모사 되었다. 온도와 산화제는 석탄가스화기에 커다란 영향을 주는 요소로 나타났고, 압력과 증기 또한 주요 변수인 것으로 나타났다. 본 연구의 궁극적 목적은 석탄가스화기의 운전 조건을 최적화하는데 있다.

  • PDF

A study on the Factors Influencing Traveler's Mode Choice (통행수단선택에 영향을 미치는 요인에 관한 연구 - 지역특성이 통행수단선택에 미치는 영향에 대해서 -)

  • Gwon, Se-Na;Kim, Hyeong-Jin;Son, Bong-Su
    • Proceedings of the KOR-KST Conference
    • /
    • 2007.02a
    • /
    • pp.181-190
    • /
    • 2007
  • The purpose of this study is to analyze the effects of the regional characteristics on traveler's mode choice - private car, bus, and subway - by developing multinomial legit model for commuting and shopping trips respectively. In results, this study argues that the regional characteristics affecting commuting trips are very different from those influencing shopping trips. The research on the regional characteristics and their impact on the individuals' travel mode choice can find these variables have a significance.

  • PDF