• Title/Summary/Keyword: 주요 변수 선택

Search Result 572, Processing Time 0.028 seconds

Assessment of Potential Distribution Possibility of the Warm-Temperate Woody Plants of East Asia in Korea (한국에서 동아시아 난대 목본식물의 잠재분포 가능성 평가)

  • Cheolho, Lee;Hwirae, Kim;Kang-Hyun, Cho;Byeongki, Choi;Bora, Lee
    • Ecology and Resilient Infrastructure
    • /
    • v.9 no.4
    • /
    • pp.269-281
    • /
    • 2022
  • The prediction of changes regarding the distribution of vegetation and plant species according to climate changes is important for ecosystem management. In this study, we attempted to develop an assessment method to evaluate the possibility of the potential distribution of warm-temperate woody plant species of East Asia in Korea. To begin with, a list of warm-temperate woody plants distributed in China and Japan, but not in Korea, was prepared, and a database consisting their global distribution and bioclimatic variables was constructed. In addition, the warm-temperate vegetation zone in Korea was delineated using the coldness index and relevant bioclimatic data were collected. After the exclusion of multicollinearity among bioclimatic variables using correlation analysis, mean temperature of the coldest quarter, mean temperature diurnal range, and annual precipitation were selected as the major variables that influence the distribution of warm-temperate plants. A multivariate environment similarity surfaces (MESS) analysis was conducted to calculate the similarity scores between the distribution of these three bioclimatic variables in the global distribution sites of the East Asian warm-temperate woody plants and the Korean warm-temperate vegetation zone. Finally, using stepwise variable-selection regression, the mean temperature of the coldest quarter and annual precipitation were selected as the main bioclimatic variables that affect the MESS similarity index. The mean temperature of the coldest quarter accounted for 88% of the total variance. For a total of 319 East Asian warm-temperate woody plant species, the possibility of their potential distribution in Korea was evaluated by applying the constructed multivariate regression model that calculates the MESS similarity index.

A study on the comparison of descriptive variables reduction methods in decision tree induction: A case of prediction models of pension insurance in life insurance company (생명보험사의 개인연금 보험예측 사례를 통해서 본 의사결정나무 분석의 설명변수 축소에 관한 비교 연구)

  • Lee, Yong-Goo;Hur, Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.1
    • /
    • pp.179-190
    • /
    • 2009
  • In the financial industry, the decision tree algorithm has been widely used for classification analysis. In this case one of the major difficulties is that there are so many explanatory variables to be considered for modeling. So we do need to find effective method for reducing the number of explanatory variables under condition that the modeling results are not affected seriously. In this research, we try to compare the various variable reducing methods and to find the best method based on the modeling accuracy for the tree algorithm. We applied the methods on the pension insurance of a insurance company for getting empirical results. As a result, we found that selecting variables by using the sensitivity analysis of neural network method is the most effective method for reducing the number of variables while keeping the accuracy.

  • PDF

Principal selected response reduction in multivariate regression (다변량회귀에서 주선택 반응변수 차원축소)

  • Yoo, Jae Keun
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.659-669
    • /
    • 2021
  • Multivariate regression often appears in longitudinal or functional data analysis. Since multivariate regression involves multi-dimensional response variables, it is more strongly affected by the so-called curse of dimension that univariate regression. To overcome this issue, Yoo (2018) and Yoo (2019a) proposed three model-based response dimension reduction methodologies. According to various numerical studies in Yoo (2019a), the default method suggested in Yoo (2019a) is least sensitive to the simulated models, but it is not the best one. To release this issue, the paper proposes an selection algorithm by comparing the other two methods with the default one. This approach is called principal selected response reduction. Various simulation studies show that the proposed method provides more accurate estimation results than the default one by Yoo (2019a), and it confirms practical and empirical usefulness of the propose method over the default one by Yoo (2019a).

Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application (선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용)

  • Kim, Dong-Il;Park, Cheong-Sool;Baek, Jun-Geol;Kim, Sung-Shick
    • Journal of the Korea Society for Simulation
    • /
    • v.18 no.4
    • /
    • pp.137-148
    • /
    • 2009
  • The purpose of this study is to implement variable selection algorithm which helps construct a reliable linear regression model. If we use all candidate variables to construct a linear regression model, the significance of the model will be decreased and it will cause 'Curse of Dimensionality'. And if the number of data is less than the number of variables (dimension), we cannot construct the regression model. Due to these problems, we consider the variable selection problem as a combinatorial optimization problem, and apply GA (Genetic Algorithm) to the problem. Typical measures of estimating statistical significance are $R^2$, F-value of regression model, t-value of regression coefficients, and standard error of estimates. We design GA to solve multi-objective functions, because statistical significance of model is not to be estimated by a single measure. We perform experiments using simulation data, designed to consider various kinds of situations. As a result, it shows better performance than LARS (Least Angle Regression) which is an algorithm to solve variable selection problems. We modify algorithm to solve portfolio selection problem which construct portfolio by selecting stocks. We conclude that the algorithm is able to solve real problems.

A Study on Reference Price in Software Packages Choice (소프트웨어패키지 선택에 있어서 준거가격에 관한 연구)

  • Lee, Jong-Beom;Lee, Guk-Cheol;Park, Yeong-Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1231-1234
    • /
    • 2002
  • 본 발표연구서는 정보유통산업이라 할 수 있는 IT분야를 선정하여 설문의 신뢰도와 관여도를 높이기 위하여 표본대상을 구매자로 하여 내적 준거가격이 결과변수에 주는 영향력이 관여도에 따라 조절되는가를 분석하기 위하여 선행 연구검토와 실증 조사를 한 결과 관여도에 따라 결과 변수에 주는 영향력이 조절될 수 있다는 것이다.

  • PDF

Assessment of Uncertainty in SWAT Model Derived from Parameter Estimation Using SWAT-CUP (SWAT-CUP 매개변수 추정에 따른 SWAT 모형 불확실성 평가)

  • Yu, Jisoo;Noh, Joonwoo;Cho, Younghyun;Hur, Youngteck;Kim, Yeonsu
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.314-314
    • /
    • 2020
  • SWAT (Soil and Water Assessment Tool)은 미국 농무성 농업연구소에서 개발된 준분포형(semi-distributed) 수문 모형으로 복합토지이용유역에서 장기간에 걸친 다양한 종류의 토양, 토지이용 및 토지관리 상태의 변화에 따른 유역의 유출량, 유사량 및 영양물질의 영향을 예측하기 위해 개발되었다. SWAT은 기본적으로 다양한 매개변수에 대한 수동 보정 기능을 제공하고 있지만 매개변수 보정에 따른 모의결과의 불확실성을 수반하게 된다. 이러한 문제를 해결하기 위해 자동보정 기능을 제공하는 SWAT-CUP (Calibration and Uncertainty Program)이 개발되었다. SWAT-CUP에서 제공하는 매개변수의 최적화 과정에서 유사한 모의 결과를 산출하는 수천 개의 매개변수조합이 존재하기 때문에 보정기법의 선택에 따라 최종 매개변수의 값이 달라질 수 있다. 불확실성을 발생시키는 요인으로 (1) 매개변수의 선택, (2) 보정 기법, (3) 목적함수, (4) 매개변수의 초기 범위, (5) 모의(simulation)의 실행(run) 및 반복(iteration) 횟수, (6) 위치, 개수 등 보정 자료의 선택 등이 주로 지목된다. 이러한 요인으로 발생하는 불확실성은 SWAT 모형의 구조 및 입력 자료에서 기인하는 것으로, 사용자의 설정에 따라 크게 좌우된다. 본 연구에서는 SWAT 매개변수 보정 과정에서 발생할 수 있는 불확실성을 평가하고, 효율적인 보정 방안을 제시하기 위해 수행되었다. 낙동강 권역의 내성천 유역을 대상으로 SWAT 모형을 구축하였으며, 내성천 본류에 위치한 수위(유량) 관측소의 자료를 활용하여 검·보정을 수행하였다. 모의 결과는 유량의 크기 뿐 아니라 유량의 발생 시기, 유역의 반응 및 증가·감소 경향성을 함께 고려하여 평가하였다. 그 결과 모형 구조에 따른 불확실성의 전이과정을 정확하게 파악하는 것은 불가능하지만 SWAT 모형의 비고유성(non-uniqueness)에 의한 불확실성을 정량화하여 나타내었다.

  • PDF

Contaminant Fate and Transport Modeling for Risk Assessment (위해성평가를 위한 지중 오염물질 거동 모델 이용)

  • Kim, Mee-Jeong;Park, Jae-Woo
    • Journal of Soil and Groundwater Environment
    • /
    • v.12 no.1
    • /
    • pp.44-52
    • /
    • 2007
  • This study reviewed the overall process of application of contaminant fate and transport model as part of risk assessment. Site characterization and establishment of a conceptual model prior to establishing or selecting a appropriate model were described. Types of models, model selection guidance, and generic site conditions for model application were presented, the process of model calibration, validation, and sensitivity analysis were reviewed. Objectives of modeling should be defined before model selection, and the complexity of selected models should balance the quantity and quality of available input data with the desired model output. If model output is highly sensitive to an assumed or default value of input parameter, or fate and transport models cannot be adequately calibrated or validated, consideration should be given to other options such as using measured data or using another model.

Groundwater level prediction model using artificial neural network technique (인공신경망기법을 이용한 지하수위 예측모형)

  • Chung, Il-Moon;Lee, Jeongwoo;Kim, Jitae;Park, Inchan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.562-562
    • /
    • 2016
  • 신경망 모형에서 학습이란 주어진 입출력시스템에 대하여 원하는 동작을 수행할 수 있도록 연결 강도를 최적의 상태로 적응(adaptation)시키는 과정을 의미한다. 따라서 강수와 지하수위의 관계를 연계시킨 인공신경망기법은 선택적으로 예측 지하수위에 영향을 미치는 변수들을 학습에 의하여 택함으로써 예측모형을 구성할 수 있다. 즉, 예측 지하수위와의 상관관계에 의하여 입력되는 변수와의 연결강도를 조정하여 매개변수 조정 및 모형의 최적화를 자동화할 수 있다. 본 연구에서는 지하수위에 영향을 주는 요소는 지하수위와 강우량이라고 가정하고, 지하수위의 입출력과정을 시계열 분석에 의하여 모형화하였으며 예측지하수위는 강우 및 지하수위의 선행조건과 매우 밀접한 관계를 갖는다. 따라서 선행강우 및 지하수위의 상태에 따라 이를 입력하여 미래의 지하수위를 예측하게 된다. 이 모형을 제주지역의 관측소에 적용한 결과 관측소별로 타당한 예측결과를 도출하였다.

  • PDF

LoadLeveler Optimization Job Environment Implement in IBM System (IBM 시스템의 LoadLeveler 최적 작업환경 구현)

  • Lee, Young-Joo;Sung, Jin-Woo;Kim, Sung-Jun;Jang, Ji-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1681-1683
    • /
    • 2010
  • 시스템의 한정된 자원을 다수의 사용자들이 프로그램을 실행 시 자원을 효율적으로 배분하기 위하여 작업관리 시스템을 사용한다. 이러한 작업관리 시스템은 여러가지 종류가 있으며 사용하는 시스템의 환경과 작업의 특성에 따라 적당한 작업관리 시스템을 선택하여 사용한다. IBM 시스템은 자체로 제공하는 작업관리 시스템으로서 LoadLeveler를 사용하고 있는데, 이러한 LoadLeveler에서의 클래스를 설계하여 작업의 처리 효율을 높혔으며 계정별 작업 우선순위를 부여하여 사용자게 선택의 폭을 넓히고 최적 환경을 구성하였다. 작업관리 시스템의 주요한 시스템 환경변수는 CPU와 메모리이고, 작업환경 변수는 작업 실행시간이다. 따라서 KISTI IBM 시스템에서는 이러한 환경을 사용자의 배분정책에 맞게 설계하여 시스템의 안정성을 유지하고 사용자의 선택에 따라 전체 작업처리 효율을 증가하였다.

거시경제변수(巨視經濟變數)와 주가(株價) - 한국주식시장(韓國株式市場)에서의 실증분석 -

  • Jeong, Gi-Ung
    • The Korean Journal of Financial Management
    • /
    • v.8 no.2
    • /
    • pp.111-129
    • /
    • 1991
  • 본 논문에서는 재정가격결정모형(裁定價格決定模型)(Arbitrage Pricing Model)을 기초로 우리나라 주식시장에 영향을 주는 거시경제변수가 무엇인가를 찾고자 하였다. 방법론면에서는 과거변수(過去變數)(lagged variables)에 의해서만 기대치를 형성시키는 AIRMA(Autoregressike Integrated with Moving Average) 방법을 이용하기보다는 마코프속성(屬性)(Markov Property)을 갖는 상태공간모형(狀態空間模型) (State Space Model)을 이용하여 보다 합리적인 거시경제 요인의 이노베이션을 하였다. 또한 단순한 요인분석(要因分析)(factor analysis)에 의한 요인추출은 요인의 표본의존성(標本依存性)(Sample dependency)이 심하므로 그룹간 요인분석(inter-battery factor analysis)을 행하여 추정(推定)된 요인(要因)(요인값 : factor score)과 요인수를 결정하여 관련 거시경제변수를 선택한다. 그룹간 요인분석을 위한 그룹을 형성할 때 그룹내에서는 동질성을 그룹간에는 이질성을 최대한 살리는 것이 필요한데, 이를 위해 군집분석(群集分析)(Cluster Analysis)을 사용한 것이 특징이다. 결론적으로 우리나라 주식시장에 영향을 미치는 거시경제요인(巨視經濟要因)으로 단위노동비율, 제조업제품재고지수, 채권프리미엄, 수출물가지수, 정부부문 통화공급, 회사채수익률, 종합주가지수 등 7가지가 있는 것으로 분석되고 있다.

  • PDF