• Title/Summary/Keyword: 분리변수

Search Result 775, Processing Time 0.027 seconds

회귀나무에서 변수선택 편의에 관한 연구

  • Kim, Min-Ho;Kim, Jin-Heum
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.263-268
    • /
    • 2003
  • Breiman, Friedman, Olshen and Stone(1984)의 전체탐색법에 의한 회귀나무는 상대적으로 많은 분리가 가능한 변수로 분리기준이 정해지는 편의 현상을 갖고 있다. 본 연구에서는 이런 문제점을 해결할 수 있는 알고리즘을 제안하여 변수선택편의가 없는 회귀나무를 만들고자 한다. 제안하는 알고리즘은 노드의 분리변수를 선택하는 단계와 그 선택된 변수에 의해 이진분리를 위한 분리점을 찾는 단계로 구성되어 있다. 예측변수 중에서 목표변수와 가장 밀접하게 연관된 예측변수는 예측변수의 자료의 종류에 따라 스피어만의 순위상관계수에 의한 검정 혹은 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 가장 통계적으로 유의한 변수로 선택하였고, 선택된 변수에만 Breiman et al.(1984)의 전체선택법을 적용하여 분리점을 결정하였다. 모의실험을 통해 변수선택편의, 변수선택력 , 그리고 평균제곱오차 측면에서 Breiman et al. (1984)의 CART(Classification and Regression Trees)와 제안한 알고리즘을 서로 비교하였다. 또한, 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

  • PDF

Regression Trees with. Unbiased Variable Selection (변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘)

  • 김진흠;김민호
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.3
    • /
    • pp.459-473
    • /
    • 2004
  • It has well known that an exhaustive search algorithm suggested by Breiman et. a1.(1984) has a trend to select the variable having relatively many possible splits as an splitting rule. We propose an algorithm to overcome this variable selection bias problem and then construct unbiased regression trees based on the algorithm. The proposed algorithm runs two steps of selecting a split variable and determining a split rule for binary split based on the split variable. Simulation studies were performed to compare the proposed algorithm with Breiman et a1.(1984)'s CART(Classification and Regression Tree) in terms of degree of variable selection bias, variable selection power, and MSE(Mean Squared Error). Also, we illustrate the proposed algorithm with real data sets.

Ordinal Variable Selection in Decision Trees (의사결정나무에서 순서형 분리변수 선택에 관한 연구)

  • Kim Hyun-Joong
    • The Korean Journal of Applied Statistics
    • /
    • v.19 no.1
    • /
    • pp.149-161
    • /
    • 2006
  • The most important component in decision tree algorithm is the rule for split variable selection. Many earlier algorithms such as CART and C4.5 use greedy search algorithm for variable selection. Recently, many methods were developed to cope with the weakness of greedy search algorithm. Most algorithms have different selection criteria depending on the type of variables: continuous or nominal. However, ordinal type variables are usually treated as continuous ones. This approach did not cause any trouble for the methods using greedy search algorithm. However, it may cause problems for the newer algorithms because they use statistical methods valid for continuous or nominal types only. In this paper, we propose a ordinal variable selection method that uses Cramer-von Mises testing procedure. We performed comparisons among CART, C4.5, QUEST, CRUISE, and the new method. It was shown that the new method has a good variable selection power for ordinal type variables.

Baseflow separation methods based on a single digital filter parameter: sensitivity analysis and applicability review (단일 디지털 필터 매개변수 기반의 기저유출 분리 기법: 민감도 분석 및 적용성 검토)

  • Jin, Youngkyu;Kang, Taeuk;Lee, Namjoo;Lee, Sangho
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.435-435
    • /
    • 2022
  • 디지털 필터 기반의 기저유출 분리 기법은 하천유량으로부터 기저유량을 분리하는 기법으로서 적절한 분석을 위해서는 필터 매개변수에 대한 추정이 요구된다. 이 연구에서는 비교적 간단한 방법으로 기저유출을 분리할 수 있는 단일 매개변수를 가진 디지털 필터 기반의 기저유출 분리 기법에 대하여 민감도 분석을 수행하였으며, 민감도 분석 결과를 바탕으로 적정 매개변수 범위를 결정하였다. 적용된 디지털 필터 기반의 기저유출 분리 기법은 Lyne-Hollick(LH), Chapman, Chapman-Maxwell(CM), EWMA 기법이다. 분석 대상 지점은 낙동강 지류 하천 중 8년이상 연속된 유량측정 기록이 존재하는 25개 수위관측소이다. 민감도 분석을 위한 기저유출 분리 기법별 매개변수 범위는 과거 연구 사례에 근거하여 LH, Chapman, CM 기법의 경우 0.9 ~ 0.99, EWMA 기법은 0.003 ~ 0.015로 선정하였다. 기저유출 분리 기법별 민감도 분석 결과, EWMA 기법이 매개변수 변화에 따른 기저유출 지표의 변화가 가장 적은 것으로 분석되었으며, LH 기법이 민감도가 가장 큰 것으로 분석되었다. 또한, LH 기법과 EWMA 기법은 수위관측소에 따라 산정된 기저유출 지수가 큰 차이를 보였으며, 이는 각 수위관측소의 유황곡선에서 10%와 90%에 해당하는 유량의 무차원 변동량에 기인한 것으로 분석되었다. 각 기저유출 분리 기법별 적용성 검토 결과, Chapman과 CM 기법은 기저유출만 존재하는 비 강우 기간에서 기저유출을 분리하는 오류가 확인됨에 따라, 비교적 유량 변동이 큰 우리나라의 유출 특성상 Chapman과 CM 기법의 적용은 부적절한 것으로 판단된다. LH 기법과 EWMA 기법은 홍수 수문곡선 상승부에 대한 기저유출의 비율, 비 강우 기간에 대한 기저유출 분리 오류 등을 검토하여, EWMA 기법은 0.012 ~ 0.015, LH 기법은 0.950 ~ 0.975로 선정하였다.

  • PDF

열유동 상분리막의 구조연구

  • ;;Douglass, K. Lolyd
    • Membrane Journal
    • /
    • v.1 no.1
    • /
    • pp.13-23
    • /
    • 1991
  • 열유도 상분리법을 이용하여 제조되는 분리막의 구조 변화를 열역학 및 속도론적 관점에서 고찰하였다. Polypropylene과 희석제로서 n-alkanes, n-fatty acids, n,n-bis(2-hydroxyethyl) tallowamine을 model system으로 하였다. 고분자/희석제 system의 상변화의 종류에 따라 다양한 형태의 분리막구조가 얻어졌다. 분리막의 구조에 영향을 미치는 변수로서 고분자/희석제간의 interaction parameter, 희석제의 분자 크기, 용액의 조성, 냉각 조건, 희석제의 결정화 온도 등이며, 각 변수의 역할을 전자현미경을 사용하여 규명하였다. 열유동 상분리법에 의하여 제조된 분리막은 inter-spherulitic 및 intra-spherulitic pore의 이중 구조로 이루어짐을 확인하였다.

  • PDF

의사결정나무에서 순서형 분리 변수 선택에 관한 연구

  • 김현중;송주미
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.283-288
    • /
    • 2004
  • 지금까지 의사결정나무에서 분리 변수의 선택에 관한 연구는 많았으나, 대부분 연속형 변수와 명목형 변수에 국한되어 왔다. 본 연구에서는 순서형 변수에 주목하여 CART, QUEST, CRUISE 등 기존 알고리즘과 본 연구에서 제안하는 비모수적 접근 방법인 K-S test, framer-von Misos test 방법의 변수 선택력을 비교하였다. 그 결과 본 연구에서 제안하는 framer-von Mises test 방법이 다른 알고리즘에 비하여, 변수 선택력과 안정성에 있어서 좋은 성과를 보였다.

  • PDF

Separation Effect of Rainfall Data Based on Parameter Estimation Methods (매개변수 추정방법에 따른 강우자료의 분리효과)

  • 김경덕;배덕효
    • Water for future
    • /
    • v.29 no.1
    • /
    • pp.129-139
    • /
    • 1996
  • It is very important to select appropriate distributions for hydrological data in planning and designing hydraulic structures. Also, it is necessary to check whether the selected distribution reproduces the statistical characteristics of the real data. In this study, the parameters of the two- and three-parameter gamma, two- and three-parameter lognormal, Gumbel, two- and three-parameter log-Gumbel, GEV, log-Pearsonn type III, two- and three-parameter Weibull, four- and five-parameter Wakeby distributions were estimated for the rainfall data of 22 sites in Korea with 7 different durations based on the methods of moments, probability weighted moments, and maximum likelihood. And the validity conditions were checked for the estimated parameters. The separation effect for each distribution was examined throught 10,000 simulations using the estimated parameters. As results, the separation effect was the smallest: log-Pearson type III for moment method, log-Pearson type III and GEV for probability weighted moment method, and GEV for maximum likelihood method. However, it is large for the two-parameter distributions.

  • PDF

A Study on the Development Method of Stage-Discharge Rating Curve (수위-유량관계곡선 개발 방법론에 관한 연구)

  • Lee, Yeon-Kil;Kwon, Kyu-Sang;Kim, Hyoung-Seop;Lee, Jin-Won;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.2212-2216
    • /
    • 2008
  • 본 연구는 하도특성의 불규칙으로 인해 수위와 유량이 단일 관계가 형성되지 않은 경우와 유수의 흐름이 지속되어 GZF 측정이 어려운 경우에 구간분리와 GZF를 결정하는 곡선식 개발 방법론이라 할 수 있다. 첫번째 연구과제는 저수위 구간 수위-유량관계곡선식의 GZF 추정방법의 개선에 관한 연구이다. 다음과 같은 연구를 수행하기 위해서 GZF의 변화에 따라 곡선식의 신뢰도를 분석할 수 있는 프로그램을 개발하였다. 본 연구에서 개발한 프로그램은 사용자들이 쉽게 이용할 수 있는 엑셀 VBA(Visual Basic for Applications)로 작성되었으며, 입력자료 구축 모듈, 하도단면 입력 모듈, GZF 설정 모듈, GZF 평가 등의 4개 모듈로 구성되어 있다. 두 번째 연구과제는 구간분리 유무의 기준에 관한 연구로서 수위-유량관계곡선의 신뢰도에 직접적인 영향을 미친다. 본 연구에서는 일차적으로 단면의 특성이 상이한 4개의 수위관측소를 선정하여 수위-면적 곡선과 수위-면적변화량곡선을 생성하였으며 이로부터 단면변화와 구간분리의 특성을 분석하였다. 구간분리의 기준에 영향을 미치는 변수로는 단면특성인자, 유속, 하상경사, 수면경사, 단면통제, 하도통제 등을 들 수 있으며, 또한 다음과 같은 주요변수들이 서로 복합적으로 작용되기 때문에 일정한 기준을 제시하기란 어려운 부분이라 할 수 있다. 따라서 본 연구에서는 구간분리에 영향을 미치는 주요 변수 중에서도 가장 크게 영향을 주는 변수인 하도 단면의 특성 등을 중심으로 연구를 진행하였다. 먼저 단면의 특성이 서로 상이한 수위 관측소 단면을 선정하여 수위관측소별로 저수부에서 고수위 구간까지 10cm의 등간격으로 수위별 면적을 산정하여 구간분리의 가능성을 판단하였다. 구간분리의 유무에 관한 연구는 현재 진행 중에 있으며, 향후에는 1단면, 2단면, 3단면까지 파악하여 단면 특성이 구간분리에 미치는 영향 등을 파악할 계획에 있다. 또한 하도 단면의 다양성을 고려하여 단면형상이 상이한 여러 수위관측소 지점에서 구간분리의 기준을 연구할 계획이며, 단면의 특성을 파악한 후에는 유량, 유속, 하상경사, 하도통제 등을 고려할 계획이다.

  • PDF

Separation Effect Analysis for Rainfall Data (강우자료의 분리효과)

  • 김양수;허준행
    • Water for future
    • /
    • v.26 no.4
    • /
    • pp.73-83
    • /
    • 1993
  • This study focuses on the separation effect analysis of rainfall data for 2-parameter log-normal, 3-parameter log-normal, type-extreme value, 2-parameter gamma, 3-parameter gamma, log-Pearson type-III, and general extreme value distribution functions. Difference in the relationship between the mean and standard deviation of skewness for historical data and relations derived from 7 distribution functions are analyzed suing the Monte Carlo experiment. The results show that rainfall data has the separation effect for 6 distribution functions except 3-parameter gamma distribution function.

  • PDF

Optimal Design of Gas/Liquid Separator for Fuel Cell System using CFD (CFD를 활용한 연료전지용 기액분리기 최적설계)

  • Lim, Jongkoo;Park, Jongcheol;Kho, Back Kyun;Kwon, Ki Wook;Shin, Hyunkhil;Hur, Taeuk;Cho, Sungbaek
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2010.11a
    • /
    • pp.85.1-85.1
    • /
    • 2010
  • 캐스케이드형 연료전지 시스템에 있어서 각 스택의 단에서 전기화학반응에 의해 생성된 물을 분리하여 적절하게 배출시켜주는 것은 스택의 성능 및 내구성 향상을 위해 매우 중요하다. 이를 위해 연료전지 스택 각 단의 상이한 조건에 맞는 기액분리기의 설계가 필요하다. 유량에 따른 기액분리기의 부피와 원활한 연료 가스와 생성수의 분리를 위한 내부구조 및 입구 속도 등의 변수들에 따라 기액분리기의 성능 뿐만 아니라 연료전지 시스템 전체의 성능에 영향을 준다. 그러나 기액분리기의 폐쇄적 구조 때문에 실험을 통해 내부의 거동 및 현상을 파악할 수 없어 앞서 언급한 변수들의 효과를 확인할 수 없는 문제점이 있다. 이에 CFD(Computational Fluid Dynamics, 전산유체역학)를 활용하여 각 조건에 따른 기액분리기 내부의 현상을 파악하고 이를 통해 기액분리기 설계를 최적화하였다.

  • PDF