• 제목/요약/키워드: 분리변수

검색결과 775건 처리시간 0.029초

회귀나무에서 변수선택 편의에 관한 연구

  • 김민호;김진흠
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.263-268
    • /
    • 2003
  • Breiman, Friedman, Olshen and Stone(1984)의 전체탐색법에 의한 회귀나무는 상대적으로 많은 분리가 가능한 변수로 분리기준이 정해지는 편의 현상을 갖고 있다. 본 연구에서는 이런 문제점을 해결할 수 있는 알고리즘을 제안하여 변수선택편의가 없는 회귀나무를 만들고자 한다. 제안하는 알고리즘은 노드의 분리변수를 선택하는 단계와 그 선택된 변수에 의해 이진분리를 위한 분리점을 찾는 단계로 구성되어 있다. 예측변수 중에서 목표변수와 가장 밀접하게 연관된 예측변수는 예측변수의 자료의 종류에 따라 스피어만의 순위상관계수에 의한 검정 혹은 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 가장 통계적으로 유의한 변수로 선택하였고, 선택된 변수에만 Breiman et al.(1984)의 전체선택법을 적용하여 분리점을 결정하였다. 모의실험을 통해 변수선택편의, 변수선택력 , 그리고 평균제곱오차 측면에서 Breiman et al. (1984)의 CART(Classification and Regression Trees)와 제안한 알고리즘을 서로 비교하였다. 또한, 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

  • PDF

변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘 (Regression Trees with. Unbiased Variable Selection)

  • 김진흠;김민호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.459-473
    • /
    • 2004
  • 본 논문에서는 Breiman 등(1984)의 전체탐색법이 갖고 있는 변수선택 편향을 극복할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 노드의 분리 변수를 선택하는 단계와 그 선택된 변수에 대해서만 이진분리를 위한 분리점을 찾는 단계로 나뉘어져 있다. 예측변수가 연속형 일 때는 스피어만의 순위상관계수에 의한 검정을 수행하고, 범주형일 때는 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 통계적으로 가장 유의한 변수를 분리변수로 선택하였고 Breiman 등(1984)의 전체탐색법을 그 변수에만 적용하여 노드의 분리기준을 정하였다 모의실험 연구를 통해 Breiman등(19히)의 CART와 제안한 알고리즘을 변수선택 편의, 변수선택력파 평균제곱오차 측면에서 서로 비교하였다. 아울러 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

의사결정나무에서 순서형 분리변수 선택에 관한 연구 (Ordinal Variable Selection in Decision Trees)

  • 김현중
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.149-161
    • /
    • 2006
  • CART로 대표되는 의사결정나무의 알고리즘에서 가장 중요한 요소는 분리변수의 선택방법이다. 대부분의 알고리즘은 변수의 형태가 연속형인지, 혹은 명목형(nominal)인지에 따라 별개의 변수선택방법을 적용한다. 하지만 변수의 형태가 순서형(ordinal)인 경우에는 그 변수를 연속형으로 취급하여 연속형 변수선택방법을 적용하는 것이 대부분이다. 이것은 CART와 같은 Greedy탐색을 이용하는 방법에는 문제점이 발생하지 않는다. 하지만 Greedy탐색의 약점을 보완하기 위해 통계이론을 이용하여 개발된 최근의 방법들에는 최선의 대처방법이 아니다. 따라서 본 연구에서는 의사결정 나무에서 분리변수를 선택하는데 있어서 비모수적 접근 방법인 Clamor-von Mises 검정을 이용한 방법을 순서형 변수에 사용하는 것을 제안하고, CART, C4.5, QUEST, CRUISE등 기존 알고리즘과 본 연구에서 제안하는 방법의 순서형 변수 선택력을 비교하였다. 모의실험의 결과, Clamor-von Mises 검정을 이용한 변수선택방법은 순서형 변수의 분류력을 기존 방법들에 비해 더 정확히 예측하는 좋은 성과를 보여주었다.

단일 디지털 필터 매개변수 기반의 기저유출 분리 기법: 민감도 분석 및 적용성 검토 (Baseflow separation methods based on a single digital filter parameter: sensitivity analysis and applicability review)

  • 진영규;강태욱;이남주;이상호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.435-435
    • /
    • 2022
  • 디지털 필터 기반의 기저유출 분리 기법은 하천유량으로부터 기저유량을 분리하는 기법으로서 적절한 분석을 위해서는 필터 매개변수에 대한 추정이 요구된다. 이 연구에서는 비교적 간단한 방법으로 기저유출을 분리할 수 있는 단일 매개변수를 가진 디지털 필터 기반의 기저유출 분리 기법에 대하여 민감도 분석을 수행하였으며, 민감도 분석 결과를 바탕으로 적정 매개변수 범위를 결정하였다. 적용된 디지털 필터 기반의 기저유출 분리 기법은 Lyne-Hollick(LH), Chapman, Chapman-Maxwell(CM), EWMA 기법이다. 분석 대상 지점은 낙동강 지류 하천 중 8년이상 연속된 유량측정 기록이 존재하는 25개 수위관측소이다. 민감도 분석을 위한 기저유출 분리 기법별 매개변수 범위는 과거 연구 사례에 근거하여 LH, Chapman, CM 기법의 경우 0.9 ~ 0.99, EWMA 기법은 0.003 ~ 0.015로 선정하였다. 기저유출 분리 기법별 민감도 분석 결과, EWMA 기법이 매개변수 변화에 따른 기저유출 지표의 변화가 가장 적은 것으로 분석되었으며, LH 기법이 민감도가 가장 큰 것으로 분석되었다. 또한, LH 기법과 EWMA 기법은 수위관측소에 따라 산정된 기저유출 지수가 큰 차이를 보였으며, 이는 각 수위관측소의 유황곡선에서 10%와 90%에 해당하는 유량의 무차원 변동량에 기인한 것으로 분석되었다. 각 기저유출 분리 기법별 적용성 검토 결과, Chapman과 CM 기법은 기저유출만 존재하는 비 강우 기간에서 기저유출을 분리하는 오류가 확인됨에 따라, 비교적 유량 변동이 큰 우리나라의 유출 특성상 Chapman과 CM 기법의 적용은 부적절한 것으로 판단된다. LH 기법과 EWMA 기법은 홍수 수문곡선 상승부에 대한 기저유출의 비율, 비 강우 기간에 대한 기저유출 분리 오류 등을 검토하여, EWMA 기법은 0.012 ~ 0.015, LH 기법은 0.950 ~ 0.975로 선정하였다.

  • PDF

열유동 상분리막의 구조연구

  • 김성수;김재진
    • 멤브레인
    • /
    • 제1권1호
    • /
    • pp.13-23
    • /
    • 1991
  • 열유도 상분리법을 이용하여 제조되는 분리막의 구조 변화를 열역학 및 속도론적 관점에서 고찰하였다. Polypropylene과 희석제로서 n-alkanes, n-fatty acids, n,n-bis(2-hydroxyethyl) tallowamine을 model system으로 하였다. 고분자/희석제 system의 상변화의 종류에 따라 다양한 형태의 분리막구조가 얻어졌다. 분리막의 구조에 영향을 미치는 변수로서 고분자/희석제간의 interaction parameter, 희석제의 분자 크기, 용액의 조성, 냉각 조건, 희석제의 결정화 온도 등이며, 각 변수의 역할을 전자현미경을 사용하여 규명하였다. 열유동 상분리법에 의하여 제조된 분리막은 inter-spherulitic 및 intra-spherulitic pore의 이중 구조로 이루어짐을 확인하였다.

  • PDF

의사결정나무에서 순서형 분리 변수 선택에 관한 연구

  • 김현중;송주미
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.283-288
    • /
    • 2004
  • 지금까지 의사결정나무에서 분리 변수의 선택에 관한 연구는 많았으나, 대부분 연속형 변수와 명목형 변수에 국한되어 왔다. 본 연구에서는 순서형 변수에 주목하여 CART, QUEST, CRUISE 등 기존 알고리즘과 본 연구에서 제안하는 비모수적 접근 방법인 K-S test, framer-von Misos test 방법의 변수 선택력을 비교하였다. 그 결과 본 연구에서 제안하는 framer-von Mises test 방법이 다른 알고리즘에 비하여, 변수 선택력과 안정성에 있어서 좋은 성과를 보였다.

  • PDF

매개변수 추정방법에 따른 강우자료의 분리효과 (Separation Effect of Rainfall Data Based on Parameter Estimation Methods)

  • 김경덕;배덕효
    • 물과 미래
    • /
    • 제29권1호
    • /
    • pp.129-139
    • /
    • 1996
  • 수공구조물의 계획과 설계에 있어서 수문자료에 대한 적정분포형을 선정하는 것은 매우 중요하며, 선정된 분포함수가 실측자료의 통계학적 특성을 잘 나타내고 있는가를 검토하는 것은 필수적인 과제이다. 본 연구에서는 전국 22개 지점, 7개 지속기간의 강우자료에 대하여 2변수 및 3변수 gamma, 2변수 및 3변수 lognormal, Gumbel, 2변수 및 3변수 log-Gumbel, GEV, log-Pearson type III, 2변수 및 3변수 Weibull, 4변수 및 5변수 Wakeby 분포를 적용하여 모멘트법, 확률가중 모멘트법, 최우도법 등으로 각 분포형의 매개변수를 추정하고, 적합성 조건을 검사하였다. 각 매개변수 추정법에 의하여 추정된 매개변수를 이용하여 10,000번 모의 발생하여 분리효과를 검토한 결과 매개변수 적합성을 고려한 경우 모멘트법에서는 log-Pearson type III 분포, 확률가중 모멘트법에서는 log-Pearson type III와 GEV 분포, 최우도법에서는 GEV 분포가 분리효과를 가장 작게 나타냈으며, 2변수 분포형의 경우 모두 분리효과가 크게 나타났다.

  • PDF

수위-유량관계곡선 개발 방법론에 관한 연구 (A Study on the Development Method of Stage-Discharge Rating Curve)

  • 이연길;권규상;김형섭;이진원;정성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.2212-2216
    • /
    • 2008
  • 본 연구는 하도특성의 불규칙으로 인해 수위와 유량이 단일 관계가 형성되지 않은 경우와 유수의 흐름이 지속되어 GZF 측정이 어려운 경우에 구간분리와 GZF를 결정하는 곡선식 개발 방법론이라 할 수 있다. 첫번째 연구과제는 저수위 구간 수위-유량관계곡선식의 GZF 추정방법의 개선에 관한 연구이다. 다음과 같은 연구를 수행하기 위해서 GZF의 변화에 따라 곡선식의 신뢰도를 분석할 수 있는 프로그램을 개발하였다. 본 연구에서 개발한 프로그램은 사용자들이 쉽게 이용할 수 있는 엑셀 VBA(Visual Basic for Applications)로 작성되었으며, 입력자료 구축 모듈, 하도단면 입력 모듈, GZF 설정 모듈, GZF 평가 등의 4개 모듈로 구성되어 있다. 두 번째 연구과제는 구간분리 유무의 기준에 관한 연구로서 수위-유량관계곡선의 신뢰도에 직접적인 영향을 미친다. 본 연구에서는 일차적으로 단면의 특성이 상이한 4개의 수위관측소를 선정하여 수위-면적 곡선과 수위-면적변화량곡선을 생성하였으며 이로부터 단면변화와 구간분리의 특성을 분석하였다. 구간분리의 기준에 영향을 미치는 변수로는 단면특성인자, 유속, 하상경사, 수면경사, 단면통제, 하도통제 등을 들 수 있으며, 또한 다음과 같은 주요변수들이 서로 복합적으로 작용되기 때문에 일정한 기준을 제시하기란 어려운 부분이라 할 수 있다. 따라서 본 연구에서는 구간분리에 영향을 미치는 주요 변수 중에서도 가장 크게 영향을 주는 변수인 하도 단면의 특성 등을 중심으로 연구를 진행하였다. 먼저 단면의 특성이 서로 상이한 수위 관측소 단면을 선정하여 수위관측소별로 저수부에서 고수위 구간까지 10cm의 등간격으로 수위별 면적을 산정하여 구간분리의 가능성을 판단하였다. 구간분리의 유무에 관한 연구는 현재 진행 중에 있으며, 향후에는 1단면, 2단면, 3단면까지 파악하여 단면 특성이 구간분리에 미치는 영향 등을 파악할 계획에 있다. 또한 하도 단면의 다양성을 고려하여 단면형상이 상이한 여러 수위관측소 지점에서 구간분리의 기준을 연구할 계획이며, 단면의 특성을 파악한 후에는 유량, 유속, 하상경사, 하도통제 등을 고려할 계획이다.

  • PDF

강우자료의 분리효과 (Separation Effect Analysis for Rainfall Data)

  • 김양수;허준행
    • 물과 미래
    • /
    • 제26권4호
    • /
    • pp.73-83
    • /
    • 1993
  • 본 연구에서는 우리나라 강우자료에 대한 분리효과를 검토하였다. 2변수 대수정규분포, 3변수 대수정규분포등, TYPE-극치분포, 2변수 Gamma 분포, 3변수 Gamma 분포, Log-Pearson Type-분포, GEV분포 등 7개 분포함수를 선정하고, Monte C미개 실험을 이용하여 과거 강우기록 자료로부터 얻은 왜곡도의 평균과 표준편차와 각 분포형들로부터 모의된 왜곡도의 평균과 표준편차와 차이를 분석하였다. 그 결과 우리나라 강우자료는 3변수 Gamma 분포를 제외한 나머지 6개 분포형에서 분리현상을 보였다.

  • PDF

CFD를 활용한 연료전지용 기액분리기 최적설계 (Optimal Design of Gas/Liquid Separator for Fuel Cell System using CFD)

  • 임종구;박종철;고백균;권기욱;신현길;허태욱;조성백
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 한국신재생에너지학회 2010년도 추계학술대회 초록집
    • /
    • pp.85.1-85.1
    • /
    • 2010
  • 캐스케이드형 연료전지 시스템에 있어서 각 스택의 단에서 전기화학반응에 의해 생성된 물을 분리하여 적절하게 배출시켜주는 것은 스택의 성능 및 내구성 향상을 위해 매우 중요하다. 이를 위해 연료전지 스택 각 단의 상이한 조건에 맞는 기액분리기의 설계가 필요하다. 유량에 따른 기액분리기의 부피와 원활한 연료 가스와 생성수의 분리를 위한 내부구조 및 입구 속도 등의 변수들에 따라 기액분리기의 성능 뿐만 아니라 연료전지 시스템 전체의 성능에 영향을 준다. 그러나 기액분리기의 폐쇄적 구조 때문에 실험을 통해 내부의 거동 및 현상을 파악할 수 없어 앞서 언급한 변수들의 효과를 확인할 수 없는 문제점이 있다. 이에 CFD(Computational Fluid Dynamics, 전산유체역학)를 활용하여 각 조건에 따른 기액분리기 내부의 현상을 파악하고 이를 통해 기액분리기 설계를 최적화하였다.

  • PDF