• 제목/요약/키워드: Regression trees

검색결과 244건 처리시간 0.512초

An assessment of machine learning models for slump flow and examining redundant features

  • Unlu, Ramazan
    • Computers and Concrete
    • /
    • 제25권6호
    • /
    • pp.565-574
    • /
    • 2020
  • Over the years, several machine learning approaches have been proposed and utilized to create a prediction model for the high-performance concrete (HPC) slump flow. Despite HPC is a highly complex material, predicting its pattern is a rather ambitious process. Hence, choosing and applying the correct method remain a crucial task. Like some other problems, prediction of HPC slump flow suffers from abnormal attributes which might both have an influence on prediction accuracy and increases variance. In recent years, different studies are proposed to optimize the prediction accuracy for HPC slump flow. However, more state-of-the-art regression algorithms can be implemented to create a better model. This study focuses on several methods with different mathematical backgrounds to get the best possible results. Four well-known algorithms Support Vector Regression, M5P Trees, Random Forest, and MLPReg are implemented with optimum parameters as base learners. Also, redundant features are examined to better understand both how ingredients influence on prediction models and whether possible to achieve acceptable results with a few components. Based on the findings, the MLPReg algorithm with optimum parameters gives better results than others in terms of commonly used statistical error evaluation metrics. Besides, chosen algorithms can give rather accurate results using just a few attributes of a slump flow dataset.

회귀의사결정나무에서의 관심노드 찾는 분류 기준법 (Interesting Node Finding Criteria for Regression Trees)

  • 이영섭
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.45-53
    • /
    • 2003
  • 의사결정나무 분석 기법 중 하나인 회귀의사결정나무는 연속적인 반응변수를 예측할 때 사용된다. 나무 구조를 형성할 때, 전통적인 분류 기준법은 왼쪽과 오른쪽 자식노드의 불순도를 결합하여 이루어진다. 그러나 본 논문에서 제안하는 새로운 분류 기준법은 관심있는 한쪽만 선택하고 다른 나머지 자식노드는 큰 관심이 없어 무시함으로써 더 이상 결합하여 구하는 것이 아니다. 따라서 나무 구조는 불균형적일 수 있으나 이해하기가 쉽다. 즉, 관심있는 부분집합을 가능한 한 빨리 찾음으로써 단지 몇 개의 조건으로 쉽게 표현할 수 있으며, 정확도는 다소 떨어지지만 설명력은 아주 높다.

도시 상록 조경수의 탄소저장 및 흡수 - 소나무와 잣나무를 대상으로 - (Carbon Storage and Uptake by Evergreen Trees for Urban Landscape - For Pinus densiflora and Pinus koraiensis -)

  • 조현길;김진영;박혜미
    • 한국환경생태학회지
    • /
    • 제27권5호
    • /
    • pp.571-578
    • /
    • 2013
  • 본 연구는 도시의 주요 상록 조경수종인 소나무와 잣나무를 대상으로, 직접수확법을 통해 탄소저장 및 흡수를 용이하게 추정하는 회귀모델을 제시하고 도시수목의 탄소저감 효과를 계량화하는데 필요한 기반정보를 구축하였다. 수종별로 유목에서 성목에 이르는 일정 간격의 흉고직경 크기를 고려하여 개방 생장하는 조경수목을 구입한 후, 근굴취를 포함하는 직접수확법에 의해 개체당 부위별 및 전체 생체량을 측정하고 탄소저장량을 산출하였다. 또한, 흉고 부위의 수간원판을 채취하여 직경생장을 분석하고 탄소흡수량을 산정하였다. 흉고직경을 독립변수로 생장에 따른 수종별 단목의 탄소저장 및 흡수를 계량화하는 활용 용이한 회귀모델을 유도하였다. 이들 회귀식의 $r^2$는 0.98 이상으로서 적합도가 상당히 높았다. 동일 직경의 탄소저장 및 흡수량은 유목의 경우 소나무가 잣나무보다 더 많았으나, 20cm 이상 성목의 경우 생장량 차이에 기인하여 그 반대인 경향을 보였다. 흉고직경 25cm인 소나무와 잣나무는 각각 115.6kg, 130.0kg의 탄소를 저장하고, 연간 9.4kg, 14.6kg의 탄소를 흡수하는 것으로 나타났다. 본 연구는 조경수목의 직접 벌목 및 근굴취의 난이성에 기인하여, 생체량 확장계수, 지하부/지상부 비율, 직경생장 등 산림수목의 계수를 대용하여 대상수종의 탄소저감을 계량화한 기존 연구의 한계성을 극복할 새로운 초석을 마련하였다.

변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘 (Regression Trees with. Unbiased Variable Selection)

  • 김진흠;김민호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.459-473
    • /
    • 2004
  • 본 논문에서는 Breiman 등(1984)의 전체탐색법이 갖고 있는 변수선택 편향을 극복할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 노드의 분리 변수를 선택하는 단계와 그 선택된 변수에 대해서만 이진분리를 위한 분리점을 찾는 단계로 나뉘어져 있다. 예측변수가 연속형 일 때는 스피어만의 순위상관계수에 의한 검정을 수행하고, 범주형일 때는 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 통계적으로 가장 유의한 변수를 분리변수로 선택하였고 Breiman 등(1984)의 전체탐색법을 그 변수에만 적용하여 노드의 분리기준을 정하였다 모의실험 연구를 통해 Breiman등(19히)의 CART와 제안한 알고리즘을 변수선택 편의, 변수선택력파 평균제곱오차 측면에서 서로 비교하였다. 아울러 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

Model Selection for Tree-Structured Regression

  • Kim, Sung-Ho
    • Journal of the Korean Statistical Society
    • /
    • 제25권1호
    • /
    • pp.1-24
    • /
    • 1996
  • In selecting a final tree, Breiman, Friedman, Olshen, and Stone(1984) compare the prediction risks of a pair of tree, where one contains the other, using the standard error of the prediction risk of the larger one. This paper proposes an approach to selection of a final tree by using the standard error of the difference of the prediction risks between a pair of trees rather than the standard error of the larger one. This approach is compared with CART's for simulated data from a simple regression model. Asymptotic results of the approaches are also derived and compared to each other. Both the asymptotic and the simulation results indicate that final trees by CART tend to be smaller than desired.

  • PDF

퍼지의사결정을 이용한 교량 구조물의 건전성평가 모델 (Integrity Assessment Models for Bridge Structures Using Fuzzy Decision-Making)

  • 안영기;김성칠
    • 콘크리트학회논문집
    • /
    • 제14권6호
    • /
    • pp.1022-1031
    • /
    • 2002
  • 본 연구에서는 분규ㆍ회귀목-적응 뉴고 퍼지추론 시스템을 사용하여 교량 구조물에 대한 유용한 모델을 제시하였다. 퍼지결정목은 데이터집합의 입력영역이 서로 다른 영역으로 분류되고 하나의 부호나 값으로 나타내지며 데이터 정점에서 특정화시키기 위한 활동영역으로 할당되기도 한다. 분류문제로 사용되는 결정목은 가끔 퍼지결정목이라고 불려지는데, 각 최종점은 주어진 특정백터의 예측등급을 나타낸다. 회귀문제에 사용되는 결정목을 가끔 퍼지회귀목이라고 하는데, 이 때 최종점 영역은 주어진 입력백터의 예측 출력 값을 상수나 방정식으로 나타낼 수 있다. 분류ㆍ회귀목은 관련된 입력값을 선택하여 입력구역에서 분류 할 수 있는 반면에 적응 뉴로 퍼지추론 시스템은 회귀문제를 수정하고 이틀의 회귀문제를 보다 연속적이면서 간략하게 만들 수 있음을 주목해야 한다. 따라서 분류ㆍ회귀목과 적응 뉴로 퍼지추론 시스템은 서로 상보적인 것이며, 이들의 조합은 퍼지모델링을 위해 실직적인 근사식으로 구성된다.

CART 분석을 이용한 지하철 소음모형 개발 및 특성 연구 (The Development of Models and the Characteristics for Subway Noise Using the Classification and Regression Trees)

  • 김태호;이재명;원제무;송인석
    • 한국철도학회논문집
    • /
    • 제10권5호
    • /
    • pp.480-486
    • /
    • 2007
  • 대도시에서 지하철은 많은 도시민들에게 필요한 대중교통수단이다. 그러나 이용수요가 증가함에 따라 환경에 관련된 많은 문제가 발생하였다. 본 연구는 최근 사회적 관심사가 되어 있는 지하철 차내소음 문제를 연구대상으로 선정하였다. 지하철 5호선의 기하구조 및 운영요인을 수집하고, CART분석을 통해 소음자료 특성을 반영한 소음 영향모형을 개발하였다. 모형개발결과 지하철 기하구조 및 운영적 측면의 유형별로 소음에 미치는 영향들에 차이가 있는 것으로 나타났다.

도심 수목이 분산형 주거 태양광에너지 잠재량에 미치는 영향 (The Effect of Urban Trees on Residential Solar Energy Potential)

  • 고예강
    • 한국조경학회지
    • /
    • 제42권1호
    • /
    • pp.41-49
    • /
    • 2014
  • 본 연구는 미국 샌프란시스코시 수목 음영이 개별 건물 지붕 및 옥상에 입사되는 태양에너지 잠재량에 미치는 영향을 LiDAR를 이용한 고해상도 3차원 수치모델을 이용하여 공간적으로 정량화하였다. 최근 분산형 태양광 발전이 기후변화 대응에 중요한 부분으로 주목받고 있으나, 이러한 도심 태양광 발전은 주변부의 지형, 건물, 지붕모양, 수목 등의 음영에 의해 발전량이 제한되는 특성이 있다. 특히 건물 주변의 수목의 경우 도시열섬현상의 저감, 냉난방 에너지 수요량의 절감 등의 순기능과 태양광 발전량 감소의 역기능을 동시에 가지고 있어 두 가지 효용의 상충을 최소화하기 위해 해당 위치에 대한 공간적 분석이 요구된다. 샌프란시스코시 전체 건물 지붕면적의 태양에너지 총량은 년간 18,326,671 MWh으로, 수목의 음영에 의한 감소량은 326,406 MWh로 총량의 1.78%에 해당하였다. 건물지붕의 단위 면적당 일조량은 $34.4kWh/m^2/year$에서 $1,348.4kWh/m^2/year$ 범위로 산출되었다. 본 연구를 통해 도심 수목에 의한 건물별 일조에너지 감소량의 공간자료가 구축되었으며, 개별 건물지붕에 일조량의 변이를 주변 수목의 밀도, 평균수고, 수고의 분산값을 이용한 회귀모델을 통해 설명하였다. 본 연구는 도심수목의 환경적 순기능을 유지함과 동시에 태양광 발전 감소량의 최소화 할 수 있는 방법을 제공함으로써 지속가능한 도시를 구축하는데 기여할 것으로 기대된다.

Data-driven approach to machine condition prognosis using least square regression trees

  • Tran, Van Tung;Yang, Bo-Suk;Oh, Myung-Suck
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2007년도 추계학술대회논문집
    • /
    • pp.886-890
    • /
    • 2007
  • Machine fault prognosis techniques have been considered profoundly in the recent time due to their profit for reducing unexpected faults or unscheduled maintenance. With those techniques, the working conditions of components, the trending of fault propagation, and the time-to-failure are forecasted precisely before they reach the failure thresholds. In this work, we propose an approach of Least Square Regression Tree (LSRT), which is an extension of the Classification and Regression Tree (CART), in association with one-step-ahead prediction of time-series forecasting technique to predict the future conditions of machines. In this technique, the number of available observations is firstly determined by using Cao's method and LSRT is employed as prognosis system in the next step. The proposed approach is evaluated by real data of low methane compressor. Furthermore, the comparison between the predicted results of CART and LSRT are carried out to prove the accuracy. The predicted results show that LSRT offers a potential for machine condition prognosis.

  • PDF