• 제목/요약/키워드: Visualization of prediction functions

검색결과 5건 처리시간 0.015초

Simple Graphs for Complex Prediction Functions

  • Huh, Myung-Hoe;Lee, Yong-Goo
    • Communications for Statistical Applications and Methods
    • /
    • 제15권3호
    • /
    • pp.343-351
    • /
    • 2008
  • By supervised learning with p predictors, we frequently obtain a prediction function of the form $y\;=\;f(x_1,...,x_p)$. When $p\;{\geq}\;3$, it is not easy to understand the inner structure of f, except for the case the function is formulated as additive. In this study, we propose to use p simple graphs for visual understanding of complex prediction functions produced by several supervised learning engines such as LOESS, neural networks, support vector machines and random forests.

Visualizing Multi-Variable Prediction Functions by Segmented k-CPG's

  • Huh, Myung-Hoe
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.185-193
    • /
    • 2009
  • Machine learning methods such as support vector machines and random forests yield nonparametric prediction functions of the form y = $f(x_1,{\ldots},x_p)$. As a sequel to the previous article (Huh and Lee, 2008) for visualizing nonparametric functions, I propose more sensible graphs for visualizing y = $f(x_1,{\ldots},x_p)$ herein which has two clear advantages over the previous simple graphs. New graphs will show a small number of prototype curves of $f(x_1,{\ldots},x_{j-1},x_j,x_{j+1}{\ldots},x_p)$, revealing statistically plausible portion over the interval of $x_j$ which changes with ($x_1,{\ldots},x_{j-1},x_{j+1},{\ldots},x_p$). To complement the visual display, matching importance measures for each of p predictor variables are produced. The proposed graphs and importance measures are validated in simulated settings and demonstrated for an environmental study.

통계와 시각화를 결합한 데이터 분석: 예측모형 대한 시각화 검증 (Data analysis by Integrating statistics and visualization: Visual verification for the prediction model)

  • 문성민;이경원
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.195-214
    • /
    • 2016
  • 예측 분석은 패턴인식(Pattern recognition) 혹은 기계학습(Machine learning)으로 불리는 확률적 학습 알고리즘을 기반으로 하기 때문에 사용자가 분석 과정에 개입하여 더 많은 정보를 얻어내기 위해서는 높은 통계적 지식수준이 요구된다. 또한 사용자는 분석 결과외의 다른 정보를 확인 할 수 없고 데이터의 특성 변화와 데이터 하나하나의 특징을 파악하기 힘들다는 단점이 있다. 본 연구는 이러한 예측분석의 단점을 보완하고자 통계적인 데이터 분석 방법과 시각화 분석 방법을 결합하여 데이터 분석을 진행하였으며 통계적인 분석 방법만을 진행 할 경우 발생하는 단점을 보완하고 데이터에서 더 많은 정보를 도출해 내기 위한 방법론을 제시 하고자하였다. 이를 위해 본 연구는 영화 리뷰에서 추출한 감정 어휘가 독립변인이고 영화의 흥행 값이 종속변인인 데이터를 예제 데이터로 활용하여 진행하였다. 본 연구의 연구 방법론을 적용하였을 때의 이점은 다음과 같다. 첫째, 의사결정나무 분석에서 제시된 분할 기준이 적용될 때 마다 변하는 데이터의 패턴을 파악할 수 있다. 둘째, 제시된 최종 예측모형에 포함된 데이터들의 특성을 확인 할 수 있다. 본 연구의 시사점은 예측모형의 단점을 보완하고 데이터로부터 더 많은 정보를 추출하기 위해 통계적인 데이터 분석과 시각적인 데이터 분석을 결합하여 시행하였다는 것이다. 통계적인 분석 방법을 통해 각 변수의 관계를 파악하고 높은 예측 값을 가지는 모형을 도출하였으며, 시각화 분석에서는 인터랙션 기능을 제공함으로서 통계적으로 제시된 예측모형을 검증하고 더 다양한 정보를 도출 할 수 있게 하였다.

발전기 스케줄링과 부하 전압민감도를 고려한 순간전압강하 평가 프로그램 개발 (Development of a Voltage Sag Assessment Program Considering Generator Scheduling and Voltage Tolerance)

  • 박창현
    • 조명전기설비학회논문지
    • /
    • 제23권4호
    • /
    • pp.92-100
    • /
    • 2009
  • 본 논문은 순간전압강하 추계적 평가를 위한 윈도우즈 프로그램을 소개한다. 개발된 프로그램을 통해 발전기 운전 스케줄링, 시변 사고율 및 부하 전압 민감도 특성을 고려한 순간전압강하 평가가 가능하다. 고장 계산, 취약지역계산, 순간전압강하 발생 횟수 추산 등 다양한 분석 기능들을 가지고 있으며 컴퓨터 그래픽과 애니메이션을 이용한 효과적인 데이터 시각화 기능도 제공하고 있다. 본 논문에서는 순간전압강하 평가의 개념과 발전기 스케줄링 및 시변 사고율을 고려한 순간전압강하 평가 방법에 대한 내용도 기술한다. 또한 개발된 프로그램을 이용한 사례 연구를 통해 순간전압강하 평가에 있어서의 발전기 운전 스케줄링 및 시변 사고율의 영향을 파악한다.

GIS 기법을 이용한 연약 지반 시공 관리 시스템의 개발 (Development of Integrated Management System Based on GIS on Soft Ground)

  • 천성호;우상인;정충기;최인걸
    • 한국지반공학회논문집
    • /
    • 제23권7호
    • /
    • pp.37-46
    • /
    • 2007
  • 연약 지반 개량을 위한 선행 재하 공법 시행 시, 시공 관리를 위해서는 현장 자료가 체계적으로 활용될 필요가 있다. 현장 자료의 체계적 활용을 위해서는 자료를 표준화하고 정보화하여 데이터베이스를 구축하고, 이를 활용하는 시스템을 구축하여야 한다. 본 연구에서는 선행 재하 공법이 적용된 연약지반 개량 현장에 대한 통합 시공관리시스템을 개발하였다. 개발 시스템은 데이터베이스와 사용자 프로그램으로 구성된다. 데이터베이스는 현장에서 수집된 모든 정보 및 시스템에서 처리된 정보를 보관, 관리하며, 이러한 정보들은 위치 정보와 연계되어 있다. 또한 데이터베이스 내 모든 정보는 각각의 특성에 따라 표준화된 형태로 관리된다. 사용자 프로그램은 데이터베이스에 있는 정보를 관리 및 활용하기 위한 데이터베이스 내 정보의 입-출력 기능, 공간 보간 기능, 현장 계측 정보를 이용한 침하 예측기능을 수행한다. 개발 시스템의 현장 적용 결과, 본 시스템은 데이터베이스 내 정보를 전체 현장에 대해 종합적으로 제공하였으며, 이로부터 시스템의 현장 적용성 및 효율성을 확인하였다.