• Title/Summary/Keyword: 커널분포함수

Search Result 40, Processing Time 0.025 seconds

확률밀도함수의 미분에 대한 커널추정법에 관한 연구

  • Seok, Gyeong-Ha;Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • v.7 no.2
    • /
    • pp.211-217
    • /
    • 1996
  • 본 논문은 확률밀도함수의 l 번째 도함수의 커널추정법에 관하여 다루고 있다. 확률밀도함수 도함수의 커널추정에 사용될 수 있는 두가지 평활량의 선택법, 교차타당성방법과 삽입방법에 의한 평활량의 점근분포를 규명하고 이들의 상대적 수렴속도를 각각 밝히고 삽입방법의 우수성을 소표본 모의실험을 통하여 확인하였다.

  • PDF

Quantile regression using asymmetric Laplace distribution (비대칭 라플라스 분포를 이용한 분위수 회귀)

  • Park, Hye-Jung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.6
    • /
    • pp.1093-1101
    • /
    • 2009
  • Quantile regression has become a more widely used technique to describe the distribution of a response variable given a set of explanatory variables. This paper proposes a novel modelfor quantile regression using doubly penalized kernel machine with support vector machine iteratively reweighted least squares (SVM-IRWLS). To make inference about the shape of a population distribution, the widely popularregression, would be inadequate, if the distribution is not approximately Gaussian. We present a likelihood-based approach to the estimation of the regression quantiles that uses the asymmetric Laplace density.

  • PDF

커널 판별분석의 오분류확률에 대한 붓스트랩 조정

  • 백장선
    • Communications for Statistical Applications and Methods
    • /
    • v.2 no.2
    • /
    • pp.249-265
    • /
    • 1995
  • 본 논문에서는 확률분포가 알려져 있지 않은 두 모집단 중 어느 하나로 새로운 관측치를 분류할 때 오분류확률이 분석자에 의해 사전에 정해진 수준에 부합할 수 있도록 커널 판별함수의 임계치를 결정하였다. 정해진 오분류확률을 만족시키기 위한 판별함수의 임계치는 붓스트랩(bootstrap)기법을 판별 함수에 적용시켜 계산된다. 본 논문에서 제시도된 방법은 모집단에 대한 모수적 가정이 없으므로 어느 분포에도 적용가능하며, 모집단이 정규분포, 대수정규분포, 이산형과 연속형 변수가 혼합된 분포의 경우 모의실험을 통하여 그 성능에 대한 검증을 하였다.

  • PDF

Structural Design of Radial Basis function Neural Network(RBFNN) Based on PSO (PSO 기반 RBFNN의 구조적 설계)

  • Seok, Jin-Wook;Kim, Young-Hoon;Oh, Sung-Kwun
    • Proceedings of the IEEK Conference
    • /
    • 2009.05a
    • /
    • pp.381-383
    • /
    • 2009
  • 본 논문에서는 대표적인 시스템 모델링 도구중의 하나인 RBF 뉴럴 네트워크(Radial Basis Function Neural Network)를 설계하고 모델을 최적화하기 위하여 최적화 알고리즘인 PSO(Particle Swarm Optimization) 알고리즘을 이용하였다. 즉, 모델의 최적화에 주요한 영향을 미치는 모델의 파라미터들을 PSO 알고리즘을 이용하여 동정한다. 제안된 RBF 뉴럴 네트워크는 은닉층에서의 활성함수로서 일반적으로 많이 사용되어지는 가우시안 커널함수를 사용한다. 더 나아가 모델의 최적화를 위하여 각 커널함수의 중심값은 HCM 클러스터링에 기반을 두어 중심값을 결정하고, PSO 알고리즘을 통하여 가우시안 커널함수의 분포상수, 은닉층에서의 노드 수 그리고 다수의 입력을 가질 경우 입력의 종류를 동정한다. 제안한 모델의 성능을 평가하기 위해 Mackey-Glass 시계열 공정 데이터를 적용하였으며 제안된 모델의 근사화와 일반화 능력을 분석한다.

  • PDF

Development of MKDE-ebd for Estimation of Multivariate Probabilistic Distribution Functions (다변량 확률분포함수의 추정을 위한 MKDE-ebd 개발)

  • Kang, Young-Jin;Noh, Yoojeong;Lim, O-Kaung
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.32 no.1
    • /
    • pp.55-63
    • /
    • 2019
  • In engineering problems, many random variables have correlation, and the correlation of input random variables has a great influence on reliability analysis results of the mechanical systems. However, correlated variables are often treated as independent variables or modeled by specific parametric joint distributions due to difficulty in modeling joint distributions. Especially, when there are insufficient correlated data, it becomes more difficult to correctly model the joint distribution. In this study, multivariate kernel density estimation with bounded data is proposed to estimate various types of joint distributions with highly nonlinearity. Since it combines given data with bounded data, which are generated from confidence intervals of uniform distribution parameters for given data, it is less sensitive to data quality and number of data. Thus, it yields conservative statistical modeling and reliability analysis results, and its performance is verified through statistical simulation and engineering examples.

A Kernel based Possibilistic C-Means Clustering Algorithm (커널 기반의 Possibilistic C-Means 클러스터링 알고리즘)

  • 최길수;최병인;이정훈
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.10a
    • /
    • pp.158-161
    • /
    • 2004
  • Fuzzy Kernel C-Means(FKCM) 알고리즘은 커널 함수를 통하여 구형의 데이터뿐만 아니라 Fuzzy C-Means(FCM)에서는 분류하기 힘든 복잡한 형태의 분포를 갖는 데이터를 분류할 수 있다. 하지만 FCM과 같이 노이즈에 대해서는 민감한 성질을 가진다 이처럼 노이즈(noise)에 민감한 성질을 보완하기 위해서 본 논문에서는 Possibllistic C-Means 알고리즘에 커널 함수를 적용하였다. 본 논문에서 제안된 Kernel Possibilistic C-Means(KPCM) 알고리즘은 일반적인 데이터에 대해 FKCM과 같은 성능의 클러스터링 수행이 가능하며 노이즈가 있는 데이터에 대해서는 FKCM보다 더욱 정확한 클러스터링을 수행할 수 있다.

  • PDF

Spatial Distributions of the Ambient Levels of Air Pollutants in Seoul Metropolitan Area (대기오염도의 공간적 분포 변화 분석 -수도권 지역을 대상으로-)

  • Kwon, Oh Sang;An, Donghwan;Kim, Wonhee
    • Environmental and Resource Economics Review
    • /
    • v.13 no.1
    • /
    • pp.83-117
    • /
    • 2004
  • This study investigates the spatial distributions of the ambient levels of air pollutants ($SO_2$, $NO_2$, $O_3$, CO, and PM) in Seoul metropolitan area using the data obtained by the air pollution observation stations. This study estimated a non-parametric kernel density function and two types of inequality indices, Gini and Entropy. Our estimation results show that the degree of inequality in spatial distribution of air pollution, in general, tends to be stable or slightly decreasing for the period of 1990~2001. In addition, we found that there are significant dynamics of air pollution levels in terms of spatial ranking.

  • PDF

Fuzzy K-Nearest Neighbor Algorithm based on Kernel Method (커널 기반의 퍼지 K-Nearest Neighbor 알고리즘)

  • Choi Byung-In;Rhee Frank Chung-Hoon
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.11a
    • /
    • pp.267-270
    • /
    • 2005
  • 커널 함수는 데이터를 high dimension 상의 속성 공간으로 mapping함으로써 복잡한 분포를 가지는 데이터에 대하여 기존의 선형 분류 알고리즘들의 성능을 향상시킬 수 있다. 본 논문에서는 기존의 유클리디안 거리측정방법 대신에 커널 함수에 의한 속성 공간의 거리측정방법을 fuzzy K-nearest neighbor 알고리즘에 적용한 fuzzy kernel K-nearest neighbor(FKKNN) 알고리즘을 제안한다. 제시한 알고리즘은 데이터에 대한 적절한 커널 함수의 선택으로 기존 알고리즘의 성능을 향상 시킬 수 있다. 제시한 알고리즘의 타당성을 보이기 위하여 여러 데이터 집합에 대한 실험결과를 분석한다.

  • PDF

ROC Function Estimation (ROC 함수 추정)

  • Hong, Chong-Sun;Lin, Mei Hua;Hong, Sun-Woo
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.6
    • /
    • pp.987-994
    • /
    • 2011
  • From the point view of credit evaluation whose population is divided into the default and non-default state, two methods are considered to estimate conditional distribution functions: one is to estimate under the assumption that the data is followed the mixture normal distribution and the other is to use the kernel density estimation. The parameters of normal mixture are estimated using the EM algorithm. For the kernel density estimation, five kinds of well known kernel functions and four kinds of the bandwidths are explored. In addition, the corresponding ROC functions are obtained based on the estimated distribution functions. The goodness-of-fit of the estimated distribution functions are discussed and the performance of the ROC functions are compared. In this work, it is found that the kernel distribution functions shows better fit, and the ROC function obtained under the assumption of normal mixture shows better performance.

Comparison Study of Kernel Density Estimation according to Various Bandwidth Selectors (다양한 대역폭 선택법에 따른 커널밀도추정의 비교 연구)

  • Kang, Young-Jin;Noh, Yoojeong
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.32 no.3
    • /
    • pp.173-181
    • /
    • 2019
  • To estimate probabilistic distribution function from experimental data, kernel density estimation(KDE) is mostly used in cases when data is insufficient. The estimated distribution using KDE depends on bandwidth selectors that smoothen or overfit a kernel estimator to experimental data. In this study, various bandwidth selectors such as the Silverman's rule of thumb, rule using adaptive estimates, and oversmoothing rule, were compared for accuracy and conservativeness. For this, statistical simulations were carried out using assumed true models including unimodal and multimodal distributions, and, accuracies and conservativeness of estimating distribution functions were compared according to various data. In addition, it was verified how the estimated distributions using KDE with different bandwidth selectors affect reliability analysis results through simple reliability examples.