• 제목/요약/키워드: leave-one-out method

검색결과 44건 처리시간 0.026초

이상치가 존재하는 단순회귀모형에서 Rice 추정량에 관해서 (On Rice Estimator in Simple Regression Models with Outliers)

  • 박천건
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.511-520
    • /
    • 2013
  • 이상치가 존재하는 회귀모형에서 이상치를 탐색하거나 로버스트 추정량에 대한 연구는 매우 중요하다. 이러한 연구는 leave-one-out를 이용하여 회귀계수를 추정하고 잔차를 이용하여 오차 분산을 추정하여 이상치를 탐색하는데 있다. 본 연구는 회귀모형에서 회귀계수를 추정하지 않고 오차 분산을 추정할 수 있는 Rice 추정량의 적용을 소개한 것이다. 특히, 단순회귀모형에서 이상치의 유무에 따라 Rice 추정량의 통계적 성질을 비교하고 이상치 탐색에 있어 어떤 장점이 있는지를 탐색한 연구이다.

LS-SVM for large data sets

  • Park, Hongrak;Hwang, Hyungtae;Kim, Byungju
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.549-557
    • /
    • 2016
  • In this paper we propose multiclassification method for large data sets by ensembling least squares support vector machines (LS-SVM) with principal components instead of raw input vector. We use the revised one-vs-all method for multiclassification, which is one of voting scheme based on combining several binary classifications. The revised one-vs-all method is performed by using the hat matrix of LS-SVM ensemble, which is obtained by ensembling LS-SVMs trained using each random sample from the whole large training data. The leave-one-out cross validation (CV) function is used for the optimal values of hyper-parameters which affect the performance of multiclass LS-SVM ensemble. We present the generalized cross validation function to reduce computational burden of leave-one-out CV functions. Experimental results from real data sets are then obtained to illustrate the performance of the proposed multiclass LS-SVM ensemble.

First Order Difference-Based Error Variance Estimator in Nonparametric Regression with a Single Outlier

  • Park, Chun-Gun
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.333-344
    • /
    • 2012
  • We consider some statistical properties of the first order difference-based error variance estimator in nonparametric regression models with a single outlier. So far under an outlier(s) such difference-based estimators has been rarely discussed. We propose the first order difference-based estimator using the leave-one-out method to detect a single outlier and simulate the outlier detection in a nonparametric regression model with the single outlier. Moreover, the outlier detection works well. The results are promising even in nonparametric regression models with many outliers using some difference based estimators.

Classification for intraclass correlation pattern by principal component analysis

  • Chung, Hie-Choon;Han, Chien-Pai
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.589-595
    • /
    • 2010
  • In discriminant analysis, we consider an intraclass correlation pattern by principal component analysis. We assume that the two populations are equally likely and the costs of misclassification are equal. In this situation, we consider two procedures, i.e., the test and proportion procedures, for selecting the principal components in classifica-tion. We compare the regular classification method and the proposed two procedures. We consider two methods for estimating error rate, i.e., the leave-one-out method and the bootstrap method.

Data-Adaptive ECOC for Multicategory Classification

  • Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권1호
    • /
    • pp.25-36
    • /
    • 2008
  • Error Correcting Output Codes (ECOC) can improve generalization performance when applied to multicategory classification problem. In this study we propose a new criterion to select hyperparameters included in ECOC scheme. Instead of margins of a data we propose to use the probability of misclassification error since it makes the criterion simple. Using this we obtain an upper bound of leave-one-out error of OVA(one vs all) method. Our experiments from real and synthetic data indicate that the bound leads to good estimates of parameters.

  • PDF

미계측 유역의 홍수피해분석을 위한 자연유량의 홍수지표 기반 확률홍수량 산정 (Estimation of Flood Quantile in Ungauged Watersheds for Flood Damage Analysis Based on Flood Index of Natural Flow)

  • 채병석;최시중;안재현;김태웅
    • 대한토목학회논문집
    • /
    • 제38권1호
    • /
    • pp.175-182
    • /
    • 2018
  • 본 연구에서는 설계 강우-유출 관계 분석법으로 산정된 값을 지역빈도해석 기법을 바탕으로 보정하여 미계측 유역에서의 확률홍수량을 산정하는 방법을 제안하였다. 홍수빈도해석법과 설계 강우-유출 관계 분석법을 비교 분석한 결과, 설계 강우-유출 관계 분석법으로 산정된 확률홍수량이 약 52% 과대 산정되는 것으로 나타났다. 또한, 미계측 유역의 확률홍수량을 산정하기 위해서 유역 특성인자를 자연유량으로 지표화 하여 지역빈도해석법을 수행하였다. 이와 같은 세 가지 방법의 설계홍수량 산정법을 기반으로 미계측 유역을 대상으로 적용할 수 있는 보정식을 도출하였다. 미계측 유역에 대한 적용성을 검토하기 위해 Leave-One-Out Cross-Validation 기법과 Skill Score 기법을 적용하였다. 그 결과, 정확도가 기존의 설계 강우-유출 관계 분석법보다 23.2% 증가한 것으로 나타났다.

스케치 질의를 통한 웹기반 영상 검색과 분류 시스템 (Web-based Image Retrieval and Classification System using Sketch Query)

  • 이상봉;고병철;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.703-712
    • /
    • 2003
  • 디지털 기술의 발달과 인터넷의 대중화에 더불어 영상데이타의 생산과 교환이 더 자유로워짐에 따라 디지털 도서관, 영상처리, 데이타베이스 시스템과 같은 연구분야에서 내용기반 영상검색에 대한 관심이 높아지고 있다. 일반적으로 ´영상에 의한 질의´의 경우 사용자가 마음에 드는 영상이 없더라도 반듯이 진의 영상을 데이타베이스로부터 선택해야 하지만, ´스케치에 의한 질의´는 사용자의 생각에 따라 영상온 그림으로 표현할 수 있으므로 최근에 가장 많이 사용되는 질의 방법 중 하나이다. 본 논문에서는 스케치 진의와 영상 분류 방법을 이용하는 사바 기반의 영상검색 시스템을 제안한다. 본 시스템에서는 유사영상을 검색하기 위해 영상으로부터 색상 히스토그램과 Haar-웨이블릿 계수를 사용하고, leave-one-out 방법을 이용하여 영상을 분류하도록 하였다. 본 논문에서는 사진-그림, 자연 도시 등의 영상 분류론 통해 영상의 의미정보를 추출할 수 있을 뿐 아니라, 사용자 질의 영상을 분류하여, 질의 영상이 갖고 있는 의미공간으로 검색 공간을 축소하여 검색 시간을 단축시키는 효율성을 얻을 수 있었다.

Multimodal Parametric Fusion for Emotion Recognition

  • Kim, Jonghwa
    • International journal of advanced smart convergence
    • /
    • 제9권1호
    • /
    • pp.193-201
    • /
    • 2020
  • The main objective of this study is to investigate the impact of additional modalities on the performance of emotion recognition using speech, facial expression and physiological measurements. In order to compare different approaches, we designed a feature-based recognition system as a benchmark which carries out linear supervised classification followed by the leave-one-out cross-validation. For the classification of four emotions, it turned out that bimodal fusion in our experiment improves recognition accuracy of unimodal approach, while the performance of trimodal fusion varies strongly depending on the individual. Furthermore, we experienced extremely high disparity between single class recognition rates, while we could not observe a best performing single modality in our experiment. Based on these observations, we developed a novel fusion method, called parametric decision fusion (PDF), which lies in building emotion-specific classifiers and exploits advantage of a parametrized decision process. By using the PDF scheme we achieved 16% improvement in accuracy of subject-dependent recognition and 10% for subject-independent recognition compared to the best unimodal results.

조건부 합성방법을 이용한 위성관측 토양수분과 지상관측 토양수분의 합성 (Spatial merging of satellite based soil moisture and in-situ soil moisture using conditional merging technique)

  • 이재현;최민하;김동균
    • 한국수자원학회논문집
    • /
    • 제49권3호
    • /
    • pp.263-273
    • /
    • 2016
  • 기존에 레이더 강우자료의 합성에만 국한되었던 조건부 합성방법을 지상관측 토양수분과 위성관측 토양수분 자료에 적용하였다. 연구에 사용한 토양수분 자료는 농촌진흥청에서 제공하는 24개 관측소의 한시간 단위의 지상관측토양수분자료와 AQUA 위성의 Advanced Microwave Scanning Radiometer-Earth observing system (AMSR-E) 센서에서 관측된 토양수분 자료를 사용하였다. 교차검증방법(leave one out cross validation)을 사용하여 조건부 합성방법의 예측성능을 평가 하였고, 관측소별 교차검증 방법의 결과를 공간분포 시켜서 지역적인 특성을 분석하였다. 이 연구에서 도출된 결과는 다음과 같다. (1) 총 113일의 분석 기간 중 100일 이상의 기간에 대하여 조건부합성방법을 적용하였을 경우 AMSR-E 자료에 비해 지상관측자료와의 편차가 감소하는 것으로 나타났다. (2) 조건부 합성 방법의 예측 성능은 관측소의 밀도와 밀접한 관련을 나타내었으며, 관측소가 많이 밀집되어있는 한반도의 서쪽 지역에서 예측성능이 우세하게 나타났다. (3) 강우가 발생하지 않는 기간에 대한 AMSR-E의 낮은 정확도와 달리 조건부 합성방법은 무강우 기간에 대해서도 높은 예측성능을 나타내었다. 본 연구의 결과는 미계측 지역에 대한 토양수분을 추정하는 조건부 합성방법의 적용 가능성을 제시한다.

Single Nucleotide Polymorphism(SNP) 데이타와 Support Vector Machine(SVM)을 이용한 만성 간염 감수성 예측 (Prediction of Chronic Hepatitis Susceptibility using Single Nucleotide Polymorphism Data and Support Vector Machine)

  • 김동회;엄상용;함기백;김진
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권7호
    • /
    • pp.276-281
    • /
    • 2007
  • 본 논문에서는 한국인의 대표질환 중 하나인 만성 간염에 대한 질환 감수성을 예측하기 위해서 Single Nucleotide Polymorphism 데이타와 대표적인 기계학습 기술인 Support Vector Machine을 이용하였다. 실험을 위한 데이타로 만성간염 환자 173명과 정상인 155명의 SNP 데이타를 사용하였으며, 평가를 위한 방법으로는 Leave-One-Out Cross Valication을 사용하였다. 실험결과 SNP 데이터만으로는 67.1%의 예측 결과를 얻었으며 기본적인 건강요소인 나이와 성별을 특징요소로 사용함으로서 74.9%의 예측 결과를 보였다. 향후 보다 많은 SNP 데이타와 건강관련정보 그리고 생활패턴에 대한 요소들을 특징요소로 감수성 예측에 함께 사용한다면, SVM은 만성 간염 예측을 위한 보다 효과적인 도구가 될 것이다.