• 제목/요약/키워드: cross validation

검색결과 1,003건 처리시간 0.027초

Development of a Probability Prediction Model for Tropical Cyclone Genesis in the Northwestern Pacific using the Logistic Regression Method

  • Choi, Ki-Seon;Kang, Ki-Ryong;Kim, Do-Woo;Kim, Tae-Ryong
    • 한국지구과학회지
    • /
    • 제31권5호
    • /
    • pp.454-464
    • /
    • 2010
  • A probability prediction model for tropical cyclone (TC) genesis in the Northwestern Pacific area was developed using the logistic regression method. Total five predictors were used in this model: the lower-level relative vorticity, vertical wind shear, mid-level relative humidity, upper-level equivalent potential temperature, and sea surface temperature (SST). The values for four predictors except for SST were obtained from difference of spatial-averaged value between May and January, and the time average of Ni$\tilde{n}$o-3.4 index from February to April was used to see the SST effect. As a result of prediction for the TC genesis frequency from June to December during 1951 to 2007, the model was capable of predicting that 21 (22) years had higher (lower) frequency than the normal year. The analysis of real data indicated that the number of year with the higher (lower) frequency of TC genesis was 28 (29). The overall predictability was about 75%, and the model reliability was also verified statistically through the cross validation analysis method.

음악추천을 위한 다중 옥타브 밴드 기반 장르 분류기 (Multiple octave-band based genre classification algorithm for music recommendation)

  • 임신철;장세진;이석필;김무영
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1487-1494
    • /
    • 2011
  • 본 논문은 음악 추천을 위한 새로운 장르 분류 알고리즘을 제안하였다. 특히, 장르 분류 알고리즘에 사용되는 특정 벡터 중 octave-based spectral contrast (OSC)의 성능 개선을 위해서 심리청각 모델과 악기별 사용 octave 범위에 근거하여 새로운 band-pass filter를 설계하였다. 10개 장르별 음악을 포함하고 있는 GTZAN database에 대해서 10-fold cross validation 실험 결과, 다중 옥타브 밴드 OSC에 대해서 기존 OSC에 비해 2.26% 향상된 인식율을 얻을 수 있었다. 또한, 기존의 mel-frequency cepstral coefficient (MFCC)와 복합 특징 벡터를 구성하여 실험한 결과, 향상된 인식율을 얻을 수 있었다.

항적 데이터 학습을 통한 추천 항로 구성에 관한 연구 (Composing Recommended Route through Machine Learning of Navigational Data)

  • 김주성;정중식;이성용;이은석
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.285-286
    • /
    • 2016
  • 해상교통관제센터에 의해 실시간으로 수집되는 선박의 항해 데이터를 바탕으로 선박 항적 패턴 인식을 수행하고 이를 바탕으로 항적 모델을 추출하여 사전에 선위를 예측하는 기법을 제안한다. 항적 데이터의 처리와 가공, 항적 모델링을 위하여 Support Vector Regression 알고리즘이 사용되었으며, 적정 파라미터 선정을 위하여 k-fold cross validation과 grid search가 사용되었다. 제안된 항적 데이터 모델링 기법을 통하여 사전에 선박의 선위를 예측하여 해상교통과제사의 의사결정을 지원하고자 한다.

  • PDF

인체측정조사에서 측정곤란부위 예측을 위한 의사결정나무 추천 모형 탐지에 관한 연구 (A Study on Exploration of the Recommended Model of Decision Tree to Predict a Hard-to-Measure Mesurement in Anthropometric Survey)

  • 최종후;김선경
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.923-935
    • /
    • 2009
  • 본 연구는 의사결정나무의 추천 모형 선택을 위한 비교실험에 초점을 두고 있다. 의사결정나무 모형은 구축된 모형에 기반을 두고 미래 관측치에 대한 예측 기능을 수행하게 될 것이므로 구축된 모형이 아무리 정치(精緻)하다고 하더라도 일반화의 성질을 충족시키지 못하면 실제성이 없게 된다. 따라서 본 연구는 교차타당성 검토를 통해 일반화의 성질을 충족시키면서 우수한 예측력을 갖는 추천 모형을 탐지하는 절차를 연구하는 데에 초점을 맞추고 있다. 사례 연구로 인체측정자료를 사용하여 측정곤란부위 예측을 위한 의사결정나무 추천 모형을 탐지한다. 그 결과 CART 모형 이 추천 모형으로 탐지되었다.

원전SG 세관 결함크기 예측을 위한 신경회로망 구조에 관한 연구 (A Study on the Structure of Neural Network for Predicting Defect Size of Steam Generator Tube in Nuclear Power Plant)

  • 조남훈
    • 조명전기설비학회논문지
    • /
    • 제24권1호
    • /
    • pp.63-70
    • /
    • 2010
  • 본 논문에서는 원자력발전소 증기세관 크기 예측을 위한 신경회로망 구조에 대해서 연구한다. 와류탐상 시험(ECT) 신호로부터 특징을 추출한 후, 결함크기 예측을 위해서 다층퍼셉트론 신경회로망을 이용한다. 결함크기 예측성능을 최대화하기 위해서는 신경회로망의 구조, 특히 은닉층 내의 뉴런의 개수를 신중히 결정하여야 한다. 본 논문에서는, 결함크기 예측을 위한 은닉층 내의 뉴런의 개수를 교차검증을 이용하여 매우 효과적으로 결정할 수 있음을 보인다.

한국판 Rothbart 유아용 기질 척도(Children's Behavior Questionnaire)의 타당화 (Validation Study of Korean Version of the Rothbart's Children's Behavior Questionnaire)

  • 임지영;배윤진
    • 한국생활과학회지
    • /
    • 제24권4호
    • /
    • pp.477-497
    • /
    • 2015
  • The purpose of this study was to examine the psychometric property of the Children's Behavior Questionnaire(CBQ), including reliability, content validity, construct validity, cross validity, and concurrent validity with EAS(Emotionality, Activity, Sociability) scale. The CBQ is a caregiver report measure designed to provide a detailed assessment of temperament in children 3 to 7 years of age. In this study, two groups of participants were included to check cross validity. The first group of participants were 108 preschoolers, 3 to 7 years of age attending kindergartens or child care centers, and their mothers. The second group of participants were 168 preschoolers and their mothers. The CBQ subscales demonstrate adequate internal consistencies. Also, exploratory and confirmatory factor analyses of the CBQ scale reliably recover a three-factor solution indicating three broad dimension of temperament: extraversion/surgency, negative affectivity, and effortful control. Evidence for concurrent validity derives from results of correlation analysis with EAS scale.

연유출량 추정모형의 개선방안 (A Study on the Improvement of Annual Runoff Estimation Model)

  • 이상훈
    • 물과 미래
    • /
    • 제26권1호
    • /
    • pp.51-62
    • /
    • 1993
  • 연유출량에 영향을 미치는 가장 직접적인 인자는 강수량인데 회귀분석을 이용한 이전의 연구에서는 유출률이 20% 미만 또는 100% 이상인 경우에는 강수와 유량자료는 이상점(outlier)으로서 분석에서 제외시킨 결과 강수량은 독립변수로서 의의가 없고 대신 유역면적을 중요한 독립변수로 포함시켰다. 본 연구에서는 유출률대신 (연강수량-연유출량)을 연증발산량의 좋은 추정치로 간주하고 우리나라에서 가능한 연증발산의 범위를 벗어나는 자료를 제외시키고 회귀분석을 한 결과 수문학적인 이론에 부합되며 결정계수가 높은 다음과 같은 회귀분석식을 얻었다. R=-518.25+0.8834P 단, R: 유출고(mm) P: 연강수량(mm) 이 회귀분석식은 cross-validation을 거친 결과 계수가 매우 안정되어 있어서 우리나라의 미계측 중소수게에서 사용할 수 있는 좋은 연유출량 추정모델로서 제안한다.

  • PDF

Noise Removal using Support Vector Regression in Noisy Document Images

  • Kim, Hee-Hoon;Kang, Seung-Hyo;Park, Jai-Hyun;Ha, Hyun-Ho;Lim, Dong-Hoon
    • 응용통계연구
    • /
    • 제25권4호
    • /
    • pp.669-680
    • /
    • 2012
  • Noise removal of document images is a necessary step during preprocessing to recognize characters effectively because it has influences greatly on processing speed and performance for character recognition. We have considered using the spatial filters such as traditional mean filters and Gaussian filters, and wavelet transformed based methods for noise deduction in natural images. However, these methods are not effective for the noise removal of document images. In this paper, we present noise removal of document images using support vector regression. The proposed approach consists of two steps which are SVR training step and SVR test step. We construct an optimal prediction model using grid search with cross-validation in SVR training step, and then apply it to noisy images to remove noises in test step. We evaluate our SVR based method both quantitatively and qualitatively for noise removal in Korean, English and Chinese character documents, and compare it to some existing methods. Experimental results indicate that the proposed method is more effective and can get satisfactory removal results.

최단경로 기반 교통량 공간 예측에 관한 연구 (A Study on the Prediction of Traffic Counts Based on Shortest Travel Path)

  • 허태영;박만식;엄진기;오주삼
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.459-473
    • /
    • 2007
  • 본 연구에서는 연평균일교통량 예측을 위한 공간회귀모형을 제시하였다. 비록 공간 분석을 위하여 조사지점들 간의 유클리디안 거리가 일반적으로 사용되고 있지만, 조사되지 않는 도로의 교통량 예측을 위하여 교통량 조사지점들 간의 최단경로를 이용한 공간회귀모형을 새롭게 시도하였다. 공간예측방법으로는 일반크리깅을 사용하였으며 교차검증을 통하여 정량적으로 최단경로 기반의 교통량공간예측모형의 타당성을 제시하였다.

Computational Detection of Prokaryotic Core Promoters in Genomic Sequences

  • Kim Ki-Bong;Sim Jeong Seop
    • Journal of Microbiology
    • /
    • 제43권5호
    • /
    • pp.411-416
    • /
    • 2005
  • The high-throughput sequencing of microbial genomes has resulted in the relatively rapid accumulation of an enormous amount of genomic sequence data. In this context, the problem posed by the detection of promoters in genomic DNA sequences via computational methods has attracted considerable research attention in recent years. This paper addresses the development of a predictive model, known as the dependence decomposition weight matrix model (DDWMM), which was designed to detect the core promoter region, including the -10 region and the transcription start sites (TSSs), in prokaryotic genomic DNA sequences. This is an issue of some importance with regard to genome annotation efforts. Our predictive model captures the most significant dependencies between positions (allowing for non­adjacent as well as adjacent dependencies) via the maximal dependence decomposition (MDD) procedure, which iteratively decomposes data sets into subsets, based on the significant dependence between positions in the promoter region to be modeled. Such dependencies may be intimately related to biological and structural concerns, since promoter elements are present in a variety of combinations, which are separated by various distances. In this respect, the DDWMM may prove to be appropriate with regard to the detection of core promoter regions and TSSs in long microbial genomic contigs. In order to demonstrate the effectiveness of our predictive model, we applied 10-fold cross-validation experiments on the 607 experimentally-verified promoter sequences, which evidenced good performance in terms of sensitivity.