• 제목/요약/키워드: bootstrap algorithm

검색결과 41건 처리시간 0.021초

SMALL SAMPLE PROPERTIES OF GENERALIZED LOGIT MODEL ESTIMATORS WITH BOOTSTRAP

  • Kim, Peyong-Koo;Kim, Jong-Ho;Cho, Joong-Jae
    • Journal of applied mathematics & informatics
    • /
    • 제3권2호
    • /
    • pp.253-264
    • /
    • 1996
  • The generalized logit model of nominal type with random regressors is studied for bootstrapping. We assess the accuracy of some estimators for our generalized logit model using a Monte Carlo simu-lation. That is we study the finite sample properties containing the consistency and asymptotic normality of the maximum likelihood es-timators. Also we compare Newton Raphson algorithm with BHHH algorithm.

전문화된 네트워크들의 결합에 의한 앙상블 학습 알고리즘 (Ensemble Learning Algorithm of Specialized Networks)

  • 신현정;이형주;조성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.308-310
    • /
    • 2000
  • 관찰학습(OLA: Observational Learning Algorithm)은 앙상블 네트워크의 각 구성 모델들이 아른 모델들을 관찰함으로써 얻어진 가상 데이터와 초기에 bootstrap된 실제 데이터를 학습에 함께 이용하는 방법이다. 본 논문에서는, 초기 학습 데이터 셋을 분할하고 분할된 각 데이터 셋에 대하여 앙상블의 구성 모델들을 전문화(specialize)시키는 방법을 적용하여 기존의 관찰학습 알고리즘을 개선시켰다. 제안된 알고리즘은 bagging 및 boosting과의 비교 실험에 의하여, 보다 적은 수의 구성 모델로 동일 내지 보다 나은 성능을 나타냄이 실험적으로 검증되었다.

  • PDF

유/무성/묵음 정보를 이용한 TTS용 자동음소분할기 성능향상 (Improvement of an Automatic Segmentation for TTS Using Voiced/Unvoiced/Silence Information)

  • 김민제;이정철;김종진
    • 대한음성학회지:말소리
    • /
    • 제58호
    • /
    • pp.67-81
    • /
    • 2006
  • For a large corpus of time-aligned data, HMM based approaches are most widely used for automatic segmentation, providing a consistent and accurate phone labeling scheme. There are two methods for training in HMM. Flat starting method has a property that human interference is minimized but it has low accuracy. Bootstrap method has a high accuracy, but it has a defect that manual segmentation is required In this paper, a new algorithm is proposed to minimize manual work and to improve the performance of automatic segmentation. At first phase, voiced, unvoiced and silence classification is performed for each speech data frame. At second phase, the phoneme sequence is aligned dynamically to the voiced/unvoiced/silence sequence according to the acoustic phonetic rules. Finally, using these segmented speech data as a bootstrap, phoneme model parameters based on HMM are trained. For the performance test, hand labeled ETRI speech DB was used. The experiment results showed that our algorithm achieved 10% improvement of segmentation accuracy within 20 ms tolerable error range. Especially for the unvoiced consonants, it showed 30% improvement.

  • PDF

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.12-17
    • /
    • 2003
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다

Sea Ice Extents and global warming in Okhotsk Sea and surrounding Ocean - sea ice concentration using airborne microwave radiometer -

  • Nishio, Fumihiko
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1998년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.76-82
    • /
    • 1998
  • Increase of greenhouse gas due to $CO_2$ and CH$_4$ gases would cause the global warming in the atmosphere. According to the global circulation model, it is pointed out in the Okhotsk Sea that the large increase of atmospheric temperature might be occurredin this region by global warming due to the doubling of greenhouse effectgases. Therefore, it is very important to monitor the sea ice extents in the Okhotsk Sea. To improve the sea ice extents and concentration with more highly accuracy, the field experiments have begun to comparewith Airborne Microwave Radiometer (AMR) and video images installed on the aircraft (Beach-200). The sea ice concentration is generally proportional to the brightness temperature and accurate retrieval of sea ice concentration from the brightness temperature is important because of the sensitivity of multi-channel data with the amount of open water in the sea ice pack. During the field experiments of airborned AMR the multi-frequency data suggest that the sea ice concentration is slightly dependending on the sea ice types since the brightness temperature is different between the thin and small piece of sea ice floes, and a large ice flow with different surface signatures. On the basis of classification of two sea ice types, it is cleary distinguished between the thin ice and the large ice floe in the scatter plot of 36.5 and 89.0GHz, but it does not become to make clear of the scatter plot of 18.7 and 36.5GHz Two algorithms that have been used for deriving sea ice concentrations from airbomed multi-channel data are compared. One is the NASA Team Algorithm and the other is the Bootstrap Algorithm. Intrercomparison on both algorithms with the airborned data and sea ice concentration derived from video images bas shown that the Bootstrap Algorithm is more consistent with the binary maps of video images.

  • PDF

붓스트랩 기법을 이용한 TCS 데이터로부터 차종별 교통량 추정모형 구축 (Construction of vehicle classification estimation model from the TCS data by using bootstrap Algorithm)

  • 노정현;김태균;차경준;박영선;남궁성;황부연
    • 대한교통학회지
    • /
    • 제20권1호
    • /
    • pp.39-52
    • /
    • 2002
  • 차종별 교통량자료는 자료의 출처별로 차종이 동일하지 않아 자료간 호환이 어려우며 이들 자료의 활용도 또한 매우 낮다. 특히, 고속도로의 경우에는 전수자료인 TCS 자료가 있음에도 불구하고 TCS의 타종분류는 차종 내에 승용, 승합, 화물차가 혼재 되어있어 실질적으로 활용도가 매우 낮다. 이에 본 연구에서는 각 출처별 자료들의 차종구분과 호환할 수 있도록 타종구분을 표준화하고 고속도로 톨게이트 유출입 차종별 교통량을 표준화된 차종별로 추정하기 위한 모형을 개발하였다. 즉, 톨게이트를 그 특성에 따라 몇 개의 카테고리로 분류하였고, 각 카테고리별로 각 타종의 구성비를 점추정량을 이용한 기법(산술평균, 기하평균, 조화평균)과 비모수적 통계기법인 붓스트랩을 이용하여 표준화 분류별 교통량을 추정하는 모형을 개발하였다. 그 결과 두 방법 모두 비교적 유의한 수준의 결과가 도출되었으나, 표본의 크기에 따라 발생할 수 있는 극단치에 대한 오추정 문제를 감안할 수 있는 붓스트랩기법이 우수한 것으로 나타났다. 본 연구의 결과로 향후 TCS 자료의 활용성 증대와 TCS 자료를 이용한 고속도로 구간교통량 추정과 고속도로 정기교통량 조사자료의 좀더 구체적인 비교가 가능할 것으로 기대된다.

앙상블 구성을 이용한 SVM 분류성능의 향상 (Improving SVM Classification by Constructing Ensemble)

  • 제홍모;방승양
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.251-258
    • /
    • 2003
  • Support Vector Machine(SVM)은 이론상으로 좋은 일반화 성능을 보이지만, 실제적으로 구현된 SVM은 이론적인 성능에 미치지 못한다. 주 된 이유는 시간, 공간상의 높은 복잡도로 인해 근사화된 알고리듬으로 구현하기 때문이다. 본 논문은 SVM의 분류성능을 향상시키기 위해 Bagging(Bootstrap aggregating)과 Boosting을 이용한 SVM 앙상블 구조의 구성을 제안한다. SVM 앙상블의 학습에서 Bagging은 각각의 SVM의 학습데이타는 전체 데이타 집합에서 임의적으로 일부 추출되며, Boosting은 SVM 분류기의 에러와 연관된 확률분포에 따라 학습데이타를 추출한다. 학습단계를 마치면 다수결 (Majority voting), 최소자승추정법(LSE:Least Square estimation), 2단계 계층적 SVM등의 기법에 개개의 SVM들의 출력 값들이 통합되어진다. IRIS 분류, 필기체 숫자인식, 얼굴/비얼굴 분류와 같은 여러 실험들의 결과들은 제안된 SVM 앙상블의 분류성능이 단일 SVM보다 뛰어남을 보여준다.

다중 정상 하에서 단일 클래스 분류기법을 이용한 이상치 탐지 : TFT-LCD 공정 사례 (A Novelty Detection Algorithm for Multiple Normal Classes : Application to TFT-LCD Processes)

  • 주태우;김성범
    • 대한산업공학회지
    • /
    • 제39권2호
    • /
    • pp.82-89
    • /
    • 2013
  • Novelty detection (ND) is an effective technique that can be used to determine whether a future observation is normal or not. In the present study we propose a novelty detection algorithm that can handle a situation where the distributions of target (normal) observations are inhomogeneous. A simulation study and a real case with the TFT-LCD process demonstrated the effectiveness and usefulness of the proposed algorithm.

Improvement of Collaborative Filtering Algorithm Using Imputation Methods

  • Jeong, Hyeong-Chul;Kwak, Min-Jung;Noh, Hyun-Ju
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권3호
    • /
    • pp.441-450
    • /
    • 2003
  • Collaborative filtering is one of the most widely used methodologies for recommendation system. Collaborative filtering is based on a data matrix of each customer's preferences and frequently, there exits missing data problem. We introduced two imputation approach (multiple imputation via Markov Chain Monte Carlo method and multiple imputation via bootstrap method) to improve the prediction performance of collaborative filtering and evaluated the performance using EachMovie data.

  • PDF

Plossom : Spring Boot를 활용한 웹 기반 프로젝트 관리 시스템 (Plossom : Web-based Project Management System Using Spring Boot)

  • 이한성;조보현;김희중;신지영;이형우
    • 사물인터넷융복합논문지
    • /
    • 제2권3호
    • /
    • pp.17-24
    • /
    • 2016
  • 본 논문에서는 편리하고 효율적인 프로젝트를 관리하기 위한 웹 응용 시스템인 Plossom을 개발하였다. Plossom의 개발은 HTML과 Bootstrap 프레임 워크를 이용하여 웹페이지를 구성하였으며, JQuery를 이용하여 웹페이지에 맞는 알고리즘을 사용해 로직을 구축하였고, Spring의 Thymeleaf와 MySQL을 활용하여 프로젝트 정보를 외부 시스템과 연동하여 체계적인 관리를 할 수 있도록 하였다. 본 연구에서 개발한 Plossom 통합 프로젝트 관리 시스템을 이용할 경우 IoT 및 ICT 관련 프로젝트에 대한 개발 과정에 매우 유용하게 활용할 수 있을 것으로 기대된다.