• 제목/요약/키워드: Ensemble system

검색결과 366건 처리시간 0.024초

Predicting Stock Liquidity by Using Ensemble Data Mining Methods

  • Bae, Eun Chan;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.9-19
    • /
    • 2016
  • In finance literature, stock liquidity showing how stocks can be cashed out in the market has received rich attentions from both academicians and practitioners. The reasons are plenty. First, it is known that stock liquidity affects significantly asset pricing. Second, macroeconomic announcements influence liquidity in the stock market. Therefore, stock liquidity itself affects investors' decision and managers' decision as well. Though there exist a great deal of literature about stock liquidity in finance literature, it is quite clear that there are no studies attempting to investigate the stock liquidity issue as one of decision making problems. In finance literature, most of stock liquidity studies had dealt with limited views such as how much it influences stock price, which variables are associated with describing the stock liquidity significantly, etc. However, this paper posits that stock liquidity issue may become a serious decision-making problem, and then be handled by using data mining techniques to estimate its future extent with statistical validity. In this sense, we collected financial data set from a number of manufacturing companies listed in KRX (Korea Exchange) during the period of 2010 to 2013. The reason why we selected dataset from 2010 was to avoid the after-shocks of financial crisis that occurred in 2008. We used Fn-GuidPro system to gather total 5,700 financial data set. Stock liquidity measure was computed by the procedures proposed by Amihud (2002) which is known to show best metrics for showing relationship with daily return. We applied five data mining techniques (or classifiers) such as Bayesian network, support vector machine (SVM), decision tree, neural network, and ensemble method. Bayesian networks include GBN (General Bayesian Network), NBN (Naive BN), TAN (Tree Augmented NBN). Decision tree uses CART and C4.5. Regression result was used as a benchmarking performance. Ensemble method uses two types-integration of two classifiers, and three classifiers. Ensemble method is based on voting for the sake of integrating classifiers. Among the single classifiers, CART showed best performance with 48.2%, compared with 37.18% by regression. Among the ensemble methods, the result from integrating TAN, CART, and SVM was best with 49.25%. Through the additional analysis in individual industries, those relatively stabilized industries like electronic appliances, wholesale & retailing, woods, leather-bags-shoes showed better performance over 50%.

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

수문기상학적 활용을 위한 레이더 강우자료 생산(II) : 레이더 강우앙상블 (Generation of radar rainfall data for hydrological and meteorological application (II) : radar rainfall ensemble)

  • 김태정;이동률;장상민;권현한
    • 한국수자원학회논문집
    • /
    • 제50권1호
    • /
    • pp.17-28
    • /
    • 2017
  • 최근 국지성 집중호우 및 돌발홍수와 같은 급격한 기상변화로 인한 기상재해의 발생빈도가 증가함에 따라 고해상도의 기상레이더 강우자료를 사용한 수공학 분야의 연구가 활발하게 진행되고 있다. 기상레이더는 넓은 지역에 걸쳐 실시간으로 강우현상 감시가 가능하며 지상우량계로는 파악이 불가능한 미계측유역을 통과하는 강우장의 이동 및 변동성 파악이 가능한 장점이 있지만 대기 중 존재하는 수상체로부터 반사되는 반사도를 사용하여 강우량을 산정하므로 시공간적 오차가 존재한다. 본 연구에서는 이러한 문제점을 해결하기 위하여 다변량 Copula 함수를 활용하여 레이더 강우에 존재하는 시공간적 오차를 규명하고 레이더 강우앙상블 생산기법을 개발하였다. 개발된 모형으로부터 생산된 레이더 강우앙상블은 통계적 효율기준 분석결과 우수한 모형성능을 확인하였으며 추가적으로 극치호우 및 강우시계열 패턴 분석결과 지상강우의 특성을 효과적으로 재현하는 것을 확인하였다.

트래픽 데이터의 통계적 기반 특징과 앙상블 학습을 이용한 토르 네트워크 웹사이트 핑거프린팅 (Tor Network Website Fingerprinting Using Statistical-Based Feature and Ensemble Learning of Traffic Data)

  • 김준호;김원겸;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.187-194
    • /
    • 2020
  • 본 논문은 클라이언트의 익명성과 개인 정보를 보장하는 토르 네트워크에서 앙상블 학습을 이용한 웹사이트 핑거프린팅 방법을 제안한다. 토르네트워크에서 수집된 트래픽 패킷들로부터 웹사이트 핑거프린팅을 위한 훈련 문제를 구성하며, 트리 기반 앙상블 모델을 적용한 웹사이트 핑거프린팅 시스템의 성능을 비교한다. 훈련 특징 벡터는 트래픽 시퀀스에서 추출된 범용 정보, 버스트, 셀 시퀀스 길이, 그리고 셀 순서로부터 준비하며, 각 웹사이트의 특징은 고정 길이로 표현된다. 실험 평가를 위해 웹사이트 핑거프린팅의 사용에 따른 4가지 학습 문제(Wang14, BW, CWT, CWH)를 정의하고, CUMUL 특징 벡터를 사용한 지지 벡터 기계 모델과 성능을 비교한다. 실험 평가에서, BW 경우를 제외하고 제안하는 통계 기반 훈련 특징 표현이 CUMUL 특징 표현보다 우수하다.

혼합분류기 기반 영상내 움직이는 객체의 혼잡도 인식에 관한 연구 (A Study on Recognition of Moving Object Crowdedness Based on Ensemble Classifiers in a Sequence)

  • 안태기;안성제;박광영;박구만
    • 한국통신학회논문지
    • /
    • 제37권2A호
    • /
    • pp.95-104
    • /
    • 2012
  • 혼합분류기를 이용한 패턴인식은 약한 분류기를 결합하여 강한 분류기를 구성하는 형태이다. 본 논문에서는 고정된 카메라를 통해 입력된 영상을 이용하여 특징을 추출하고 이것들을 이용한 약한 분류기의 결합으로 강한 분류기를 만들어 낸다. 제안하는 시스템 구성은 차영상 기법을 이용해서 이진화된 전경 영상을 얻고 모폴로지 침식연산 수행으로 얻어진 혼잡도 가중치 영상을 이용해 특징을 추출하게 된다. 추출된 특징을 조합하고 혼잡도를 판단하기 위한 모델의 훈련 및 인식을 위한 혼합분류기 알고리즘으로 부스팅 방법을 사용하였다. 혼합 분류기는 약한 분류기의 조합으로 하나의 강한 분류기를 만들어 내는 분류기로서 그림자나 반사 등이 일어나는 환경에서도 잠재적인 특징들을 잘 활용할 수 있다. 제안하는 시스템의 성능실험은 "AVSS 2007"의 도로환경의 차량 영상과 철도환경내의 승강장 영상을 사용하였다. 조명변화가 심한 야외환경과 승강장과 같은 복잡한 환경에서도 시스템의 우수한 성능을 보여주었다.

Credit Risk Evaluations of Online Retail Enterprises Using Support Vector Machines Ensemble: An Empirical Study from China

  • LI, Xin;XIA, Han
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권8호
    • /
    • pp.89-97
    • /
    • 2022
  • The e-commerce market faces significant credit risks due to the complexity of the industry and information asymmetries. Therefore, credit risk has started to stymie the growth of e-commerce. However, there is no reliable system for evaluating the creditworthiness of e-commerce companies. Therefore, this paper constructs a credit risk evaluation index system that comprehensively considers the online and offline behavior of online retail enterprises, including 15 indicators that reflect online credit risk and 15 indicators that reflect offline credit risk. This paper establishes an integration method based on a fuzzy integral support vector machine, which takes the factor analysis results of the credit risk evaluation index system of online retail enterprises as the input and the credit risk evaluation results of online retail enterprises as the output. The classification results of each sub-classifier and the importance of each sub-classifier decision to the final decision have been taken into account in this method. Select the sample data of 1500 online retail loan customers from a bank to test the model. The empirical results demonstrate that the proposed method outperforms a single SVM and traditional SVMs aggregation technique via majority voting in terms of classification accuracy, which provides a basis for banks to establish a reliable evaluation system.

비선형 Kalman Filter를 사용한 타이어 횡력 추정 시스템 (Tire Lateral Force Estimation System Using Nonlinear Kalman Filter)

  • 이동훈;김인근;허건수
    • 한국자동차공학회논문집
    • /
    • 제20권6호
    • /
    • pp.126-131
    • /
    • 2012
  • Tire force is one of important parameters which determine vehicle dynamics. However, it is hard to measure tire force directly through sensors. Not only the sensor is expensive but also installation of sensors on harsh environments is difficult. Therefore, estimation algorithms based on vehicle dynamic models are introduced to estimate the tire forces indirectly. In this paper, an estimation system for estimating lateral force and states is suggested. The state-space equation is constructed based on the 3-DOF bicycle model. Extended Kalman Filter, Unscented Kalman Filter and Ensemble Kalman Filter are used for estimating states on the nonlinear system. Performance of each algorithm is evaluated in terms of RMSE (Root Mean Square Error) and maximum error.

전투기용 레이다 기반 SAR 영상 자동표적분류 기능 구조 및 CNN 앙상블 모델을 이용한 표적분류 정확도 향상 방안 연구 (Study on the Functional Architecture and Improvement Accuracy for Auto Target Classification on the SAR Image by using CNN Ensemble Model based on the Radar System for the Fighter)

  • 임동주;송세리;박범
    • 시스템엔지니어링학술지
    • /
    • 제16권1호
    • /
    • pp.51-57
    • /
    • 2020
  • The fighter pilot uses radar mounted on the fighter to obtain high-resolution SAR (Synthetic Aperture Radar) images for a specific area of distance, and then the pilot visually classifies targets within the image. However, the target configuration captured in the SAR image is relatively small in size, and distortion of that type occurs depending on the depression angle, making it difficult for pilot to classify the type of target. Also, being present with various types of clutters, there should be errors in target classification and pilots should be even worse if tasks such as navigation and situational awareness are carried out simultaneously. In this paper, the concept of operation and functional structure of radar system for fighter jets were presented to transfer the SAR image target classification task of fighter pilots to radar system, and the method of target classification with high accuracy was studied using the CNN ensemble model to archive higher classification accuracy than single CNN model.

강우앙상블자료 편의보정에 따른 단기강우예측모델의 적용성 분석 (Application Analysis of Short-term Rainfall Forecasting Model according to Bias Correlation in Rainfall Ensemble Data)

  • 이상협;성연정;쉬크샤 바스톨라;추인교;정영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.119-119
    • /
    • 2019
  • 최근 기후변화와 이상기후의 영향으로 국지성 호우 및 가뭄, 홍수, 태풍 등 재해 발생 규모가 커지고 그 빈도 또한 많아지고 있다. 이러한 자연재해 및 이상현상에 대한 피해를 예방하고 빠르게 대처하기 위해서는 정확한 강우량 추정 및 강우의 시간적 예측이 필요하다. 이러한 강우의 불확실성을 해결하기 위해서 기상청 등에서는 단일 수치예보가 가지는 결정론적인 예측의 한계를 보완한 초기조건, 물리과정, 경계조건 등이 다른 여러 개의 모델을 수행하여, 확률적으로 미래를 예측하는 앙상블 예측 시스템을 예보기술에 응용하고 있으며 기존 수치모델의 정보와 예보 불확실성에 대한 정보를 동시에 제공하고 있다. 그러나 다양한 자연조건에 대한 불완전한 물리적 이해와 연산 능력 등의 한계로 높은 불확실성이 내포되어 있으므로 불확실성을 최소화하기 위한 편의보정이 수행될 필요가 있다. 강우분석의 적용 이전에 해당 자료의 타당성과 신뢰도의 분석이 필요하다. 본 연구에서는 LENS(Local ENsemble prediction System) 예측값과 시강우 관측값을 단기예측모델에 맞추어 3시간 누적하여 비교하였다. 비교 기간은 호우가 집중되는 2016년 10월로 선정하였으며 대상지역은 울산중구로 선정하였다. LENS를 대상 지역의 관측소 지점값과 행정구역 면적값을 따로 추출한 후, 불확실성을 최소화하기 위해 활용되고 있는 CF 기법과 QM 기법을 이용하여 LENS 모델을 재가공하고 이에 따른 편의보정 기법에 따른 LENS 모델을 과거의 실제강우 관측값과의 비교분석을 이용해 적용성을 검토 및 평가하였다.

  • PDF

높은 정확도를 위한 이미지 전처리와 앙상블 기법을 결합한 이미지 기반 악성코드 분류 시스템에 관한 연구 (A Study on the Image-Based Malware Classification System that Combines Image Preprocessing and Ensemble Techniques for High Accuracy)

  • 김해수;김미희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권7호
    • /
    • pp.225-232
    • /
    • 2022
  • 최근 정보통신 기술의 발전이 많은 이에게 이점이 되고 있지만, 그와 동시에 새로운 프로그램의 취약점을 통해 악의적 공격 시도 또한 증가하고 있다. 악의적 공격 중 악성코드는 다양한 방식으로 동작하며 매번 새로운 방식으로 사람들에게 유포되고 이러한 악성코드들을 해결하기 위해 발견된 악성코드를 빠르게 분석하여 방어기법을 제공해야 한다. 새로운 악성코드를 기존 악성코드와 동일한 종류로 분류할 수 있다면 동작의 유사성을 가진 악성코드들의 분석된 특징을 이용해 새로운 악성코드의 방어기법을 제공할 수 있다. 따라서 악성코드를 정확하고 빠르게 분류하는 방법이 있어야 한다. 또한, 분석된 악성코드들의 패밀리 마다 데이터의 개수가 균일하지 않을 수 있으므로 이에 대한 해결방안이 필요하다. 본 논문에서는 이미지 전처리 기법과 앙상블 기법을 결합하여 개수가 균일하지 않은 데이터에서 정확도를 높이는 시스템을 제안한다.