• 제목/요약/키워드: Hybrid Data Model

검색결과 722건 처리시간 0.022초

여러 가지 Inductive 방법에 대한 통합모델 개발과 그 실증적 유효성에 대한 연구 (The Development of Hybrid Model and Empirical Study for the Several Inductive Approaches)

  • 김광용
    • 한국경영과학회지
    • /
    • 제23권3호
    • /
    • pp.185-207
    • /
    • 1998
  • This research investigates computer generated hybrid second-order model of two numerically based approaches to risk classification : discriminant analysis and neural networks. The hybrid second-order models are derived by rule induction using the ID3 and tested in the several different kinds of data. This new hybrid approach is designed to combine the high prediction accuracy and robustness of DA or NN with perspicuity of ID3. The hybrid model also eliminates the problem of contradictory inputs of ID3. After doing empirical test for the validity of hybrid model using small and medium companies' bankrupt data, hybrid model shows high perspicuity, high prediction accuracy for bankrupt, and simplicity for rules. The hybrid model also shows high performance regardless the type of data such as numeric data, non-numeric data, and combined data.

  • PDF

트렌드와 계절성을 가진 시계열에 대한 순수 모형과 하이브리드 모형의 비교 연구 (Comparison Studies of Hybrid and Non-hybrid Forecasting Models for Seasonal and Trend Time Series Data)

  • 정철우;김명석
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2013
  • 본 연구에서는 시계열 예측을 위해 선형 모형과 비선형 모형의 하이브리드 모형 및 순수 모형의 성과를 비교 평가하였다. 이를 위해 5가지 서로 다른 패턴을 가지는 데이터를 생성하여 시뮬레이션을 진행하였다. 본 연구에서 고려한 선형 모형은 AR(autoregressive model)과 SARIMA(seasonal autoregressive integrated moving average model)이고 비선형 모형은 인공신경망(artificial neural networks model)과 GAM(generalized additive model)이다. 특히, GAM은 여러 장점에도 불구하고 시계열 예측을 위한 비선형 모형으로 기존 연구들에서는 거의 쓰이지 않았던 모형이다. 시뮬레이션 결과, seasonality를 가지는 시계열에 대해서는 AR 및 AR-AR 모형이, trend를 가지는 시계열에 대해서는 SARIMA 및 SARIMA와 다른 모형의 하이브리드 모형이 다른 모형에 비해 높은 성과를 보였다. 한편, 인공신경망과 GAM을 비교하면, 트렌드와 계절성이 더해진 시계열에 대해 SARIMA와 GAM의 하이브리드 모형이 거의 모든 노이즈(noise) 수준에 대해 높은 성과를 보인 반면, 노이즈 수준이 미미한 경우에 한해 SARIMA와 인공신경망의 하이브리드 모형이 높은 성과를 보였다.

교통사고 데이터의 패턴 분석과 Hybrid Model을 이용한 피해자 상해 심각도 예측 (Pattern Analysis of Traffic Accident data and Prediction of Victim Injury Severity Using Hybrid Model)

  • 주영지;홍택은;신주현
    • 스마트미디어저널
    • /
    • 제5권4호
    • /
    • pp.75-82
    • /
    • 2016
  • 우리나라의 경제 성장과 도로 환경의 변화를 통해 국내 자동차 시장이 성장하였으나, 이로 인해 교통사고율 또한 증가하였고, 인명 피해가 심각한 수준이다. 이에 따라, 정부에서는 교통사고 데이터를 개방하고 문제를 해결하기 위한 정책을 수립 및 추진 중이다. 본 논문에서는 교통사고 데이터를 이용하여 클래스의 불균형을 해소하고, Hybrid Model 구축을 통한 교통사고 예측을 위해 원본 교통사고 데이터와 Sampling을 수행한 데이터를 학습 데이터로 사용한다. 두 학습데이터에 연관규칙 학습기법인 FP-Growth 알고리즘을 이용하여 교통사고 상해 심각도와 연관된 패턴을 학습한다. 두 학습 데이터의 연관 패턴을 분석을 통해 같은 연관된 패턴을 추출하고 의사결정트리와 다항 로지스틱 회귀분석기법에 연관된 속성에 가중치를 부여하여 융합형 Hybrid Model을 구축하고 교통사고 피해자 상해 심각도를 예측하는 방법에 대해 제안한다.

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

하이브리드 구조실험을 위한 데이터 모델 (Data Model for Hybrid Structural Experiments)

  • 이창호;토마스 마룰로;리차드 소스
    • 한국전산구조공학회논문집
    • /
    • 제22권5호
    • /
    • pp.391-401
    • /
    • 2009
  • 하이브리드 구조실험에서는 구조물을 여러 개의 부분구조물로 나누어서 실험과 해석을 하고 이의 결과를 합쳐서 전체적인 구조물의 거동을 파악한다. 이러한 방법은 진동대 실험과 비교하여 구조물의 크기제한의 영향을 받지 않는 유사동적 실험에 효과적이다. 하이브리드 구조실험과정에서 발생된 데이터와 관련 정보를 저장하고 검색할 수 있는 컴퓨터시스템을 만들기 위해서는 하이브리드 구조실험과 관련된 정보를 체계화시켜서 구성하는 작업이 선행되어야 한다. 본 논문은 하이브리드 구조실험에 관련된 정보를 표현하는 데이터 모델을 제시하고 있는데, 이 데이터 모델은 포괄적인 구조실험 정보를 표현하는 데이터 모델의 하나인 리하이 모델에서 하이브리드 실험부분을 개선한 것이다. 하이브리드 구조실험에서의 부분구조물들을 표현하기 위하여 실험모델 클래스와 해석모델 클래스를 정의하였고, 이러한 클래스들의 정보교환을 조정하는 클래스를 정의하였으며, 제한된 범위의 시스템을 구현하여 객체들 간의 연결 상태를 파악할 수 있도록 하였다. 본 논문에서 기술한 데이터 모델은 구조실험자와 연구자들이 사용할 수 있는 하이브리드 구조실험 정보를 저장하는 컴퓨터 시스템을 개발하는데 적용할 수 있을 것으로 사료된다.

디젤분무의 모사를 위한 혼합 모델의 개발 (Development of Hybrid Model for Simulating of Diesel Spary Dynamics)

  • 김정일;노수영
    • 한국자동차공학회논문집
    • /
    • 제9권1호
    • /
    • pp.8-19
    • /
    • 2001
  • A number of atomization and droplet breakup models have been developed and used to predict the diesel spray characteristic. Most of these models could not provide reasonable computational result of the diesel spray characteristic because they have only considered the primary breakup. A hybrid model is, therefore, required to develop by considering the primary and secondary breakup of liquid jet. according to this approach, wave breakup(WB) model was used compute the primary breakup of the liquid jet and droplet deformation and breakup(DDB) model was used for the secondary breakup of droplet. Development of hybrid model by using KIVA-II code was performed by comparing with the experimental data of spray tip penetration and SMD from the literature. A hybrid model developed in this study could provide the good agreement with the experimental data of spray tip penetration. The prediction results of SMD were in good agreement between 0.5 and 1.0 ms after the start of injection. Numerical results obtained by the present hybrid model have the good agreement with the experimental data with the breakup time constant in WB model of 30, and DDB model constant Ck of 1.0 when the droplet becomes less than 95% of maximum droplet diameter injected.

  • PDF

Artificial Neural Networks for Interest Rate Forecasting based on Structural Change : A Comparative Analysis of Data Mining Classifiers

  • Oh, Kyong-Joo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권3호
    • /
    • pp.641-651
    • /
    • 2003
  • This study suggests the hybrid models for interest rate forecasting using structural changes (or change points). The basic concept of this proposed model is to obtain significant intervals caused by change points, to identify them as the change-point groups, and to reflect them in interest rate forecasting. The model is composed of three phases. The first phase is to detect successive structural changes in the U. S. Treasury bill rate dataset. The second phase is to forecast the change-point groups with data mining classifiers. The final phase is to forecast interest rates with backpropagation neural networks (BPN). Based on this structure, we propose three hybrid models in terms of data mining classifier: (1) multivariate discriminant analysis (MDA)-supported model, (2) case-based reasoning (CBR)-supported model, and (3) BPN-supported model. Subsequently, we compare these models with a neural network model alone and, in addition, determine which of three classifiers (MDA, CBR and BPN) can perform better. For interest rate forecasting, this study then examines the prediction ability of hybrid models to reflect the structural change.

  • PDF

Assessment of Wind Power Prediction Using Hybrid Method and Comparison with Different Models

  • Eissa, Mohammed;Yu, Jilai;Wang, Songyan;Liu, Peng
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권3호
    • /
    • pp.1089-1098
    • /
    • 2018
  • This study aims at developing and applying a hybrid model to the wind power prediction (WPP). The hybrid model for a very-short-term WPP (VSTWPP) is achieved through analytical data, multiple linear regressions and least square methods (MLR&LS). The data used in our hybrid model are based on the historical records of wind power from an offshore region. In this model, the WPP is achieved in four steps: 1) transforming historical data into ratios; 2) predicting the wind power using the ratios; 3) predicting rectification ratios by the total wind power; 4) predicting the wind power using the proposed rectification method. The proposed method includes one-step and multi-step predictions. The WPP is tested by applying different models, such as the autoregressive moving average (ARMA), support vector machine (SVM), and artificial neural network (ANN). The results of all these models confirmed the validity of the proposed hybrid model in terms of error as well as its effectiveness. Furthermore, forecasting errors are compared to depict a highly variable WPP, and the correlations between the actual and predicted wind powers are shown. Simulations are carried out to definitely prove the feasibility and excellent performance of the proposed method for the VSTWPP versus that of the SVM, ANN and ARMA models.

NLS와 OLS의 하이브리드 방법에 의한 Bass 확산모형의 모수추정 (A Parameter Estimation of Bass Diffusion Model by the Hybrid of NLS and OLS)

  • 홍정식;김태구;구훈영
    • 대한산업공학회지
    • /
    • 제37권1호
    • /
    • pp.74-82
    • /
    • 2011
  • The Bass model is a cornerstone in diffusion theory which is used for forecasting demand of durables or new services. Three well-known estimation methods for parameters of the Bass model are Ordinary Least Square (OLS), Maximum Likelihood Estimator (MLE), Nonlinear Least Square (NLS). In this paper, a hybrid method incorporating OLS and NLS is presented and it's performance is analyzed and compared with OLS and NLS by using simulation data and empirical data. The results show that NLS has the best performance in terms of accuracy and our hybrid method has the best performance in terms of stability. Specifically, hybrid method has better performance with less data. This result means much in practical aspect because the avaliable data is little when a diffusion model is used for forecasting demand of a new product.

Personal Data Security in Recruitment Platforms

  • Bajoudah, Alya'a;AlSuwat, Hatim
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.310-318
    • /
    • 2022
  • Job offers have become more widespread and it has become easier and faster to apply for jobs through electronic recruitment platforms. In order to increase the protection of the data that is attached to the recruitment platforms. In this research, a proposed model was created through the use of hybrid encryption, which is used through the following algorithms: AES,Twofish,. This proposed model proved the effectiveness of using hybrid encryption in protecting personal data.