• 제목/요약/키워드: linear SVM

검색결과 172건 처리시간 0.02초

기상 데이터와 대기 환경 데이터 기반 (초)미세먼지 분석과 예측 (Analysis and Prediction of (Ultra) Air Pollution based on Meteorological Data and Atmospheric Environment Data)

  • 박홍진
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.328-337
    • /
    • 2021
  • 석면, 벤젠과 같이 발암물질 1급인 미세먼지는 각종 질병에 원인이 되고 있다. 초 미세먼지 확산은 코로나 바이러스 확산의 중요한 원인중 하나이다. 본 논문은 2015년부터 2019년까지 서울시 평균 기온, 강수량, 평균 풍속등의 기상 데이터와 SO2, NO2, O3,등의 대기 환경 데이터를 기반으로 미세먼지와 초 미세먼지를 분석하고 예측한다. 계절별과 월별로 미세먼지와 초미세먼지 현황을 파악·분석하며 미세먼지를 예측하기 위해 기계학습 모델 중 선형회귀, SVM, 앙상블 모델을 이용하여 비교 분석하였다. 또한 미세먼지와 초 미세먼지 발생에 영향을 미치는 중요한 피쳐(속성)를 파악한다. 본 논문이 파악한 결과 3월에 가장 (초)미세먼지가 높았고, 8월에서 9월까지 (초)미세먼지가 가장 낮았다. 기상 데이터일 경우 (초)미세먼지에 가장 영향을 미치는 데이터가 평균 기온이며, 기상 데이터와 대기 환경 데이터일 경우 NO2가 (초)미세먼지 발생에 가장 크게 작용하였다.

다중 프레임에서의 보행자 검출 및 삭제 알고리즘 (Automatic Pedestrian Removal Algorithm Using Multiple Frames)

  • 김창성;이동석;박동선
    • 스마트미디어저널
    • /
    • 제4권2호
    • /
    • pp.26-33
    • /
    • 2015
  • 본 논문은 영상에서 효과적으로 보행자를 삭제하는 자동 삭제 시스템을 제안한다. 첫 번째로 Histogram of Oriented Gradient(HOG) / Linear-Support Vector Machine(L-SVM)분류기를 이용하여 보행자를 찾고, 참조영상으로부터 적절한 배경을 습득하여 삭제될 보행자를 대체한다. 배경은 참조영상 내에서 검색하며 변경된 feather blender 연산은 대체 영역의 경계를 자연스럽게 만든다. 기존에 존재하던 대부분의 시스템이 수동인 것에 반해 제안된 시스템은 자동으로 객체를 검출하고 자연스러운 배경을 생성한다. 실험결과 대체된 영역의 PSNR 평균은 19.246으로 측정되었다.

아두이노와 Emotiv Epoc을 이용한 정상상태시각유발전위 (SSVEP) 기반의 로봇 제어 (Robot Control based on Steady-State Visual Evoked Potential using Arduino and Emotiv Epoc)

  • 유제훈;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제25권3호
    • /
    • pp.254-259
    • /
    • 2015
  • 본 논문은 BCI(Brain Computer Interface)기반의 정상상태시각유발전위(SSVEP : Steady-State Visual Evoked Potential)를 사용하여 무선 로봇 제어를 위한 시스템을 제안하였다. CPSD(Cross Power Spectral Density)를 사용하여 전극의 신호를 분석하였다. 또한 분류를 위해서 LDA(Linear Discriminant Analysis)와 SVM(Support Vector Machine)을 사용하였다. 그 결과 피험자들의 평균 분류율은 약 70%로 나타났다. 로봇제어의 경우 뇌파의 값을 분류하여 나타난 결과 값으로 로봇이 움직일 수 있도록 구현하였고, 블루투스 통신을 이용하여 로봇제어를 수행하였다.

Data Mining을 이용한 전략시뮬레이션 게임 데이터 분석 (A Study of Analyzing Realtime Strategy Game Data using Data Mining)

  • 용혜련;김도진;황현석
    • 한국게임학회 논문지
    • /
    • 제15권4호
    • /
    • pp.59-68
    • /
    • 2015
  • 정보통신기술의 발달로 빅데이터 분석을 통해 사람들 일상의 기록과 잠재적 요구까지 통찰할 수 있게 되었으며, 우리의 일상 속에서 방대한 정보를 실시간으로 도출하고 있다. 여러 산업이나 기업에서 이미 빅데이터와 결합시켜 비즈니스 등 다양한 분야에 활용하고 있지만 게임 산업에서의 빅데이터 활용은 아직까지 미흡한 실정이다. 이에 본 연구에서는 데이터 마이닝을 기법을 적용하여 전략시뮬레이션 게임 데이터를 분석하였다. 전략시뮬레이션 게임 데이터를 Decision Tree, Random Forest, Multi-class SVM, Linear Regression 분석 기법을 적용하여 게임 유저의 게임수준에 영향을 미치는 요인을 분석하였다. 게임수준을 예측하는데 있어 가장 우수한 성능을 보인 기법과 변수들을 도출하여 게임 디자인과 사용성을 증대시키기 위한 제안을 하고자 한다.

A Multi-Class Classifier of Modified Convolution Neural Network by Dynamic Hyperplane of Support Vector Machine

  • Nur Suhailayani Suhaimi;Zalinda Othman;Mohd Ridzwan Yaakub
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.21-31
    • /
    • 2023
  • In this paper, we focused on the problem of evaluating multi-class classification accuracy and simulation of multiple classifier performance metrics. Multi-class classifiers for sentiment analysis involved many challenges, whereas previous research narrowed to the binary classification model since it provides higher accuracy when dealing with text data. Thus, we take inspiration from the non-linear Support Vector Machine to modify the algorithm by embedding dynamic hyperplanes representing multiple class labels. Then we analyzed the performance of multi-class classifiers using macro-accuracy, micro-accuracy and several other metrics to justify the significance of our algorithm enhancement. Furthermore, we hybridized Enhanced Convolution Neural Network (ECNN) with Dynamic Support Vector Machine (DSVM) to demonstrate the effectiveness and efficiency of the classifier towards multi-class text data. We performed experiments on three hybrid classifiers, which are ECNN with Binary SVM (ECNN-BSVM), and ECNN with linear Multi-Class SVM (ECNN-MCSVM) and our proposed algorithm (ECNNDSVM). Comparative experiments of hybrid algorithms yielded 85.12 % for single metric accuracy; 86.95 % for multiple metrics on average. As for our modified algorithm of the ECNN-DSVM classifier, we reached 98.29 % micro-accuracy results with an f-score value of 98 % at most. For the future direction of this research, we are aiming for hyperplane optimization analysis.

지지벡터기계의 변수 선택방법 비교 (Comparison of Feature Selection Methods in Support Vector Machines)

  • 김광수;박창이
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.131-139
    • /
    • 2013
  • 지지벡터기계는 잡음변수가 존재하는 경우에 성능이 저하될 수 있다. 또한 최종 분류기에서 각 변수들의 중요도를 알리 어려운 단점이 있다. 따라서 변수선택은 지지벡터기계의 해석력과 정확도를 높일 수 있다. 기존의 문헌상의 대부분의 연구는 선형 지지벡터기계에서 성근 해를 주는 벌점함수를 통해 변수를 선택에 관한 것이다. 실제로는 분류의 정확도를 높이기 위해 비선형 커널을 사용하는 경우가 일반적이다. 따라서 변수선택은 비선형 지지벡터기계에서도 마찬가지로 필요하다. 본 논문에서는 모의실험 및 실제자료를 통하여 비선형 지지벡터의 대표적인 변수선택법인 COSSO(component selection and smoothing operator)와 KNIFE(kernel iterative feature extraction)의 성능을 비교한다.

Assessment of Wind Power Prediction Using Hybrid Method and Comparison with Different Models

  • Eissa, Mohammed;Yu, Jilai;Wang, Songyan;Liu, Peng
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권3호
    • /
    • pp.1089-1098
    • /
    • 2018
  • This study aims at developing and applying a hybrid model to the wind power prediction (WPP). The hybrid model for a very-short-term WPP (VSTWPP) is achieved through analytical data, multiple linear regressions and least square methods (MLR&LS). The data used in our hybrid model are based on the historical records of wind power from an offshore region. In this model, the WPP is achieved in four steps: 1) transforming historical data into ratios; 2) predicting the wind power using the ratios; 3) predicting rectification ratios by the total wind power; 4) predicting the wind power using the proposed rectification method. The proposed method includes one-step and multi-step predictions. The WPP is tested by applying different models, such as the autoregressive moving average (ARMA), support vector machine (SVM), and artificial neural network (ANN). The results of all these models confirmed the validity of the proposed hybrid model in terms of error as well as its effectiveness. Furthermore, forecasting errors are compared to depict a highly variable WPP, and the correlations between the actual and predicted wind powers are shown. Simulations are carried out to definitely prove the feasibility and excellent performance of the proposed method for the VSTWPP versus that of the SVM, ANN and ARMA models.

DATA MINING AND PREDICTION OF SAI TYPE MATRIX PRECONDITIONER

  • Kim, Sang-Bae;Xu, Shuting;Zhang, Jun
    • Journal of applied mathematics & informatics
    • /
    • 제28권1_2호
    • /
    • pp.351-361
    • /
    • 2010
  • The solution of large sparse linear systems is one of the most important problems in large scale scientific computing. Among the many methods developed, the preconditioned Krylov subspace methods are considered the preferred methods. Selecting a suitable preconditioner with appropriate parameters for a specific sparse linear system presents a challenging task for many application scientists and engineers who have little knowledge of preconditioned iterative methods. The prediction of ILU type preconditioners was considered in [27] where support vector machine(SVM), as a data mining technique, is used to classify large sparse linear systems and predict best preconditioners. In this paper, we apply the data mining approach to the sparse approximate inverse(SAI) type preconditioners to find some parameters with which the preconditioned Krylov subspace method on the linear systems shows best performance.

기계학습 분류모델을 이용한 하천퇴적물의 중금속 오염원 식별 (Identifying sources of heavy metal contamination in stream sediments using machine learning classifiers)

  • 반민정;신상욱;이동훈;김정규;이호식;김영;박정훈;이순화;김선영;강주현
    • 한국습지학회지
    • /
    • 제25권4호
    • /
    • pp.306-314
    • /
    • 2023
  • 하천퇴적물은 유역내 다양한 오염원으로부터 발생하는 중금속, 유기물 등 오염물질의 수용체일 뿐만 아니라 수질 오염 및 수생태 악영향을 유발할 수 있는 2차적 오염원이기에 중요한 관리대상이라고 할 수 있다. 오염된 하천퇴적물의 효과적인 관리를 위해서는 오염원에 대한 식별과 이와 연계된 관리대책의 수립이 우선되어야 한다. 본 연구는 하천퇴적물내 측정된 다양한 이화학적 오염항목 분포 특성에 기반하여 퇴적물의 주요 오염원을 식별하기 위한 방법으로서 기계학습모델의 적용성을 평가하였다. 기계학습 모델의 성능 평가를 위해 전국 4대강 수계내 주요 폐금속광산 및 산업단지 인근에서 수집된 총 356개의 하천퇴적물에 대한 중금속 10개 항목(Cd, Cu, Pb, Ni, As, Zn, Cr, Hg, Li, Al)과 토양항목 3개(모래, 실트, 점토 비율) 수질항목 5개(함수율, 강열감량, 총유기탄소, 총질소, 총인)를 포함한 총 18개 오염항목에 대한 분석자료를 활용하였다. 기계학습 분류 모델로서 선형판별분석(linear discriminant analysis, LDA)과 서포트벡터머신(support vector machine, SVM) 분류기를 사용하여 폐금속광산('광산')과 산업단지('산단') 인근에서의 하천퇴적물 시료의 분류 성능을 평가한 결과, 채취 지점 및 시기별 4가지 경우(비강우시 광산, 강우시 광산, 비강우시 산단, 및 강우시 산단)에 대한 퇴적물 시료의 분류 성능이 우수하였으며, 특히 비선형 모델인 SVM(88.1%)이 선형모델인 LDA(79.5%) 보다 퇴적물을 분류하는데 있어 보다 우수한 성능을 나타냈다. SVM 앙상블 기반 비배타적 다중라벨분류기 모델을 이용하여 각 시료채취 지점 상류 유역 1km 반경 내 지배적인 토지이용 및 오염원을 다중 타겟값으로 다중분류 예측을 수행한 결과, 폐금속광산과 산업단지의 분류는 비교적 높은 정확도로 수행하였으나, 도시와 농업지역 등 다른 비점오염원에 대한 분류정확도는 56~60%범위로 비교적 낮게 나타났다. 이는 다중라벨 분류모델의 복잡성에 비해 데이터셋의 크기가 상대적으로 작아서 발생한 과적합에 기인한 것으로 향후 보다 많은 측정자료가 확보될 경우 기계학습 모델을 적용한 오염원 분류의 정확도를 보다 향상시킬 수 있을 것으로 판단된다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.