• 제목/요약/키워드: Decision Tree (DT) analysis

검색결과 20건 처리시간 0.023초

GPS 재밍탐지를 위한 기계학습 적용 및 성능 분석 (Application and Performance Analysis of Machine Learning for GPS Jamming Detection)

  • 정인환
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.47-55
    • /
    • 2019
  • 최근 GPS 재밍으로 인한 피해가 증가되면서 GPS 재밍을 탐지하고 대비하기 위한 연구가 활발히 진행되고 있다. 본 논문은 다중 GPS 수신채널과 3가지 기계학습을 이용한 GPS 재밍 탐지 방법을 다루고 있다. 제안된 다중 GPS 채널은 항재밍 기능이 없는 상용 GPS 수신기와 항잡음 재밍능력만 있는 수신기, 항잡음/항기만 재밍능력이 있는 수신기로 구성되고 운용자는 각각의 수신기에 수신된 좌표를 비교하여 재밍신호의 특성을 식별할 수 있다. 본 논문에서는 신호특성이 다른 각각의 5개 재밍신호를 입력하고, 3가지 기계학습방법(AB: Adaptive Boosting, SVM: Support Vector Machine, DT: Decision Tree)을 이용하여 재밍탐지 시험을 수행하였다. 시험 결과 머신러닝 기법을 단독으로 사용하였을 때 DT 기법이 96.9% 탐지율로 가장 우수한 성능을 보였으며 이진분류기 기법에 비해 모호성 낮고 하드웨어가 단순하여 GPS 재밍탐지에 효과적임을 확인하였다. 또한, 모호성을 해결해주는 추가기법을 적용할 경우 SVM 기법을 활용할 수 있음을 확인하였다.

의사결정나무를 이용한 온라인 자동차 보험 고객 이탈 예측과 전략적 시사점 (Customer Churning Forecasting and Strategic Implication in Online Auto Insurance using Decision Tree Algorithms)

  • 임세현;허연
    • 경영정보학연구
    • /
    • 제8권3호
    • /
    • pp.125-134
    • /
    • 2006
  • 본 연구에서는 온라인 자동차보험 고객 이탈 예측에 있어 의사결정나무를 적용하였다. 우리는 본 연구에서 2003년과 2004년 사이에 온라인 자동차 보험을 계약한 고객의 데이터를 이용하여 의사결정나무를 이용해 고객이탈을 예측하였다. 우리는 C5.0 알고리즘에 기반을 둔 의사결정나무의 예측 결과에 대한 비교를 위해 다변량판별분석과 로짓분석을 이용하였다. 분석결과 의사결정나무 알고리즘은 다른 기법보다 예측성과가 매우 뛰어난 것으로 나타났다. 이러한 실증분석 결과는 온라인 자동차 보험에 있어서 마케팅전략 수립에 유용한 가이드라인을 제공해 줄 것이다.

Two-Stage Logistic Regression for Cancer Classi cation and Prediction from Copy-Numbe Changes in cDNA Microarray-Based Comparative Genomic Hybridization

  • Kim, Mi-Jung
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.847-859
    • /
    • 2011
  • cDNA microarray-based comparative genomic hybridization(CGH) data includes low-intensity spots and thus a statistical strategy is needed to detect subtle differences between different cancer classes. In this study, genes displaying a high frequency of alteration in one of the different classes were selected among the pre-selected genes that show relatively large variations between genes compared to total variations. Utilizing copy-number changes of the selected genes, this study suggests a statistical approach to predict patients' classes with increased performance by pre-classifying patients with similar genetic alteration scores. Two-stage logistic regression model(TLRM) was suggested to pre-classify homogeneous patients and predict patients' classes for cancer prediction; a decision tree(DT) was combined with logistic regression on the set of informative genes. TLRM was constructed in cDNA microarray-based CGH data from the Cancer Metastasis Research Center(CMRC) at Yonsei University; it predicted the patients' clinical diagnoses with perfect matches (except for one patient among the high-risk and low-risk classified patients where the performance of predictions is critical due to the high sensitivity and specificity requirements for clinical treatments. Accuracy validated by leave-one-out cross-validation(LOOCV) was 83.3% while other classification methods of CART and DT performed as comparisons showed worse performances than TLRM.

DEA와 DT를 활용한 서비스 프로세스 벤치마킹 프레임워크

  • 설현주;최지원;박광만;박용태
    • 기술경영경제학회:학술대회논문집
    • /
    • 기술경영경제학회 2005년도 통합학술대회 논문집
    • /
    • pp.113-137
    • /
    • 2005
  • 본 연구는 각 프로세스가 조직에 미치는 상대적 영향을 고려한 조직 전체의 효율성을 평가하고, 조직의 효율성을 개선하기 위하여 조직을 구성하는 여러 프로세스 중에서 어떤 프로세스를 우선적으로 개선해야 하는지를 결정하며, 더 나아가 비효율적인 프로세스를 개선하기 위하여 어떤 프로세스를 벤치마킹해야 하는지를 결정할 수 있는 체계적인 방법을 제공한다. 이를 위하여 본 연구는 다음과 같은 중요한 세 가지 과정을 따른다. 첫째, DEA(data envelopment analysis)의 CCR 모형을 이용하여 프로세스의 투입요소와 산출 요소를 바탕으로 개별 프로세스의 효율성을 평가한다. 둘째, 도출된 개별프로세스의 효율성을 Lovell과 Pastor의 순수 산출요소(또는 투입요소) DEA 모형의 산출요소로 이용하여 서비스 단위 조직 전체의 효율성을 평가한다. 셋째, 앞서 도출된 개별프로세스의 효율성과 서비스 단위 조직의 전체 효율성을 각각 DT(decision tree)의 예측변수와 목표변수로 활용하여 각 서비스 단위 조직의 특성 및 상황에 따라 개선해야 할 프로세스를 선택하는 규칙을 생성한다. 제안한 방법을 통하여 기업은 비효율적 조직과 프로세스를 발견하고 조직의 효율성을 개선하기 위하여 어떤 프로세스를 우선적으로 개선해야 하는지를 결정할 수 있다. 이를 통하여 기업은 오늘날 기업 경쟁력의 핵심인 프로세스를 좀 더 효과적으로 평가 및 관리할 수 있을 것으로 기대된다.

  • PDF

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

유전자 알고리즘을 이용한 분류자 앙상블의 최적 선택 (Optimal Selection of Classifier Ensemble Using Genetic Algorithms)

  • 김명종
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.99-112
    • /
    • 2010
  • 앙상블 학습은 분류 및 예측 알고리즘의 성과개선을 위하여 제안된 기계학습 기법이다. 그러나 앙상블 학습은 기저 분류자의 다양성이 부족한 경우 다중공선성 문제로 인하여 성과개선 효과가 미약하고 심지어는 성과가 악화될 수 있다는 문제점이 제기되었다. 본 연구에서는 기저 분류자의 다양성을 확보하고 앙상블 학습의 성과개선 효과를 제고하기 위하여 유전자 알고리즘 기반의 범위 최적화 기법을 제안하고자 한다. 본 연구에서 제안된 최적화 기법을 기업 부실예측 인공신경망 앙상블에 적용한 결과 기저 분류자의 다양성이 확보되고 인공신경망 앙상블의 성과가 유의적으로 개선되었음을 보여주었다.

Exploration of Optimal Product Innovation Strategy Using Decision Tree Analysis: A Data-mining Approach

  • Cho, Insu
    • STI Policy Review
    • /
    • 제8권2호
    • /
    • pp.75-93
    • /
    • 2017
  • Recently, global competition in the manufacturing sector is driving firms in the manufacturing sector to conduct product innovation projects to maintain their competitive edge. The key points of product innovation projects are 1) what the purpose of the project is and 2) what expected results in the target market can be achieved by implementing the innovation. Therefore, this study focuses on the performance of innovation projects with a business viewpoint. In this respect, this study proposes the "achievement rate" of product innovation projects as a measurement of project performance. Then, this study finds the best strategies from various innovation activities to optimize the achievement rate of product innovation projects. There are three major innovation activities for the projects, including three types of R&D activities: Internal, joint and external R&D, and five types of non-R&D activities - acquisition of machines, equipment and software, purchasing external knowledge, job education and training, market research and design. This study applies decision tree modeling, a kind of data-mining methodology, to explore effective innovation activities. This study employs the data from the 'Korean Innovation Survey (KIS) 2014: Manufacturing Sector.' The KIS 2014 gathered information about innovation activities in the manufacturing sector over three years (2011-2013). This study gives some practical implication for managing the activities. First, innovation activities that increased the achievement rate of product diversification projects included a combination of market research, new product design, and job training. Second, our results show that a combination of internal R&D, job training and training, and market research increases the project achievement most for the replacement of outdated products. Third, new market creation or extension of market share indicates that launching replacement products and continuously upgrading products are most important.

위성영상기반 튀니지 사막화 모니터링 및 평가에 관한 연구 (A study for Desertification Monitoring and Assessment based on satellite imagery in Tunisia)

  • 김지원;송철호;박은빈;이종열;최솔이;이은정;이우균
    • 한국지리정보학회지
    • /
    • 제21권4호
    • /
    • pp.91-107
    • /
    • 2018
  • 최근 튀니지는 국토 남쪽의 사하라 사막이 북상하는 추세로 사막화 모니터링과 평가가 요구되고 있다. 본 연구에서는 원격탐사 자료를 활용하여 토지피복 변화를 관찰하고, 정규화식생지수, 표토입자크기지수, 알베도를 산출하여 튀니지의 사막화를 모니터링하였다. 또한, 평가 지표 간 우선순위를 파악하여 Decision Tree (DT)를 구성하였고, 각 사막화 평가 지표, 사막화 등급, 토지피복의 변화빈도와 경향을 확인하였다. 이후, 연구에서 활용한 세 평가 지표와 강수량 간의 상관관계 분석을 수행하였다. 빈도와 경향 분석결과, 튀니지에서는 사막화가 전반적으로 심화되고 있으며, 사막화 정도가 심한 지역이 지리적으로 북상하는 것으로 나타났다. 사막화 평가 지표와 강수량의 상관관계 분석을 시행한 결과, 세 지표 모두 강수량과 높은 상관관계를 갖는 것으로 나타나 강수량의 변화가 튀니지 사막화에 영향을 주고 있음을 확인하였다. 본 연구를 통해 위성영상에 기반한 사막화 지표와 이를 조합하여 평가하는 방식인 Decision Tree, 그리고 토지피복 변화 경향을 고려하는 다양한 방법론의 활용성이 제고되었다.

Word2vec을 이용한 오피니언 마이닝 성과분석 연구 (Performance Analysis of Opinion Mining using Word2vec)

  • 어균선;이건창
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.7-8
    • /
    • 2018
  • 본 연구에서는 Word2vec을 머신러닝 분류기를 이용해 효율적인 오피니언 마이닝 방법을 제안한다. 본 연구의 목적을 위해 BOW(Bag-of-Words) 방법과 Word2vec방법을 이용해 속성 셋을 구성했다. 구성된 속성 셋은 Decision tree, Logistic regression, Support vector machine, Random forest를 이용해 오피니언 마이닝을 수행했다. 연구 결과, Word2vec 방법과 RF분류기가 가장 높은 정확도를 나타냈다. 그리고 Word2vec 방법이 BOW방법 보다 각 분류기에서 높은 성능을 나타냈다.

  • PDF

A Detailed Analysis of Classifier Ensembles for Intrusion Detection in Wireless Network

  • Tama, Bayu Adhi;Rhee, Kyung-Hyune
    • Journal of Information Processing Systems
    • /
    • 제13권5호
    • /
    • pp.1203-1212
    • /
    • 2017
  • Intrusion detection systems (IDSs) are crucial in this overwhelming increase of attacks on the computing infrastructure. It intelligently detects malicious and predicts future attack patterns based on the classification analysis using machine learning and data mining techniques. This paper is devoted to thoroughly evaluate classifier ensembles for IDSs in IEEE 802.11 wireless network. Two ensemble techniques, i.e. voting and stacking are employed to combine the three base classifiers, i.e. decision tree (DT), random forest (RF), and support vector machine (SVM). We use area under ROC curve (AUC) value as a performance metric. Finally, we conduct two statistical significance tests to evaluate the performance differences among classifiers.