• 제목/요약/키워드: Regression tree algorithm

검색결과 118건 처리시간 0.021초

머신러닝 기반 금속외관 결함 검출 비교 분석 (Comparative analysis of Machine-Learning Based Models for Metal Surface Defect Detection)

  • 이세훈;강성환;신요섭;최오규;김시종;강재모
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.834-841
    • /
    • 2022
  • 최근 스마트팩토리와 인공지능 기술의 수요 증가로 인해 다양한 분야에서 인공지능 기술을 적용하는 연구가 진행되고 있다. 결함 검사 분야에서도 인공지능 알고리즘을 도입하기 위한 노력을 기울이고 있다. 특히, 금속 외관의 결함을 검출하는 연구는 다른 소재(목재, 플라스틱, 섬유 등)의 결함을 검출하는 연구에 비해 많은 연구가 이루어지고 있다. 본 논문에서는 머신러닝 기법(서포터 벡터 머신(SVM: Support Vector Machine), 소프트맥스 회귀(Softmax Regression), 결정 트리(Decesion Tree))과 차원 축소 알고리즘(주성분 분석(PCA: Principal Component Analysis), 오토인코더(AutoEncoder))의 9가지 조합과 2가지 합성곱신경망(CNN: Convolutional Neural Network) 기법(자체 알고리즘, ResNet)의 금속 외관의 결함 분류 성능 및 속도를 비교하고 분석하는 연구를 수행하고자 한다. 두 종류의 학습 데이터셋((i) 공용 데이터셋(Public Dataset), (ii) 실측 데이터셋(Actual Dataset))에 대한 실험을 통해 각 데이터셋에 대한 성능 및 속도를 비교 분석하고, 가장 효율적인 알고리즘을 찾아낸다.

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

부동산 하부시장 구획: 헤도닉 모형의 개선을 중심으로 (Submarket Identification in Property Markets: Focusing on a Hedonic Price Model Improvement)

  • 이창로;엄영섭;박기호
    • 대한지리학회지
    • /
    • 제49권3호
    • /
    • pp.405-422
    • /
    • 2014
  • 부동산 가격을 추정하기 위한 헤도닉 모형(hedonic model)의 적용에서 가장 중요한 사안은 모형의 정확한 구성과 하부시장의 구획이라 할 수 있다. 모형의 구성에 대해서는 비교적 활발한 개선 노력이 있었으나 하부시장 구획은 상대적으로 큰 관심을 받지 못하였다. 그러나 부동산 가격형성 과정의 공간적 범위 파악이 선행되지 않으면 헤도닉 모형의 적용 결과는 그 정확성이 저하될 수밖에 없다. 본 연구는 헤도닉 모형의 성능 개선에 초점을 두고, 서울시 25개 자치구 중 상대적으로 이질적인 부동산 집단으로 구성된 강남구와 비교적 균일한 부동산 집단으로 이루어진 중랑구를 사례지역으로 하여 하부시장 구획을 시도하였다. 먼저 하부시장 구획을 위한 투입변수로 혼합 GWR(Mixed GWR) 모형에서 산출된 가변 회귀계수(variable coefficients)를 사용하였다. 헤도닉 모형의 회귀계수는 부동산을 구성하는 속성항목(attributes)의 잠재가격(shadow price)으로 해석할 수 있기 때문이다. 다음으로 공간적으로 연접된 하부시장을 구획하기 위해 최소신장트리(minimum spanning tree)에 기반한 SKATER 앨고리듬을 사례지역에 적용하였다. 마지막으로 다수준 모형(multi-level model)을 적용하여 구획된 하부시장 결과의 적정성을 검토하였다. 검토 결과, 중랑구는 하부시장이 존재하지 않음을, 강남구는 간선도로를 중심으로 한 5개의 하부시장으로 구분하는 것이 합리적임을 확인하였다. 간선도로와 같은 도시의 인프라는 하부시장 구획에 있어 지금까지 큰 주목을 받지 못한 변수였으나 본 연구를 통해 그 중요성이 실증적으로 확인되었다.

  • PDF

GOCI 영상과 기계학습 기법을 이용한 Cochlodinium polykrikoides 적조 탐지 기법 연구 (Study on Detection for Cochlodinium polykrikoides Red Tide using the GOCI image and Machine Learning Technique)

  • 엥흐자리갈 운자야;박수호;황도현;정민지;김나경;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1089-1098
    • /
    • 2020
  • 본 연구에서는 적조 Cochlodinium Polykrikoide를 기계학습 방법과 정지궤도 해색위성 영상을 활용하여 탐지하는 방법을 제안한다. 기계학습 모형을 학습시키기 위해 GOCI Level2 자료를 활용하였으며, 국립수산과학원의 적조 속보 자료를 활용하였다. 기계학습 모델은 로지스틱 회귀모형, 의사결정나무 모형, 랜덤포래스트 모형을 사용하였다. 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상 기반 적조 탐지 알고리즘(Son et al.,2012) (75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다. 또한 기계학습 모형 간 탐지 성능을 비교 분석해본 결과 랜덤 포레스트 모형(98%)이 가장 높은 탐지 정확도를 보였다. 이러한 기계학습 기반 적조 탐지 알고리즘은 향후 적조를 조기에 탐지하고 그 이동과 확산을 추적 모니터링하는데 활용될 수 있을 것이라고 판단된다.

데이터마이닝 기법을 활용한 노인장기요양급여 권고모형 개발 (A Recommending System for Care Plan(Res-CP) in Long-Term Care Insurance System)

  • 한은정;이정석;김동건;강임옥
    • 응용통계연구
    • /
    • 제22권6호
    • /
    • pp.1229-1237
    • /
    • 2009
  • 노인장기요양보험에서 가장 중요한 이슈는 급여대상자의 희망, 건강 및 기능상태에 따라 어떤 급여를 제공할 것인가 이다. 이를 해결하고자 노인장기요양보험의 보험자인 국민건강보험 공단은 급여대상자에게 '표준장기요양이용계획서'를 제공하고 있다. 본 연구에서는 표준장기요양이용계획 작성의 효율화 방안을 마련하고자 노인장기요양보험 3차 시범사업 표준이용계획 자료를 활용하여 노인장기요양급여 권고모형을 개발하였다. 모형개발에는 데이터마이닝의 의사결정나무모형, 로지스틱회귀모형, 앙상블 모형의 배깅과 부스팅 기법을 사용하였고, 이 중 실무자가 이해하기 쉬운 의사결정나무를 채택하여 권고모형을 설명 하였다. 본 연구는 노인장기요양보험 제도의 이용계획 수립의 객관성 및 과학성을 확보하고 이용계획 업무를 효율화하는 데에 기여할 것으로 기대된다.

주식 시장 예측을 위한 π-퍼지 논리와 SVM의 최적 결합 (An Optimized Combination of π-fuzzy Logic and Support Vector Machine for Stock Market Prediction)

  • 다오두안훙;안현철
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.43-58
    • /
    • 2014
  • 최근 정보기술의 발전으로 복잡하고 방대한 양의 주가 데이터에 대한 실시간 분석이 가능해지면서 인공지능 기법을 활용해 주식 시장의 등락을 예측하고, 이를 기반으로 매매 거래를 수행하는 트레이딩 시스템에 대한 세간의 관심이 높아지고 있다. 본 연구는 이러한 트레이딩 시스템의 시장 예측 알고리즘으로 활용될 수 있는 새로운 주식 시장 등락 예측 모형을 제시한다. 본 연구의 제안 모형은 ${\pi}$-퍼지 논리를 이용해 모든 입력변수의 차원을 low, medium, high로 퍼지변환한 입력값을 대상으로 Support Vector Machine(SVM)을 적용하여 익일 시장의 등락을 예측하도록 설계되었다. 그런데 이 경우 입력변수의 수가 3배로 늘어나기 때문에, 적절한 입력변수의 선택이 요구된다. 이에 본 연구에서는 유전자 알고리즘을 활용하여 입력변수 선택 집합을 최적화하도록 하였으며, 동시에 ${\pi}$-퍼지 논리 및 SVM에 적용되는 조절 파라미터들의 값도 함께 최적화 하도록 하였다. 모형의 성능을 검증하기 위해, 본 연구에서는 지난 2004년부터 2013년까지의 10년치 국내 주식시장 데이터를 기반으로 한 KOSPI 200 지수의 등락 예측에 제안모형을 적용해 보았다. 이 때, 비교모형으로 로지스틱 회귀모형, 다중판별분석, 의사결정나무, 인공신경망, SVM, 퍼지SVM 등도 함께 적용시켜 성과를 정밀하게 검증해 보고자 하였다. 그 결과, 제안모형이 예측 정확도는 물론 투자수익률(Return on Investment) 측면에서도 다른 모든 비교모형들에 비해 월등히 우수한 성능을 보임을 확인할 수 있었다.

차대차 교통사고에 대한 상해 심각도 예측 연구 (A Study on Injury Severity Prediction for Car-to-Car Traffic Accidents)

  • 고창완;김현민;정영선;김재희
    • 한국ITS학회 논문지
    • /
    • 제19권4호
    • /
    • pp.13-29
    • /
    • 2020
  • 자동차는 우리의 일상에 필수재가 된 지 오래지만 자동차 교통사고로 인한 사회적 비용이 국가 예산의 9%를 넘을 정도로 심각하여 이에 대한 국가적인 예방 및 대응 체계 구축이 매우 필요한 실정이다. 이에 본 연구에서는 빅데이터 분석 기법을 활용하여 차대차 교통사고의 상해 심각도를 정확히 예측할 수 있는 모형을 제시하고자 하였다. 이를 위해 과거 3년간의 전국교통사고 발생 데이터를 토대로, K-최근접 이웃, 로지스틱 회귀분석, 나이브베이즈, 의사결정나무, 앙상블 알고리즘을 적용하여 각 모델의 상해 심각도 분류의 성능을 비교 분석하였다. 특히 이 과정에서 각 상해 심각도 수준 간의 데이터 수에 차이가 있음에 주목하여 표본수가 많은 그룹에 대해서는 과소표본추출을 시행하는 등의 방법을 통해 분류 예측의 정확도를 높일 수 있었고, 분산 분석을 통해 모델의 유의성을 검증하였다.

선박 탑승자를 위한 다중 센서 기반의 스마트폰을 이용한 활동 인식 시스템 (Activity Recognition of Workers and Passengers onboard Ships Using Multimodal Sensors in a Smartphone)

  • 라지브 쿠마 피야레;이성로
    • 한국통신학회논문지
    • /
    • 제39C권9호
    • /
    • pp.811-819
    • /
    • 2014
  • 상황 인식은 유비쿼터스컴퓨팅 환경에 대한 진화를 변화시켰고 무선 센서네트워크 기술은 많은 응용기기에 대한 새로운 방법을 제시하였다. 특히, 행동 인식은 사람의 응용서비스를 제공하는데 있어 특정 사용자의 상황을 인식하는 핵심 요소로 의학, 취미, 군사 분야에서 폭넓은 응용분야를 갖고 있고 사용반경의 확대에서도 효율과 정확도를 높이는 방법에 크게 기여한다. 스마트폰 센서로부터 나오는 데이터로부터 프레임이 512인셈플 데이터를 얻어, 프레임간50%의 오버랩을 갖도록 하고 Machine Learning Algorithm 인 WEKA Experimenter (University of Waikato, Version 3.6.10)을 써서 데이더로부터 시간영역 특징값을 추출함으로써 행동 인식에 대한 99.33%의 정확도를 얻을 수 있었다. 또한, WEKA Experimenter의 사용기법인 C4.5 Decision Tree과 다른 방법인 BN, NB, SMO or Logistic Regression간의 비교실험을 하였다.

Protecting Accounting Information Systems using Machine Learning Based Intrusion Detection

  • Biswajit Panja
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.111-118
    • /
    • 2024
  • In general network-based intrusion detection system is designed to detect malicious behavior directed at a network or its resources. The key goal of this paper is to look at network data and identify whether it is normal traffic data or anomaly traffic data specifically for accounting information systems. In today's world, there are a variety of principles for detecting various forms of network-based intrusion. In this paper, we are using supervised machine learning techniques. Classification models are used to train and validate data. Using these algorithms we are training the system using a training dataset then we use this trained system to detect intrusion from the testing dataset. In our proposed method, we will detect whether the network data is normal or an anomaly. Using this method we can avoid unauthorized activity on the network and systems under that network. The Decision Tree and K-Nearest Neighbor are applied to the proposed model to classify abnormal to normal behaviors of network traffic data. In addition to that, Logistic Regression Classifier and Support Vector Classification algorithms are used in our model to support proposed concepts. Furthermore, a feature selection method is used to collect valuable information from the dataset to enhance the efficiency of the proposed approach. Random Forest machine learning algorithm is used, which assists the system to identify crucial aspects and focus on them rather than all the features them. The experimental findings revealed that the suggested method for network intrusion detection has a neglected false alarm rate, with the accuracy of the result expected to be between 95% and 100%. As a result of the high precision rate, this concept can be used to detect network data intrusion and prevent vulnerabilities on the network.

데이터마이닝을 활용한 소프트웨어 개발인력의 업무 지속수행의도 결정요인 분석 (A Study of Factors Associated with Software Developers Job Turnover)

  • 전인호;박선웅;박윤주
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.191-204
    • /
    • 2015
  • 국내 소프트웨어(SW) 개발인력의 미충원율은 매우 높으며, 특히 2년 이상의 현장경력이 있는 고급 개발자의 부족문제는 심각하다. 최근 정부도 이를 인식하고, 정책적으로 SW개발 신규인력 양성에 힘을 기울이고 있다. 그러나, 이러한 노력은 초급개발자의 수급문제를 해결하는데 효과적일 수 있지만, 업계에서 요구하는 고급 개발자의 부족현상을 해결하는 근본적인 대책으로 인식되지는 못하고 있다. SW 전문개발자를 양성하기 위해서는 초급개발자들이 지속적으로 직무를 수행하여 풍부한 업무경험을 갖춘 고급 개발자로 성장해야 하기 때문이다. 이에, 본 연구는 국내 SW업체에서 근무하고 있는 개발관련 인력들의 업무 지속수행 의도를 조사하고, 이에 영향을 주는 주요요인들을 분석하였다. 이를 위해, 2014년 9월부터 10월까지 국내 SW업체에 근무하고 있는 현직 개발자 총 130명을 대상으로 설문조사를 수행하였으며, 이를 기반으로 SW개발업무 지속수행의도 및 이에 영향을 주는 요인들을 개발자의 특성, 직무환경, 그리고 SW개발자에 대한 사회적 인식 및 산업전망 등의 측면에서 분석하였다. 분석에는 데이터마이닝 기법들 중에서, 분석과정에서의 설명능력이 있는 회귀분석과 의사결정나무가 사용되었다. 회귀분석 결과, SW개발자가 스스로 인식하는 근무 가능한 연령이 높을수록, 내성적인 성향을 가질수록, 또한 적성에 맞아서 직무를 선택한 경우, 지속적 직무 수행 의도가 높은 것으로 나타났다. 이와 더불어, 선형회귀분석에서는 유의하지 않았으나, 규칙기반의 의사결정나무 분석에서 파악된 추가적 요인으로, 새로운 기술에 대한 학습능력 및 SW산업에 대한 전망이 직무 지속수행의도에 영향을 미치는 것으로 나타났다. 이러한 연구결과는 기업의 인적자원관리 및 고급 SW인력 양성정책에 활용될 수 있을 것으로 생각되며, 궁극적으로 SW개발인력의 직무 지속성을 증진시키는 데 기여할 수 있을 것으로 기대된다.