• 제목/요약/키워드: 의사결정트리 학습

검색결과 71건 처리시간 0.031초

주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구 (Data Mining Tool for Stock Investors' Decision Support)

  • 김성동
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.472-482
    • /
    • 2012
  • 주식시장에는 많은 투자자들이 참여하고 있으며 점점 더 많은 사람이 주식투자에 관심을 가지고 있다. 주식시장에서 위험을 회피하고 수익을 얻기 위해서는 다양한 정보를 바탕으로 정확한 의사결정을 해야한다. 즉 수익을 얻을 수 있는 종목 선택, 적절한 매수-매도 가격의 결정, 그리고 적절한 보유기간 등을 결정해야 한다. 본 논문에서는 개인 주식 투자자의 의사결정 지원을 위한 데이터마이닝 도구를 제안한다. 즉, 개인 투자자가 직접 기계학습 방법을 적용하여 주가예측 모델을 생성할 수 있게 하고, 적절한 매수-매도 가격과 보유기간 등을 결정하는 것을 도와주는 도구를 제안한다. 제안하는 도구는 과거 데이터를 이용하여 투자자 자신의 성향에 맞는 투자에서의 의사결정을 할 수 있도록 지원하는 도구로서 주가데이터 관리, 기계학습 적용을 통한 주가예측 모델 생성, 투자 시뮬레이션 등의 기능을 제공한다. 사용자는 스스로 주가에 영향을 미칠 수 있다고 판단하는 기술적 지표를 선정하고 이를 이용하여 주가예측 모델을 만들고 테스트 할 수 있으며, 적절한 예측모델을 적용하여 시뮬레이션을 수행해 봄으로써 실제로 어느 정도 수익을 얻을 수 있는지 평가하고 적절한 매매 정책을 수립할 수 있다. 제안하는 도구를 이용하여 주식 투자자는 기존의 감정적 판단에 의한 투자가 아닌 객관적 데이터에 의해 검증을 거친 주가예측 모델과 매매정책에 따라 주식투자를 할 수 있어 이전 보다 나은 수익을 기대할 수 있다.

비즈니스 서비스간의 오류 정제를 위한 데이터 제약조건 자동 설정 기법 (An Automatic Setting Method of Data Constraints for Cleansing Data Errors between Business Services)

  • 이정원
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.161-171
    • /
    • 2009
  • 본 논문에서는 SOA(Service-Oriented Architecture)를 기반으로 서비스간에 상호 작용하는 데이터의 품질 관리를 위한 오류 정제 서비스를 대상으로 데이터 제약조건 설정 시 인간 개입을 최소화하기 위한 기법을 제안한다. 단, 실세계에서 통용되는 일반적인 데이터를 모두 다루는 것은 불가능하므로 비즈니스 도메인에서 자주 사용되는 CRM(Customer Relationship Management)과 ERP(Enterprise Resource Planning) 서비스와 같이 고객 주문 정보 및 처리에 관련된 데이터를 대상으로 한다. 이를 위해, 컴포지션 되는 서비스간의 상호 작용하는 데이터를 의미적으로 확장하여 확장-엘리먼트 벡터를 생성하고 이를 기반으로 의사결정 트리(decision tree) 학습 방법을 적용하여 제약조건 설정을 자동화하기 위한 규칙 기반 시스템을 구축한다. 이 시스템을 오류정제 서비스에 삽입한 결과, 비즈니스 분야의 공개된 서비스로부터 데이터 학습을 통해 제약조건 설정을 41% 넘게 자동화 할 수 있음을 보였다.

다매체를 사용한 상황인지 및 제어 시스템 개발 (Development of situational awareness and control system using multiple sources)

  • 유태근;홍윤아;김명준;황보민우;강윤희;강명주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1085-1087
    • /
    • 2021
  • 이 논문에서는 다매체를 사용하여 데이터를 수집한 후 기계학습을 통해 분석하고 주어진 상황에 대응하기 위한 시스템의 개발을 기술한다. 개발 시스템은 센서데이터 수집부, 상황인지 및 상황대응부로 이루어지며, 아두이노와 라즈베리파이를 사용하여 구성한다. 구성된 시스템은 영상 카메라 및 온습도을 포함한 다수의 센서를 사용하여 환경정보를 수집한 후 수집자료를 전처리하고 주어진 상황을 인지하여 상황에 가장 적절하다고 판단되는 대응을 안내하도록 기능을 구성하였다. 상황인지를 위해서는 기계학습 알고리즘으로 의사결정트리를 사용하였으며 100%의 상황인지 정확률을 갖는다.

악성코드 탐지를 위한 기계학습 알고리즘의 성능 비교 (Performance Comparison of Machine Learning Algorithms for Malware Detection)

  • 이현종;허재혁;황두성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제57차 동계학술대회논문집 26권1호
    • /
    • pp.143-146
    • /
    • 2018
  • 서명기반 악성코드 탐지는 악성 파일의 고유 해싱 값을 사용하거나 패턴화된 공격 규칙을 이용하므로, 변형된 악성코드 탐지에 취약한 단점이 있다. 기계 학습을 적용한 악성코드 탐지는 이러한 취약점을 극복할 수 있는 방안으로 인식되고 있다. 본 논문은 정적 분석으로 n-gram과 API 특징점을 추출해 특징 벡터로 구성하여 XGBoost, k-최근접 이웃 알고리즘, 지지 벡터 기기, 신경망 알고리즘, 심층 학습 알고리즘의 일반화 성능을 비교한다. 실험 결과로 XGBoost가 일반화 성능이 99%로 가장 우수했으며 k-최근접 이웃 알고리즘이 학습 시간이 가장 적게 소요됐다. 일반화 성능과 시간 복잡도 측면에서 XGBoost가 비교 대상 알고리즘에 비해 우수한 성능을 보였다.

  • PDF

정보 엔트로피에 의한 RC 교량 상판의 상태속성 및 등급 영향 구조 분석 (The State Attribute and Grade Influence Structure for the RC Bridge Deck Slabs by Information Entropy)

  • 황진하;박종회;안승수
    • 한국전산구조공학회논문집
    • /
    • 제23권1호
    • /
    • pp.61-71
    • /
    • 2010
  • 기 수행된 1, 2종 교량에 관한 정밀안전진단 등의 많은 사례를 분석해 보면, 실제로 많은 경우 외관상태가 교량의 대표등급 결정에 지배적인 요인이 되는 것을 볼 수 있다. 본 연구는 기 시행된 점검 및 진단 자료를 학습사례집합으로 인공지능 분야의 귀납적 학습법을 활용하여 철근 콘크리트 교량 바닥판의 상태평가를 지배하는 상태속성들의 교량등급에 대한 계층적 영향도와 구조적 연관성을 분석하였다. 이는 세부적으로 목표속성은 평가등급으로, 평가속성은 1방향균열, 2방향균열, 백태, 박락 및 층분리, 재료분리 등 7가지로 구성하고, 엔트로피 분석을 통해 주요 속성의 정보량, 정보기대값 및 정보 이득을 산정하고 범주별 상태 등급 분포를 분석하였다. 이를 위해 본 논문은 먼저 6개 교량에 대한 안전진단보고서를 토대로 상태등급 평가 과정에서 각 속성이 미치는 간접적 영향을 개관하고 정보공학적 분석의 동기를 부여하였다. 아울러 본 연구는 정보 변별력에 대한 순서로 평가를 지배하는 주 속성 및 조건별 하위 속성 연관성을 의사결정트리 형태로 나타내어 계층적 영향 및 속성간의 구조적 연관성을 보임으로써 손상에 대한 이해도를 높이고 차후 상태평가를 위한 합리적 접근을 지원할 수 있도록 하였다.

링크구조분석을 이용한 스팸메일 분류 (A Spam Mail Classification Using Link Structure Analysis)

  • 이신영;길아라;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.30-39
    • /
    • 2007
  • 기존의 내용기반 스팸메일 분류는 전자메일이 이미지를 많이 가지고 있고 텍스트는 적게 가지고 있을 경우에는 내용을 분석하기 어려우므로 스팸메일을 분류하는 데 한계가 있다. 이와 같은 문제를 해결하기 위하여 본 논문에서는 전자메일의 구조를 분석하는 링크구조분석 스팸메일 분류 알고리즘을 제안한다. 이것은 전자메일 안의 하이퍼링크의 개수와 하이퍼링크가 가리키는 웹 문서들이 다른 웹 문서에 의해 링크된 수를 측정하여 전자메일의 중요도를 계산한 후 의사결정트리를 학습하여 스팸메일과 정상메일을 분류한다. 또한 위의 링크구조분석 알고리즘과 하이퍼링크의 서버 주소만을 이용한 변형된 링크구조 분석 알고리즘, 그리고 SVM(support vector machine)을 이용한 내용기반 방법을 다수결 원칙으로 결합한 통합 스팸메일 분류 시스템을 제안한다. 실험 결과, 제안한 링크구조분석 알고리즘은 기존의 내용기반 방법 보다 스팸메일 분류 정확도가 94.8%로 약간 향상되었으며 또한 통합 스팸메일 분류 시스템도 내용기반 방법과 비교하여 향상된 97.7%를 나타냈다.

의사결정트리 기법을 이용한 파프리카용 스마트팜 전문가 시스템 (Smart Farm Expert System for Paprika using Decision Tree Technique)

  • 정혜선;이인용;임중선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.373-376
    • /
    • 2018
  • 기존의 파프리카 스마트팜 시스템의 경우 여러 센서 값을 기준 값에 추종하도록 설정 되어 있기 때문에 다른 외란의 값이 들어오면 시스템이 최적의 판단을 하지 못하는 경우가 많아 파프리카 생장에 유해한 경우가 발생한다. 이를 의사결정 나무 기법을 활용하여 파프리카 스마트팜용 전문가 시스템을 설계하여 주변 환경에 따라 달라지는 요소들에 의해 생성되는 데이터를 사용하여 농민의 경험치와 유사한 의사결정 구조를 가진 제어 알고리즘을 구축한다. 현재의 스마트팜 제어시스템의 경우 농민이 설정해둔 기준 값에 센서 값들을 추종하도록 시스템화 되어 있기 때문에 주변 환경의 외란에 대한 사용자의 개입이 필수적이다. 파프리카 스마트팜 장비를 제어하기 전 여러 환경 요소 중 가장 영향력을 미치는 것을 선정한 후 농민들의 경험치와 표준 의사결정 기준이 반영된 복합 환경제어를 위한 전문가 시스템을 모델링하였다. 설계된 모델은 내외부 환경 데이터에 의해 학습된 의사결정트리 기반의 파프리카용 전문가시스템으로 서, 사용자의 간섭을 최소화한 제어기를 설계할 수 있도록 지원한다. 이번 연구를 통해 여러 데이터를 복합 시키면서 각 환경 요소들이 상호관계를 갖고 있으며, 나아가 여러 주변 환경 요소들이 생장에 영향을 미치고 있기에 전문가용 파프리카 스마트팜을 만들 때 표준이 될 수 있는 제어 알고리즘이 될 것으로 기대한다.

  • PDF

이수식 TBM 데이터와 랜덤포레스트를 이용한 일축압축강도 분류 예측에 관한 연구 (A Study on the Prediction of Uniaxial Compressive Strength Classification Using Slurry TBM Data and Random Forest)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.547-560
    • /
    • 2023
  • 최근 국내외에서 기계학습 기법으로 TBM 굴진 데이터와 지반데이터를 분석하는 지반 분류예측 연구가 증가하고 있다. 본 연구에서는 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 의사결정트리 기반 랜덤포레스트 모델을 3곳의 이수식 TBM 현장에서 획득한 기계 데이터와 지반 데이터에 적용하여 일축압축강도에 대한 다중 분류예측 연구를 하였다. 일축압축강도의 다중 분류 예측을 위해서 학습과 테스트 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 의사 결정 트리를 기반으로 한 랜덤 포레스트를 사용하여 일축압축강도 분류 학습을 수행한 결과, 다중 분류 예측 모델의 정확도는 학습 세트와 테스트 세트에서 각각 0.983 및 0.982로 모두 높게 나타났다. 다만, 클래스 간 데이터 분포의 불균형으로 인하여 클래스 4에서는 재현율이 낮게 평가되었다. 다양한 현장에서 획득한 일축압축강도의 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

설명가능한 의사결정을 위한 마이닝 기술 (Research on Mining Technology for Explainable Decision Making)

  • 정경용
    • 융합신호처리학회논문지
    • /
    • 제24권4호
    • /
    • pp.186-191
    • /
    • 2023
  • 데이터 처리 기술은 의사결정을 위해 중요한 역할을 하며, 데이터 결측값 및 이상값 처리, 예측, 추천 모델 등이 포함 된다. 이는 모든 과정과 결과의 타당성, 신뢰성, 정확성에 대한 명확한 설명이 필요하다. 또한 의사결정트리, 추론 등을 이용한 설명가능한 모델을 통해 데이터의 문제를 해결하고, 다양한 유형의 학습을 고려하여 모델 경량화를 진행할 필요가 있다. 육하원칙을 적용한 다중 계층 마이닝 분류 방법은 데이터 전처리 후 트랜잭션에서 빈번하게 발생하는 변수와 속성 간의 다차원 관계를 발견하는 방법이다. 이는 트랜잭션에서 마이닝을 이용하여 유의미한 관계를 발견하고, 회귀분석을 통해 데이터를 모델링 하는 방법을 설명한다. 이에따라 확장 가능한 모델과 로지스틱 회귀모델을 개발하고, 데이터 정제, 관련성 분석, 데이터 변환, 데이터 증강을 통해 클래스 레이블을 생성하여 설명가능한 의사결정을 위한 미이닝 기술을 제안한다.

소프트 컴퓨팅 기법을 이용한 개인화된 손동작 인식 시스템 (A Personalized Hand Gesture Recognition System using Soft Computing Techniques)

  • 전문진;도준형;이상완;박광현;변증남
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.53-59
    • /
    • 2008
  • 최근 하지가 불편한 노약자나 장애인이 집안의 다양한 가전기기를 손쉽게 제어하기 위한 비전 기반의 손동작 인식 기술이 발전해 왔다. 다수의 사용자가 하나의 손동작 인식 시스템을 사용할 경우 사용자마다 손동작 특성이 모두 다르기 때문에 특정 사용자의 인식률이 저하되는 문제가 발생한다. 또한 동일한 사용자라 하더라도 시간에 따라 손동작 특성이 변화할 수 있다. 사용자마다 다른 손동작 특성은 모델 학습 및 선택 기법을 사용해 효과적으로 다루어질 수 있다. 시간에 따라 변하는 사용자의 특성은 퍼지 개념을 이용해 효과적으로 다루어질 수 있다. 본 논문에서는 다변량 퍼지 의사 결정트리를 이용해 사용자 별 인식모델을 만드는 방법을 제시한다. 또한 새로운 사용자가 시스템을 사용할 경우 가장 적합한 모델을 선택해 인식에 사용하고 인식률을 측정한다.