• 제목/요약/키워드: Bayes Net

검색결과 14건 처리시간 0.027초

기계경비시스템 오경보 이벤트 분석을 위한 데이터마이닝 기법 연구 (A Study of Data Mining Methodology for Effective Analysis of False Alarm Event on Mechanical Security System)

  • 김종민;최경호;이동휘
    • 융합보안논문지
    • /
    • 제12권2호
    • /
    • pp.61-70
    • /
    • 2012
  • 본 연구의 목적은 효율적인 기계경비시스템 오경보 이벤트 분석을 위해 가장 적합한 데이터마이닝 기법을 도출하는데 있다. 이를 위해 기계경비시스템 오경보의 발생원인을 살펴보고, 오경보 시의 출동건수, 오경보율 그리고 오경보원인의 통계자료를 토대로한 데이터를 데이터마이닝 프로그램인 WEKA에 맞게 변환시켜 여러 알고리즘에 적용 및 분석하였다. 본 논문에서는 적합한 데이터마이닝 기법을 찾기 위해 Decision Tree, Naive Bayes, BayesNet Apriori, J48Tree 알고리즘을 활용하였고, 분석을 통해 생성된 가장 높은 값을 도출하여 해당 알고리즘의 적용 가능성을 확인하였다. 이와 같은 연구를 통해 효율적으로 기계경비시스템의 오경보를 예측하고, 오경보에 대한 보다 효율적인 대처방안을 모색할 수 있음을 보여주었다.

Crack segmentation in high-resolution images using cascaded deep convolutional neural networks and Bayesian data fusion

  • Tang, Wen;Wu, Rih-Teng;Jahanshahi, Mohammad R.
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.221-235
    • /
    • 2022
  • Manual inspection of steel box girders on long span bridges is time-consuming and labor-intensive. The quality of inspection relies on the subjective judgements of the inspectors. This study proposes an automated approach to detect and segment cracks in high-resolution images. An end-to-end cascaded framework is proposed to first detect the existence of cracks using a deep convolutional neural network (CNN) and then segment the crack using a modified U-Net encoder-decoder architecture. A Naïve Bayes data fusion scheme is proposed to reduce the false positives and false negatives effectively. To generate the binary crack mask, first, the original images are divided into 448 × 448 overlapping image patches where these image patches are classified as cracks versus non-cracks using a deep CNN. Next, a modified U-Net is trained from scratch using only the crack patches for segmentation. A customized loss function that consists of binary cross entropy loss and the Dice loss is introduced to enhance the segmentation performance. Additionally, a Naïve Bayes fusion strategy is employed to integrate the crack score maps from different overlapping crack patches and to decide whether a pixel is crack or not. Comprehensive experiments have demonstrated that the proposed approach achieves an 81.71% mean intersection over union (mIoU) score across 5 different training/test splits, which is 7.29% higher than the baseline reference implemented with the original U-Net.

실제 네트워크 모니터링 환경에서의 ML 알고리즘을 이용한 트래픽 분류 (Traffic Classification Using Machine Learning Algorithms in Practical Network Monitoring Environments)

  • 정광본;최미정;김명섭;원영준;홍원기
    • 한국통신학회논문지
    • /
    • 제33권8B호
    • /
    • pp.707-718
    • /
    • 2008
  • Traffic classification의 방법은 동적으로 변하는 application의 변화에 대처하기 위하여 페이로드나 port를 기반으로 하는 것에서 ML 알고리즘을 기반으로 하는 것으로 변하여 가고 있다. 그러나 현재의 ML 알고리즘을 이용한 traffic classification 연구는 offline 환경에 맞추어 진행되고 있다. 특히, 현재의 기존 연구들은 testing 방법으로 cross validation을 이용하여 traffic classification을 수행하고 있으며, traffic flow를 기반으로 classification 결과를 제시하고 있다. 본 논문에서는 testing방법으로 cross validation과 split validation을 이용했을 때, traffic classification의 정확도 결과를 비교한다. 또한 바이트를 기반으로 한 classification의 결과와 flow를 기반으로 한 classification의 결과를 비교해 본다. 본 논문에서는 J48, REPTree, RBFNetwork, Multilayer perceptron, BayesNet, NaiveBayes와 같은 ML 알고리즘과 다양한 feature set을 이용하여 트래픽을 분류한다. 그리고 split validation을 이용한 traffic classification에 적합한 최적의 ML 알고리즘과 feature set을 제시한다.

모의 패턴생성 프로세스를 이용한 다단신경망분류기의 성능분석 (Performance Analysis of Mulitilayer Neural Net Claddifiers Using Simulated Pattern-Generating Processes)

  • 박동선
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.456-464
    • /
    • 1997
  • 본 논문에서는 클래스내부와 클래스간의를 확정하게 제어할 수 있는 랜덤 프로세스 모델을 제어하는 프리세스 내부의 파라메다들을 변화시키며, 프로세스간의 통계적인 차이와 랜덤 잡음을 변화시켜 학습을 위한 패턴들을 생성한다. 이 랜덤 프로세스 모델에서 생성된 패턴들을 이용하여 역전파알고리즘으로 학습된 다단 신경망의 성능 성능을 평가한다. 평가 실험결과는 패턴 분류문제에서 일반화된 통계적인 거리가 분류문제의 난이도에 대한 좋은 예측기가 되는 것을 보여 준다. 또한 본 논문에서는 다단신경망의 성능과 베이스패턴분류기의 성능을 비교하기 위하여 베이스분류기의 이론적인 성능분석과 모의실험을 통한 평가를 하였다. 다단신경망의 분류성능이 이론적인 성능과 실헝치와 매우 근사하며 그 두 성능 중간에 위치함을 발견하였다.

  • PDF

베이지안 학습을 이용한 문서의 자동분류 (An Automatic Document Classification with Bayesian Learning)

  • 김진상;신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.19-30
    • /
    • 2000
  • 정보통신기술의 비약적인 발전은 온라인으로 생성되는 전자문서의 양을 폭발적으로 증가시키고 있다. 따라서 수동으로 문서를 분류하던 종래의 방법 대신 문서의 자동분유 기술 개발이 특별히 요구되고 있다. 본 논문에서는 베이지안 학습 기법을 이용하여 문서를 자동으로 분류하는 방법을 연구하고, 20개의 유즈넷 뉴스그룹 문서들을 분류하도록 시험하였다. 사용한 알고리즘은 Naive Bayes Classifier이며, 구현한 시스템을 이용해 유즈넷 문서를 대상으로 자동분류를 실험한 결과 분류의 정확률이 약 77%로 나타났다.

  • PDF

애플리케이션 트래픽 분류를 위한 머신러닝 알고리즘 성능 분석 (Performance Analysis of Machine Learning Algorithms for Application Traffic Classification)

  • 김성윤;김명섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.968-970
    • /
    • 2008
  • 기존에 트래픽 분류 방법으로 payload 분석이나 well-known port를 이용한 방법을 많이 사용했다. 하지만 동적으로 변하는 애플리케이션이 늘어남에 따라 기존 방법으로 애플리케이션 트래픽 분류가 어렵다. 이러한 문제의 대안으로 Machine Learning(ML) 알고리즘을 이용한 애플리케이션 트래픽 분류방법이 연구되고 있다. 기존의 논문에서는 일정 시간동안 수집한 data set을 사용하기 때문에 적게 발생한 애플리케이션은 제대로 분류하지 못하여도 전체적으로는 좋은 성능을 보일 수 있다. 본 논문에서는 이러한 문제를 해결하기 위해 각 애플리케이션마다 동일한 수의 data set을 수집하여 애플리케이션 트래픽을 분류하는 방법을 제시한다. ML 알고리즘 중 J48, REPTree, BayesNet, NaiveBayes, Multilayer Perceptron 알고리즘을 이용하여 애플리케이션 트래픽 분류의 정확도를 비교한다.

IMPLEMENTATION OF DATA ASSIMILATION METHODOLOGY FOR PHYSICAL MODEL UNCERTAINTY EVALUATION USING POST-CHF EXPERIMENTAL DATA

  • Heo, Jaeseok;Lee, Seung-Wook;Kim, Kyung Doo
    • Nuclear Engineering and Technology
    • /
    • 제46권5호
    • /
    • pp.619-632
    • /
    • 2014
  • The Best Estimate Plus Uncertainty (BEPU) method has been widely used to evaluate the uncertainty of a best-estimate thermal hydraulic system code against a figure of merit. This uncertainty is typically evaluated based on the physical model's uncertainties determined by expert judgment. This paper introduces the application of data assimilation methodology to determine the uncertainty bands of the physical models, e.g., the mean value and standard deviation of the parameters, based upon the statistical approach rather than expert judgment. Data assimilation suggests a mathematical methodology for the best estimate bias and the uncertainties of the physical models which optimize the system response following the calibration of model parameters and responses. The mathematical approaches include deterministic and probabilistic methods of data assimilation to solve both linear and nonlinear problems with the a posteriori distribution of parameters derived based on Bayes' theorem. The inverse problem was solved analytically to obtain the mean value and standard deviation of the parameters assuming Gaussian distributions for the parameters and responses, and a sampling method was utilized to illustrate the non-Gaussian a posteriori distributions of parameters. SPACE is used to demonstrate the data assimilation method by determining the bias and the uncertainty bands of the physical models employing Bennett's heated tube test data and Becker's post critical heat flux experimental data. Based on the results of the data assimilation process, the major sources of the modeling uncertainties were identified for further model development.

3축 가속도 센서를 이용한 행동 인식 비교 (A comparison of activity recognition using a triaxial accelerometer sensor)

  • 왕창원;호종갑;나예지;정화영;남윤영;민세동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1361-1364
    • /
    • 2015
  • 본 연구에서는 노인들이 일상에서 많이 행동하는 7가지 유형의 행동의 특징을 추출하고, 총 7가지 분류 알고리즘에 적용하여 가장 인식률이 높은 알고리즘을 도출하고자 하였다. 행동패턴은 정상보행, 절름발이, 지팡이, 느린 보행, 허리가 굽은 상태에서 보행, 스스로 휠체어 끌 때 그리고 누군가가 휠체어를 끌어줄 때 총 7가지로 구성하였다. 행동패턴의 특징은 3축 가속도 센서의 값, 평균, 표준편차, 수직 및 수평축의 데이터를 사용하였다. 분류 알고리즘은 Naive Bayes, Bayes Net, k-NN, SVM, Decision Tree, Multilayer perception, Logistic regression을 사용하였다. 연구결과 k-NN 알고리즘의 인식률이 98.7%로 다른 분류알고리즘에 비해 인식률이 높게 나타났다.

신뢰도이론에서 위험측도를 이용한 할증보험료 결정에 대한 고찰 (A Study on the Determination of the Risk-Loaded Premium using Risk Measures in the Credibility Theory)

  • 김현태;전용호
    • 응용통계연구
    • /
    • 제27권1호
    • /
    • pp.71-87
    • /
    • 2014
  • 손해보험의 신뢰도이론에서 순보험료로 사용되는 베이즈보험료는 꼬리위험을 반영하지 못한다는 한계점이 있다. 본 논문에서는 꼬리위험측도를 이용하여 할증보험료를 결정하는데 있어 중요하다고 여겨지는 두 가지 주제를 다루었다. 첫째, 위험측도로부터 유도되는 안전할증은 내재된 담보의 위험을 보다 정확히 반영할 수 있으며, 동시에 베이즈보험료만을 사용할 경우 초래될 수 있는 잘못된 의사결정을 피할 수 있음을 보였다. 둘째, 동일한 사전분포가 주어지더라도 서로 다른 조건부손실분포의 꼬리위험 순위와 그에 상응하는 예측분포의 꼬리위험순위는 일반적으로 다를 수 있음을 모수적 모형에 기반하여 보였다. 따라서 안전할증은 조건부손실분포의 위험측도가 아니라 예측분포의 위험측도를 사용해야 함을 알 수 있다.

데이터 마이닝 기법을 활용한 근로자의 고용유지 강화 방안 개발 (Enhancing Workers' Job Tenure Using Directions Derived from Data Mining Techniques)

  • 안민욱;김태운;유동희
    • 한국콘텐츠학회논문지
    • /
    • 제18권5호
    • /
    • pp.265-279
    • /
    • 2018
  • 본 연구에서는 데이터 마이닝 기법을 활용하여 근로자의 이직준비 여부에 관한 예측모형을 구축하는 실험을 진행하였다. 이를 위해, 한국고용정보원 주관으로 수집된 "2015년 대졸자 직업 이동경로조사" 데이터를 사용하였다. 이직준비 여부 예측모형에는 의사결정나무, 베이즈넷, 인공신경망 알고리즘이 사용되었다. 전체 직종을 대상으로 한 분석에서는 의사결정나무 기반 예측모형에서 최고 예측률을 기록하였으며, 이직준비 여부에 영향을 주는 요인은 '근로시간 형태', '종사상 지위', '정규직 여부', '주당 정규 근로시간', '주당 정규 근로일', '개인의 발전가능성'으로 나타났다. 의사결정나무 기반 예측모형의 결과를 활용하여 근로자 전반에 관한 12개의 이직준비 여부 규칙을 최종 도출하였고, 도출된 규칙을 바탕으로 근로자의 고용유지 강화에 도움을 주는 방안들을 제안하였다. 또한 직종별 영향 요인을 분석하기 위해 직종을 사무, 문화예술, 건설, 정보기술 분야로 구분하여 실험을 진행하였다. 그 결과 사무 분야는 10개, 문화예술 분야는 9개, 건설 분야는 4개, 그리고 정보기술 분야는 6개의 이직준비 규칙이 도출되었고 이를 토대로 직종별 맞춤화된 고용유지 강화 방안을 제시하였다.