• 제목/요약/키워드: Deviation Tree

검색결과 62건 처리시간 0.025초

의사결정나무분석을 이용한 청소년 우울의 보호요인 예측모형 (Predictors of Protective Factors for Depression in Adolescent using Decision Making Tree Analysis)

  • 김보영
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.375-385
    • /
    • 2015
  • 본 연구는 의사결정나무 분석을 활용하여 청소년의 우울 보호요인을 예측하여 우울 예방과 조기발견 및 중재 방안을 마련하고자 시도된 서술적 조사연구이다. 연구대상은 G광역시에 소재한 청소년 총 485명이고, 자료 수집은 2013년 9월 23일부터 9월 26일 사이에 이루어졌다. 자료 분석은 SPSS 20.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 4개의 경로, 총 12노드가 구축되었고 가족 결속력, 부모 자녀간 의사소통과 또래와의 의사소통이 청소년 우울 보호요인이었다. 우울의 보호요인 예측 정확도에서 분석용은 특이도 76.0%, 민감도 65.4%이었고, 검정용은 특이도 78.2%, 민감도 63.7%이었으며, 전체 분류 정확도는 분석용 70.1%, 검정용 69.7%이었다. 이에 본 연구 결과가 학교와 지역사회에서 청소년 정신보건을 담당하는 전문가들에게 우울을 예방을 위한 프로그램 개발의 기초자료로 제공되고, 나아가 청소년들이 자신들의 목소리를 되찾고 힘차게 성장하기 위한 보호요인 강화를 위한 우울예방 정책 전략에 활용되기를 기대해 본다.

공간분석·데이터마이닝 융합방법론을 통한 산업안전 취약지 등급화 방안 (Industrial Safety Risk Analysis Using Spatial Analytics and Data Mining)

  • 고경석;양재경
    • 산업경영시스템학회지
    • /
    • 제40권4호
    • /
    • pp.147-153
    • /
    • 2017
  • The mortality rate in industrial accidents in South Korea was 11 per 100,000 workers in 2015. It's five times higher than the OECD average. Economic losses due to industrial accidents continue to grow, reaching 19 trillion won much more than natural disaster losses equivalent to 1.1 trillion won. It requires fundamental changes according to industrial safety management. In this study, We classified the risk of accidents in industrial complex of Ulju-gun using spatial analytics and data mining. We collected 119 data on accident data, factory characteristics data, company information such as sales amount, capital stock, building information, weather information, official land price, etc. Through the pre-processing and data convergence process, the analysis dataset was constructed. Then we conducted geographically weighted regression with spatial factors affecting fire incidents and calculated the risk of fire accidents with analytical model for combining Boosting and CART (Classification and Regression Tree). We drew the main factors that affect the fire accident. The drawn main factors are deterioration of buildings, capital stock, employee number, officially assessed land price and height of building. Finally the predicted accident rates were divided into four class (risk category-alert, hazard, caution, and attention) with Jenks Natural Breaks Classification. It is divided by seeking to minimize each class's average deviation from the class mean, while maximizing each class's deviation from the means of the other groups. As the analysis results were also visualized on maps, the danger zone can be intuitively checked. It is judged to be available in different policy decisions for different types, such as those used by different types of risk ratings.

통계적 특성에 의한 객체 영상 검출방안 (The Object Image Detection Method using statistical properties)

  • 김지홍
    • 한국정보통신학회논문지
    • /
    • 제22권7호
    • /
    • pp.956-962
    • /
    • 2018
  • 본 논문은 영상에 포함된 객체 특징을 추출하기 위한 연구로서, 말레이시아 산림에서 드론으로 항공 촬영된 산림 영상사진을 이용하여 실제로 산림 속에 존재하는 나무를 파악하기 위한 방법을 기술한다. 일반적으로 회색조 영상특징 추출방법으로는 LBP 방식과 GLCM 방식, Gabor 필터 방식 등이 많이 사용되고 있다. 본 연구에서는 드론으로 촬영된 영상이므로 나뭇잎 질감이 매우 유사하기 때문에, 질감 자체보다는 표본으로 채취한 샘플들에 대한 통계적 특성을 이용한 객체 추출 방식을 제안한다. 이를 위하여 먼저 샘플 영상을 생성하고, 생성된 샘플영상과 원 영상간의 상호상관관계를 이용하여 객체를 검출한다. 각 샘플영상들에 대한 평균치 및 표준편차는 객체 샘플을 분간하고, 판단하기 위한 중요한 자료로 사용될 수 있으며, 또한 RGB 모델과 HSV 모델의 각 신호성분들을 분석하여 객체판단에 유용한 샘플 영상에 대한 통계값을 이용함으로서 객체 추출 확률을 높일 수 있다.

항공 라이다데이터를 이용한 산림영역 탐지 (Detection of Forest Areas using Airborne LIDAR Data)

  • 황세란;김성준;이임평
    • Spatial Information Research
    • /
    • 제18권3호
    • /
    • pp.23-32
    • /
    • 2010
  • 산림영역에서 획득된 라이다데이터는 산림영역의 DTM생성, 수고 및 산림생체량 추정과 같은 산림연구에 효과적으로 이용될 수 있다. 이를 위한 핵심적인 전처리 과정으로 본 연구는 라이다데이터로부터 산림영역을 효과적으로 탐지하기 위한 방법을 개발하고자 한다. 먼저 라이다데이터로부터 산림영역으로 판단하기에 효과적인 다반사 특성, 높이값 편차 및 공간적 분포에 기반한 세 가지 인지적 단서를 제시하였다. 각 단서들에 기반하여 산림후보영역을 탐지하고, 오분류를 제거하고 경계를 정제하기 위한 이진형태학적처리를 수행하여 최종산림영역을 결정하였다. 항공영상을 이용하여 생성한 기준데이터로 검증한 결과에 따르면 세 종류 단서에 의한 방법 모두 약 90% 이상의 정확도를 보이는 것으로 평가되었다. 특히 다반사 특성에 기반한 방법이 다른 방법에 비교하여 정확도 및 단순도 측면에서 보다 좋은 방법으로 판단된다. 또한, 각각의 단서에 기반한 개별적인 결과를 조합하면 분류 정확도가 개선되는 것을 확인하였다.

SMOTE와 Light GBM 기반의 불균형 데이터 개선 기법 (Imbalanced Data Improvement Techniques Based on SMOTE and Light GBM)

  • 한영진;조인휘
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권12호
    • /
    • pp.445-452
    • /
    • 2022
  • 디지털 세상에서 불균형 데이터에 대한 클래스 분포는 중요한 부분이며 사이버 보안에 큰 의미를 차지한다. 불균형 데이터의 비정상적인 활동을 찾고 문제를 해결해야 한다. 모든 트랜잭션의 패턴을 추적할 수 있는 시스템이 필요하지만, 일반적으로 패턴이 비정상인 불균형 데이터로 기계학습을 하면 소수 계층에 대한 성능은 무시되고 저하되며 예측 모델은 부정확하게 편향될 수 있다. 본 논문에서는 불균형 데이터 세트를 해결하기 위한 접근 방식으로 Synthetic Minority Oversampling Technique(SMOTE)와 Light GBM 알고리즘을 이용하여 추정치를 결합하여 대상 변수를 예측하고 정확도를 향상시켰다. 실험 결과는 Logistic Regression, Decision Tree, KNN, Random Forest, XGBoost 알고리즘과 비교하였다. 정확도, 재현율에서는 성능이 모두 비슷했으나 정밀도에서는 2개의 알고리즘 Random Forest 80.76%, Light GBM 97.16% 성능이 나왔고, F1-score에서는 Random Forest 84.67%, Light GBM 91.96% 성능이 나왔다. 이 실험 결과로 Light GBM은 성능이 5개의 알고리즘과 비교하여 편차없이 비슷하거나 최대 16% 향상됨을 접근 방식으로 확인할 수 있었다.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.

어린이 놀이터 놀이시설의 안전도에 관한 조사 (An Actual Measurement on Safety of Play Equipments in the Outdoor Playground)

  • 석주영;안옥희;박인전
    • 한국주거학회논문집
    • /
    • 제13권2호
    • /
    • pp.47-53
    • /
    • 2002
  • The purposes of this study actually measure to the dimension and the quality of material play equipment's examine whether they meet safety standards or not, and intend to offer basic data to present proper safety standards concerning the dimension of play equipment in the end. The subjects for this study were 59 outdoor playgrounds, 30 among them located in apartment sites and the remainder did in residential districts. The time of actual measurement was in June 1999, and June 2000. Data were analyzed into frequency, percentage, mean, and standard deviation by using SPSSWIN program. The main results were as follows.: First, more than half of playgrounds were assessed for being traffic hazards due to the adjacent streets. And they were hardly equipped with the toilet and drinking water facilities, but were almost equipped with the shade of a tree and benches. Second, it was caused in inconvenience of children's use and difficulty of play equipments'management, since the quality of play equipments materials was consisted of wood or metal. Third, the standards for swing and slide were established in detail and actual measurement's results were suitable to standards'value as well, whereas the standards for seesaw and climber were not in detail and they did not design or install suitably.

대구경 관로의 배수시간 산정을 위한 수치해석 기법 (A Numerical Method to Calculate Drainage Time in Large Transmission Pipelines Filter)

  • 신병호;최두용;정관수
    • 상하수도학회지
    • /
    • 제31권6호
    • /
    • pp.511-519
    • /
    • 2017
  • Multi-regional water supply system, which installed for supplying multiple water demands, is characterized by large-sized, long-distance, tree-type layout. This system is vulnerable to long-standing service interruption when a pipe breaks is occurred. In this study, a numerical method is proposed to calculate drainage time that directly affects time of service interruption. To begin with, governing equations are formulated to embed the delayed drainage effect by the friction loss, and to resolve complicated connection of pipelines, which are derived from the continuity and energy equations. The nonlinear hydraulic equations are solved by using explicit time integration method and the Newton-Raphson method. The developed model is verified by comparing the result with analytical solution. Furthermore, the model's applicability is validated by the examples of pipelines in serial, in parallel, and complex layout. Finally, the model is utilized to suggest an appropriate actions to reduce the deviation of draining time in the C transmission line of the B multi-regional water supply system.

입력자료 군집화에 따른 앙상블 머신러닝 모형의 수질예측 특성 연구 (The Effect of Input Variables Clustering on the Characteristics of Ensemble Machine Learning Model for Water Quality Prediction)

  • 박정수
    • 한국물환경학회지
    • /
    • 제37권5호
    • /
    • pp.335-343
    • /
    • 2021
  • Water quality prediction is essential for the proper management of water supply systems. Increased suspended sediment concentration (SSC) has various effects on water supply systems such as increased treatment cost and consequently, there have been various efforts to develop a model for predicting SSC. However, SSC is affected by both the natural and anthropogenic environment, making it challenging to predict SSC. Recently, advanced machine learning models have increasingly been used for water quality prediction. This study developed an ensemble machine learning model to predict SSC using the XGBoost (XGB) algorithm. The observed discharge (Q) and SSC in two fields monitoring stations were used to develop the model. The input variables were clustered in two groups with low and high ranges of Q using the k-means clustering algorithm. Then each group of data was separately used to optimize XGB (Model 1). The model performance was compared with that of the XGB model using the entire data (Model 2). The models were evaluated by mean squared error-ob servation standard deviation ratio (RSR) and root mean squared error. The RSR were 0.51 and 0.57 in the two monitoring stations for Model 2, respectively, while the model performance improved to RSR 0.46 and 0.55, respectively, for Model 1.

STO 기반 클러스터 헤더 선출 알고리즘 (STO-based Cluster Header Election Algorithm)

  • 윤정현;이헌국;김승구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.587-590
    • /
    • 2019
  • 본 논문은 센서 네트워크의 주요 문제점인 센서 노드의 이탈과 네트워크 변화에 따른 네트워크 수명 감소를 개선하기 위한 논문이다. 기존 Scalable Topology Organization(STO) 기반 지그비 트리 토폴로지 컨트롤 알고리즘은 전력 소모에 대한 방안을 고려하지 않아 네트워크의 수명이 비교적 짧았다. 이에 따라 매 라운드가 지날때마다 부모 노드를 새로 선출하고 네트워크 토폴로지를 새로 구성하는 클러스터 헤더 선출 기법을 도입하여 네트워크의 전체적인 수명을 연장하였다. 이에 대한 성능은 OMNet++ 시뮬레이터를 통해 동일한 실험 환경에서 기존의 STO 알고리즘과 제안하는 클러스터 헤더 선출 기법을 도입했을 때의 결과를 도출하였고 그 결과 네트워크 수명을 약 40% 증가시킬 수 있었으며 배터리 잔량 부분에서도 약 10%의 성능이 개선된 것을 확인 할 수 있었다.

  • PDF