• 제목/요약/키워드: ensemble learning models

검색결과 195건 처리시간 0.028초

머신러닝 기반 안드로이드 모바일 악성 앱의 최적 특징점 선정 및 모델링 방안 제안 (Modeling and Selecting Optimal Features for Machine Learning Based Detections of Android Malwares)

  • 이계웅;오승택;윤영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.427-432
    • /
    • 2019
  • 모바일 운영체제 중 안드로이드의 점유율이 높아지면서 모바일 악성코드 위협은 대부분 안드로이드에서 발생하고 있다. 그러나 정상앱이나 악성앱이 진화하면서 권한 등의 단일 특징점으로 악성여부를 연구하는 방법은 유효성 문제가 발생하여 다양한 특징점 추출 및 기계학습을 통해 이를 극복하고자 한다. 본 논문에서는 APK 파일에서 구동에 필요한 다섯 종류의 특징점들을 안드로가드라는 정적분석 툴을 사용하여 학습데이터의 특성을 추출한다. 또한 추출된 중요 특징점을 기반으로 모델링을 하는 세 가지 방법을 제시한다. 첫 번째 방법은 보안 전문가에 의해 엄선된 132가지의 특징점 조합을 바탕으로 모델링하는 것이다. 두 번째는 학습 데이터 7,000개의 앱에서 발생 빈도수가 높은 상위 99%인 8,004가지의 특징점들 중 랜덤포레스트 분류기를 이용하여 특성중요도가 가장 높은 300가지를 선정 후 모델링 하는 방법이다. 마지막 방법은 300가지의 특징점을 학습한 다수의 모델을 통합하여 하나의 가중치 투표 모델을 구성하는 방법이다. 추가적으로 오탐률 및 미탐률을 개선하기 위해 권한 정보를 모두 제외하여 특징점을 재구성하고 위와 같은 환경으로 모델링하였다. 최종적으로 가중치 투표 모델인 앙상블 알고리즘 모델을 사용하여 97.8%로 정확도가 개선되었고 오탐률은 1.9%로 성능이 개선된 것이 확인되었다.

충남 부여군 문화재의 산사태 민감성 평가 (Assessing the Landslide Susceptibility of Cultural Heritages of Buyeo-gun, Chungcheongnam-do)

  • 김준우;김호걸
    • 한국환경복원기술학회지
    • /
    • 제25권5호
    • /
    • pp.1-13
    • /
    • 2022
  • The damages caused by landslides are increasing worldwide due to climate change. In Korea, damages from landslides occur frequently, making it necessary to develop the effective response strategies. In particular, there is a lack of countermeasures against landslides in cultural heritage areas. The purpose of this study was to spatially analyze the relationship between Buyeo-gun's cultural heritage and landslide susceptible areas in Buyeo-gun, Chungcheongnam-do, which has a long history. Nine spatial distribution models were used to evaluate the landslide susceptibility, and the ensemble method was applied to reduce the uncertainty of individual model. There were 17 cultural heritages belonging to the landslide susceptible area. As a result of calculating the area ratio of the landslide susceptible area for cultural heritages, the cultural heritages with 100% of the area included in the landslide susceptible area were "Standing statue of Maae in Hongsan Sangcheon-ri" and "Statue of King Seonjo." More than 35% of "Jeungsanseong", "Garimseong", and "Standing stone statue of Maitreya Bodhisattva in Daejosa Temple" belonged to landslide susceptible areas. In order to effectively prevent landslide damage, the application of landslide prevention measures should be prioritized according to the proportion belonging to the landslide susceptible area. Since it is very difficult to restore cultural properties once destroyed, preventive measures are required before landslide damage occurs. The approach and results of this study provide basic data and guidelines for disaster response plans to prevent landslides in Buyeo-gun.

머신러닝을 활용한 선발 투수 교체시기에 관한 연구 (A Study on the Timing of Starting Pitcher Replacement Using Machine Learning)

  • 노성진;노미진;한무명초;엄선현;김양석
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.9-17
    • /
    • 2022
  • 본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.

완전지도 시간적 행동 검출에서 역재생 비디오를 이용한 양방향 정보 학습 방법 (A Bi-directional Information Learning Method Using Reverse Playback Video for Fully Supervised Temporal Action Localization)

  • 권희원;조혜정;조선희;정찬호
    • 전기전자학회논문지
    • /
    • 제28권2호
    • /
    • pp.145-149
    • /
    • 2024
  • 최근 시간적 행동 검출 연구가 활발히 진행되고 있다. 시간적 행동 검출 연구의 한 분야인 오프라인 행동 검출은 온라인 행동 검출과 달리 비디오를 한번에 입력으로 받는다. 이를 통해 오프라인 행동 검출은 양방향 정보를 이용할 수 있으며 또한 이를 학습하기 위해 Bi-directional LSTM을 주로 사용한다. 본 논문에서는 기존 방법과 달리 완전지도 시간적 행동 검출에서 역재생 비디오를 생성하고 이를 통해 양뱡향 정보를 학습하는 방법을 제안한다. 구체적으로 역재생 비디오와 순재생 비디오를 함께 학습 데이터로 구성하는 방법과 각각 모델에 학습시킨 후 두 모델을 앙상블 모델로 구성하는 방법을 제안하였다. 제안하는 방법의 성능 평가를 위해 TALLFormer 모델을 이용하여 THUMOS-14 데이터셋에 대한 실험을 진행하였다. 역재생 및 순재생 비디오를 학습 데이터로 구성한 경우 기존 방법에 비해 5.1% 낮은 성능을, 모델 앙상블을 진행했을 경우 1.9% 우수한 성능을 보였다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

Analyzing behavior of circular concrete-filled steel tube column using improved fuzzy models

  • Zheng, Yuxin;Jin, Hongwei;Jiang, Congying;Moradi, Zohre;Khadimallah, Mohamed Amine;Safa, Maryam
    • Steel and Composite Structures
    • /
    • 제43권5호
    • /
    • pp.625-637
    • /
    • 2022
  • Axial compression capacity (Pu) is a significant yet complex parameter of concrete-filled steel tube (CFST) columns. This study offers a novel ensemble tool, adaptive neuro-fuzzy inference system (ANFIS) supervised by equilibrium optimization (EO), for accurately predicting this parameter. Moreover, grey wolf optimization (GWO) and Harris hawk optimizer (HHO) are considered as comparative supervisors. The used data is taken from earlier literature provided by finite element analysis. ANFIS is trained by several population sizes of the EO, GWO, and HHO to detect the best configurations. At a glance, the results showed the competency of such ensembles for learning and reproducing the Pu behavior. In details, respective mean absolute errors along with correlation values of 4.1809% and 0.99564, 10.5947% and 0.98006, and 4.8947% and 0.99462 obtained for the EO-ANFIS, GWO-ANFIS, and HHO-ANFIS, respectively, indicated that the proposed EO-ANFIS can analyze and predict the behavior of CFST columns with the highest accuracy. Considering both time and accuracy, the EO provides the most efficient optimization of ANFIS and can be a nice substitute for experimental approaches.

클러스터링 기반 앙상블 모델 구성을 이용한 이상치 탐지 (Outlier Detection By Clustering-Based Ensemble Model Construction)

  • 박정희;김태공;김지일;최세목;이경훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권11호
    • /
    • pp.435-442
    • /
    • 2018
  • 이상치 탐지는 정상 데이터 분포를 크게 벗어나는 데이터 샘플을 탐지하는 것을 의미한다. 대부분의 이상치 탐지 방법은 데이터 샘플이 정상 상태를 벗어나는 정도를 나타내는 이상치 지수(outlier score)를 계산하여 주어진 임계값 이상일 때 이상치로 판정한다. 그러나, 데이터마다 이상치 지수의 범위가 다양하고 정상 데이터에 비해 이상치 데이터는 적은 비율로 존재하기 때문에 이상치 지수에 대한 임계값을 결정하기는 매우 어렵다. 또한, 실제 상황에서는 학습에 이용할 수 있는 충분한 양의 이상치를 포함하는 데이터의 획득이 용이하지 않다. 본 논문에서는 정상 데이터가 주어졌을 때 이를 이용하여 정상 데이터 영역을 나타내는 모델을 구성하고 새로운 데이터 샘플에 대해 이상치와 정상치의 이진 분류를 수행하는 방법으로 군집화 기반 이상치 탐지 방법을 제안한다. 그리고, 주어진 정상 데이터를 청크로 나누고 각 청크에 대해 클러스터링 모델을 구성한 후 모델들에 의한 이상치 판정 결과를 결합하는 앙상블 방법과 동적 변화가 있는 스트리밍 데이터에서의 적용 방법으로 확장한다. 실제 데이터와 인공 데이터를 이용한 실험결과는 제안 방법의 높은 성능을 보여준다.

Predicting rock brittleness indices from simple laboratory test results using some machine learning methods

  • Davood Fereidooni;Zohre Karimi
    • Geomechanics and Engineering
    • /
    • 제34권6호
    • /
    • pp.697-726
    • /
    • 2023
  • Brittleness as an important property of rock plays a crucial role both in the failure process of intact rock and rock mass response to excavation in engineering geological and geotechnical projects. Generally, rock brittleness indices are calculated from the mechanical properties of rocks such as uniaxial compressive strength, tensile strength and modulus of elasticity. These properties are generally determined from complicated, expensive and time-consuming tests in laboratory. For this reason, in the present research, an attempt has been made to predict the rock brittleness indices from simple, inexpensive, and quick laboratory test results namely dry unit weight, porosity, slake-durability index, P-wave velocity, Schmidt rebound hardness, and point load strength index using multiple linear regression, exponential regression, support vector machine (SVM) with various kernels, generating fuzzy inference system, and regression tree ensemble (RTE) with boosting framework. So, this could be considered as an innovation for the present research. For this purpose, the number of 39 rock samples including five igneous, twenty-six sedimentary, and eight metamorphic were collected from different regions of Iran. Mineralogical, physical and mechanical properties as well as five well known rock brittleness indices (i.e., B1, B2, B3, B4, and B5) were measured for the selected rock samples before application of the above-mentioned machine learning techniques. The performance of the developed models was evaluated based on several statistical metrics such as mean square error, relative absolute error, root relative absolute error, determination coefficients, variance account for, mean absolute percentage error and standard deviation of the error. The comparison of the obtained results revealed that among the studied methods, SVM is the most suitable one for predicting B1, B2 and B5, while RTE predicts B3 and B4 better than other methods.

1D-CNN을 이용한 항만내 선박 이동시간 예측 (Prediction of Ship Travel Time in Harbour using 1D-Convolutional Neural Network)

  • 유상록;김광일;정초영
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.275-276
    • /
    • 2022
  • 해상교통관제사는 항로폭이 협소한 항만에서 선박 충돌사고 예방을 위해 one-way로 항해하도록 선박의 입·출항 대기 지시를 한다. 현재 해상교통관제사의 입·출항대기 지시는 과학적이고 통계적인 데이터를 기반으로 하지 않고 해상교통관제사의 개인 역량에 따라 편차가 크다. 이에 따라 본 연구에서는 항만에서의 선박 입·출항 대기 지시를 위한 정확한 이동 시간을 예측하기 위해 선박 및 기상 데이터를 수집하여 1d-합성곱신경망 모델을 구축하였다. 제안한 모델이 다른 앙상블 기계학습 모델보다 4.5% 이상 개선된 것을 확인하였다. 본 연구를 통해 다양한 상황에서도 선박 입·출항 소요시간 예측이 가능하여 해상교통관제사는 선박에게 정확한 정보 제공 및 대기지시 판단에 도움이 될 것으로 기대된다.

  • PDF

스마트관광 시대의 관광숙박업 영업 예측 모형: 코로나19 팬더믹을 중심으로 (Predictive Models for the Tourism and Accommodation Industry in the Era of Smart Tourism: Focusing on the COVID-19 Pandemic)

  • 조유진;김차미;손승연;노미진
    • 스마트미디어저널
    • /
    • 제12권8호
    • /
    • pp.18-25
    • /
    • 2023
  • 2020년 발생한 코로나19는 전세계적으로 지속적인 피해를 미쳤으며, 특히 하늘길 봉쇄 및 외출 자제로 인해 스마트 관광산업은 경제적 직격탄을 맞았다. 해외여행과 국내여행이 크게 감소된 상황에서 계속되는 적자로 인해 휴업과 폐업을 하는 관광호텔들이 늘어나고 있는 상황이다. 따라서 본 연구에서는 행정안전부의 인허가 데이터를 수집한 후 시각화하여 관광숙박업의 운영 현황을 파악하였다. 머신러닝 분류 알고리즘을 적용하여 관광호텔의 생존 예측 모델을 구현하였고 앙상블 알고리즘을 활용하여 예측 모델의 성능을 최적화하였으며 5-Fold 교차검증으로 모델의 성능을 평가하였다. 관광호텔의 생존율이 다소 감소할 것으로 예측되었으나 실제 생존율을 코로나19 이전과 큰 차이를 보이지 않는 것으로 분석되었다. 본 논문의 호텔업 영업 상태 예측을 통해 관광숙박업 전체의 운영 가능성 및 발전 동향을 파악할 수 있는 근거로 활용할 수 있다.