• 제목/요약/키워드: Machine learning algorithm

검색결과 1,514건 처리시간 0.03초

지식 기반 시스템에서 GIS 자료를 활용하기 위한 기계 학습 기법에 관한 연구 - Landsat ETM+ 영상의 토지 피복 분류를 사례로 (A Machine learning Approach for Knowledge Base Construction Incorporating GIS Data for land Cover Classification of Landsat ETM+ Image)

  • 김화환;구자용
    • 대한지리학회지
    • /
    • 제43권5호
    • /
    • pp.761-774
    • /
    • 2008
  • 원격탐사에서 위성 영상의 디지털 처리 기술이 발달하면서 GIS 자료와 지식 기반 전문가 시스템과의 통합에 대한 관심이 증가하고 있다. 본 연구에서는 위성영상을 토지피복 분류하는 과정에서 GIS 자료를 통합하기 위하여 기계 학습 기법과 규칙 기반 분류 기법을 적용하였다. 사례 지역을 대상으로 Landsat ETM+ 영상과 고도, 경사, 향, 수역과의 거리, 도로와의 거리, 인구밀도 등의 GIS 자료를 함께 활용하였다. C5.0 추론 기계 학습 알고리듬을 이용하여 350개의 표본점으로부터 결정 트리와 분류 규칙을 생성하였다. 본 연구에서 도출된 규칙을 이용하여 분류한 결과, 고독 수역과의 거리, 인구밀도 등의 GIS 자료가 규칙 기반 분류에 효과적인 것으로 나타났다. 본 연구에서 제안한 기계 학습과 지식 기반 분류 기법을 이용하면 다양한 GIS 자료들을 통합하여 위성영상을 보다 효과적으로 분류할 수 있다.

차량가속도데이터를 이용한 머신러닝 기반의 궤도품질지수(TQI) 예측 (Prediction of Track Quality Index (TQI) Using Vehicle Acceleration Data based on Machine Learning)

  • 최찬용;김현기;김영철;김상수
    • 한국지반신소재학회논문집
    • /
    • 제19권1호
    • /
    • pp.45-53
    • /
    • 2020
  • 철도분야에서도 계측자료를 바탕으로 머신러닝 기법을 이용하여 예측 분석하는 시도가 점차적으로 증가하고 있는 실정이다. 이 논문에서는 열차의 차상가속도 데이터를 기반으로 궤도의 품질을 결정하는 지표 중에 하나인 궤도품질지수를 머신러닝 기법을 활용하여 예측하였다. 머신러닝 기법으로 활용하고 있는 대표적인 3개의 모델로 궤도품질지수를 예측하여 가장 정확도가 높은 모델은 XGBoost으로 데이터셋에서 85% 이상의 예측정확도를 보였다. 또한 윤축과 대차의 z축의 진동가속도가 고저 궤도품질지수의 기여도가 높은 것으로 나타났으며, 이는 기존 연구결과와도 잘 일치하였다. 이러한 결과를 볼 때 단일 알고리즘인 서포터 벡터머신보다는 앙상블 알고리즘을 적용한 랜덤포레스트와 XGBoost이 정확도가 높은 것으로 판단된다. 따라서 머신러닝 기법에서 적용모델에 따라 정확도가 달라질 수 있기 때문에 차량진동가속도를 이용한 궤도품질지수를 예측하기 위해서는 앙상블 알고리즘을 가지는 모델을 적용하는 것이 적절할 것으로 판단된다.

SVM-기반 제약 조건과 강화학습의 Q-learning을 이용한 변별력이 확실한 특징 패턴 선택 (Variable Selection of Feature Pattern using SVM-based Criterion with Q-Learning in Reinforcement Learning)

  • 김차영
    • 인터넷정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.21-27
    • /
    • 2019
  • RNA 시퀀싱 데이터 (RNA-seq)에서 수집된 많은 양의 데이터에 변별력이 확실한 특징 패턴 선택이 유용하며, 차별성 있는 특징을 정의하는 것이 쉽지 않다. 이러한 이유는 빅데이터 자체의 특징으로써, 많은 양의 데이터에 중복이 포함되어 있기 때문이다. 해당이슈 때문에, 컴퓨터를 사용하여 처리하는 분야에서 특징 선택은 랜덤 포레스트, K-Nearest, 및 서포트-벡터-머신 (SVM)과 같은 다양한 머신러닝 기법을 도입하여 해결하려고 노력한다. 해당 분야에서도 SVM-기반 제약을 사용하는 서포트-벡터-머신-재귀-특징-제거(SVM-RFE) 알고리즘은 많은 연구자들에 의해 꾸준히 연구 되어 왔다. 본 논문의 제안 방법은 RNA 시퀀싱 데이터에서 빅-데이터처리를 위해 SVM-RFE에 강화학습의 Q-learning을 접목하여, 중요도가 추가되는 벡터를 세밀하게 추출함으로써, 변별력이 확실한 특징선택 방법을 제안한다. NCBI-GEO와 같은 빅-데이터에서 공개된 일부의 리보솜 단백질 클러스터 데이터에 본 논문에서 제안된 알고리즘을 적용하고, 해당 알고리즘에 의해 나온 결과와 이전 공개된 SVM의 Welch' T를 적용한 알고리즘의 결과를 비교 평가하였다. 해당결과의 비교가 본 논문에서 제안하는 알고리즘이 좀 더 나은 성능을 보여줌을 알 수 있다.

IoT 디바이스에서 다차원 디지털 신호 처리를 위한 신경망 최적화 (Neural networks optimization for multi-dimensional digital signal processing in IoT devices)

  • 최권택
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1165-1173
    • /
    • 2017
  • 가장 대표적인 기계학습 알고리즘인 딥러닝 방법은 여러 응용 분야에서 활용성이 입증돼 디지털신호처리에 널리 사용되고 있다. 그러나 많은 학습데이터를 사용해 학습하는 과정에서 많은 메모리와 학습시간이 필요하기 때문에 CPU 성능과 메모리 용량이 제한된 IoT 디바이스에 딥러닝 기술을 적용하기는 어렵다. 특히 메모리 용량이 2K~8K 로 극히 적은 아두이노 기반의 디바이스를 사용한다면 알고리즘 구현에 많은 한계가 발생한다. 본 논문에서는 정확성과 효율성이 입증돼 여러 분야에서 활용되고 있는 ELM 알고리즘을 아두이노에서 최적화하는 방법을 제안하고, 실험을 통해 메모리 용량이 2KB인 아두이노 UNO와 메모리 용량이 8KB인 아두이노 MEGA에서 각각 15차원, 42차원의 다중 클래스 학습이 가능함을 보였다. 실험을 입증하기 위해 가우시안 혼합 모델링을 사용해 생성한 데이터셋과 범용적으로 사용하는 UCI 데이터셋을 사용해 제안한 알고리즘의 효율성을 입증하였다.

An Automatic Diagnosis System for Hepatitis Diseases Based on Genetic Wavelet Kernel Extreme Learning Machine

  • Avci, Derya
    • Journal of Electrical Engineering and Technology
    • /
    • 제11권4호
    • /
    • pp.993-1002
    • /
    • 2016
  • Hepatitis is a major public health problem all around the world. This paper proposes an automatic disease diagnosis system for hepatitis based on Genetic Algorithm (GA) Wavelet Kernel (WK) Extreme Learning Machines (ELM). The classifier used in this paper is single layer neural network (SLNN) and it is trained by ELM learning method. The hepatitis disease datasets are obtained from UCI machine learning database. In Wavelet Kernel Extreme Learning Machine (WK-ELM) structure, there are three adjustable parameters of wavelet kernel. These parameters and the numbers of hidden neurons play a major role in the performance of ELM. Therefore, values of these parameters and numbers of hidden neurons should be tuned carefully based on the solved problem. In this study, the optimum values of these parameters and the numbers of hidden neurons of ELM were obtained by using Genetic Algorithm (GA). The performance of proposed GA-WK-ELM method is evaluated using statical methods such as classification accuracy, sensitivity and specivity analysis and ROC curves. The results of the proposed GA-WK-ELM method are compared with the results of the previous hepatitis disease studies using same database as well as different database. When previous studies are investigated, it is clearly seen that the high classification accuracies have been obtained in case of reducing the feature vector to low dimension. However, proposed GA-WK-ELM method gives satisfactory results without reducing the feature vector. The calculated highest classification accuracy of proposed GA-WK-ELM method is found as 96.642 %.

AttentionMesh를 활용한 국가과학기술표준분류체계 소분류 키워드 자동추천에 관한 연구 (A Study on Automatic Recommendation of Keywords for Sub-Classification of National Science and Technology Standard Classification System Using AttentionMesh)

  • 박진호;송민선
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.95-115
    • /
    • 2022
  • 이 연구의 목적은 국가과학기술표준분류체계의 소분류 용어를 기계학습 알고리즘을 적용하여 기술키워드 변환하는 것이 목적이다. 이를 위해 본 연구에서는 주제어 추천에 적합한 학습 알고리즘으로 AttentionMeSH를 활용했다. 원천데이터는 한국과학기술기획평가원이 정제한 2017년부터 2020년까지 4개년 연구현황 파일을 사용하였다. 학습은 과제명, 연구목표, 연구내용, 기대효과와 같이 연구내용을 잘 표현하고 있는 4개 속성을 사용했다. 그 결과 임계치(threshold)가 0.5일 때 MiF 0.6377이라는 결과가 도출됨을 확인하였다. 향후 실제 업무에 기계학습을 활용하고, 기술키워드 확보를 위해서는 용어관리체계 구축과 다양한 속성들의 데이터 확보가 필요할 것으로 보인다.

시계열 위성영상과 머신러닝 기법을 이용한 산림 바이오매스 및 배출기준선 추정 (Machine-learning Approaches with Multi-temporal Remotely Sensed Data for Estimation of Forest Biomass and Forest Reference Emission Levels)

  • 이용규;이정수
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.603-612
    • /
    • 2022
  • 본 연구는 다중시기 위성영상과 머신러닝 알고리즘을 이용하여 준국가수준의 시계열 산림바이오매스량을 추정하였으며, 이를 바탕으로 산림배출기준선 설정하여 비교·분석하였다. 머신러닝기반의 산림바이오매스 추정 모델을 구축하기 위하여 Landsat TM 위성영상과 유럽항공우주국에서 제공하는 Biomass Climate Change Initiative 정보를 이용하였으며, 머신러닝 알고리즘은 비모수 학습모델인 k-Nearest Neighbor(kNN)과 의사결정나무 기반의 Random Forest(RF)를 적용하였다. 또한, 추정된 산림바이오매스량은 Forest reference emission levels(FREL) 자료와 비교하였다. 머신러닝 알고리즘 별 산림바이오매스 추정 모델을 비교해보면, 최적의 kNN 모델과 RF 모델의 Root Mean Square Error (RMSE)는 각각 35.9와 34.41였으며, RF모델이 kNN모델보다 상대적으로 우수하였다. 또한, FREL, kNN, RF 모델 별 산림배출기준선의 기울기는 각각 약 -33천ton, -253천ton, -92천ton으로 설정되었다.

Human Face Recognition using Multi-Class Projection Extreme Learning Machine

  • Xu, Xuebin;Wang, Zhixiao;Zhang, Xinman;Yan, Wenyao;Deng, Wanyu;Lu, Longbin
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제2권6호
    • /
    • pp.323-331
    • /
    • 2013
  • An extreme learning machine (ELM) is an efficient learning algorithm that is based on the generalized single, hidden-layer feed-forward networks (SLFNs), which perform well in classification applications. Many studies have demonstrated its superiority over the existing classical algorithms: support vector machine (SVM) and BP neural network. This paper presents a novel face recognition approach based on a multi-class project extreme learning machine (MPELM) classifier and 2D Gabor transform. First, all face image features were extracted using 2D Gabor filters, and the MPELM classifier was used to determine the final face classification. Two well-known face databases (CMU-PIE and ORL) were used to evaluate the performance. The experimental results showed that the MPELM-based method outperformed the ELM-based method as well as other methods.

  • PDF

Performance Comparison of Machine Learning Algorithms for Received Signal Strength-Based Indoor LOS/NLOS Classification of LTE Signals

  • Lee, Halim;Seo, Jiwon
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제11권4호
    • /
    • pp.361-368
    • /
    • 2022
  • An indoor navigation system that utilizes long-term evolution (LTE) signals has the benefit of no additional infrastructure installation expenses and low base station database management costs. Among the LTE signal measurements, received signal strength (RSS) is particularly appealing because it can be easily obtained with mobile devices. Propagation channel models can be used to estimate the position of mobile devices with RSS. However, conventional channel models have a shortcoming in that they do not discriminate between line-of-sight (LOS) and non-line-of-sight (NLOS) conditions of the received signal. Accordingly, a previous study has suggested separated LOS and NLOS channel models. However, a method for determining LOS and NLOS conditions was not devised. In this study, a machine learning-based LOS/NLOS classification method using RSS measurements is developed. We suggest several machine-learning features and evaluate various machine-learning algorithms. As an indoor experimental result, up to 87.5% classification accuracy was achieved with an ensemble algorithm. Furthermore, the range estimation accuracy with an average error of 13.54 m was demonstrated, which is a 25.3% improvement over the conventional channel model.

Application of the machine learning technique for the development of a condensation heat transfer model for a passive containment cooling system

  • Lee, Dong Hyun;Yoo, Jee Min;Kim, Hui Yung;Hong, Dong Jin;Yun, Byong Jo;Jeong, Jae Jun
    • Nuclear Engineering and Technology
    • /
    • 제54권6호
    • /
    • pp.2297-2310
    • /
    • 2022
  • A condensation heat transfer model is essential to accurately predict the performance of the passive containment cooling system (PCCS) during an accident in an advanced light water reactor. However, most of existing models tend to predict condensation heat transfer very well for a specific range of thermal-hydraulic conditions. In this study, a new correlation for condensation heat transfer coefficient (HTC) is presented using machine learning technique. To secure sufficient training data, a large number of pseudo data were produced by using ten existing condensation models. Then, a neural network model was developed, consisting of a fully connected layer and a convolutional neural network (CNN) algorithm, DenseNet. Based on the hold-out cross-validation, the neural network was trained and validated against the pseudo data. Thereafter, it was evaluated using the experimental data, which were not used for training. The machine learning model predicted better results than the existing models. It was also confirmed through a parametric study that the machine learning model presents continuous and physical HTCs for various thermal-hydraulic conditions. By reflecting the effects of individual variables obtained from the parametric analysis, a new correlation was proposed. It yielded better results for almost all experimental conditions than the ten existing models.