• 제목/요약/키워드: SVM 모델

검색결과 391건 처리시간 0.022초

기계학습 기반의 IABP 부이 자료와 AMSR2 위성영상을 이용한 여름철 북극 대기 온도 추정 (The Estimation of Arctic Air Temperature in Summer Based on Machine Learning Approaches Using IABP Buoy and AMSR2 Satellite Data)

  • 한대현;김영준;임정호;이상균;이연수;김현철
    • 대한원격탐사학회지
    • /
    • 제34권6_2호
    • /
    • pp.1261-1272
    • /
    • 2018
  • 북극 지역의 대기 온도는 바다 및 해빙, 대기 사이의 에너지 교환에 큰 역할을 하므로 북극 대기 온도를 정확하게 파악하는 것은 중요하다. 하지만 현장 관측 자료들은 북극 대기 온도의 공간적인 분포를 나타내는 데에 한계가 있다. 따라서 본 연구에서는 부이(buoy) 자료와 Advanced Microwave Scanning Radiometer 2(AMSR2) 위성자료를 이용하여 기계학습 기반 여름철 대기 온도 추정 모델을 구축하였다. 기계학습으로는 random forest(RF) 및 support vector machine(SVM)을 사용하였으며, AMSR2 관측 시간에 따라 하루 두 번의 대기 온도를 추정하였다. 또한 추정된 대기 온도를 유럽 중기예보센터(European Centre for Medium-Range Weather Forecasts, ECMWF)의 ERA-Interim 재분석자료의 대기 온도와 공간 분포를 비교하였다. 교차 검증 결과 두 가지 기계학습 기법 모두 0.84-0.88의 $R^2$$1.31-1.53^{\circ}C$의 RMSE를 보였다. 공간적인 분포에서 IABP 부이 관측 자료가 존재하지 않는 바렌츠해(Barents Sea), 카라해(Kara Sea) 및 배핀만(Baffin bay) 지역에서는 기계학습 모델이 ERA-Interim 대기 온도에 비하여 과소 추정하는 경향을 보였다. 본 연구는 경험적인 북극 대기 온도 추정의 가능성과 한계점을 서술하였다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

발전플랜트 성능데이터 학습에 의한 발전기 출력 추정 모델 (A Predictive Model of the Generator Output Based on the Learning of Performance Data in Power Plant)

  • 양학진;김성근
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8753-8759
    • /
    • 2015
  • 터빈 발전 사이클에서의 안정적인 발전 출력 유지관리를 위해서는 검증된 성능 측정 데이터 그룹과 이를 바탕으로 한 발전 출력 성능 계산 절차의 수립이 필요하다. ASME PTC(Performance Test Code)의 성능 계산 절차를 기반으로 본 연구에서는 터빈 출력에 의한 발전기 출력 성능 산정을 위해서 터빈 팽창선 모델과 발전기 출력 측정 데이터의 입력 검증 모델을 구성하였다. 또한 불확실한 측정 데이터에 대한 검증 모델도 구성하였다. 지난 연구에서는 신경회로망과 커널 회귀의 학습 방법을 사용하였으나 본 연구에서는 미측정 데이터에 대한 보완을 하기 위하여 서포트 벡터 머신 모델을 사용하여 발전기 출력 계산 데이터의 학습 모델을 구성하였으며, 학습 모델 구성을 위해서 관련 변수의 선정을 위한 절차와 학습 데이터 구간을 설정하는 알고리듬을 개발하였다. 학습의 결과 오차는 약 1% 범위 안에 있게 되어 추정 및 학습 모델로서 유용함을 입증하였다. 이 학습 모델을 사용하여 측정 데이터 중 상실된 부분에 대한 추정 모델을 구성함으로써, 터빈 사이클 보정 성능 계산의 신뢰성을 향상시킬 수 있음을 검증하였다.

양파 마늘의 잎 엽록소 함량 추정을 위한 SVM 회귀 활용 RGB 영상 적용성 평가 (Evaluation of Applicability of RGB Image Using Support Vector Machine Regression for Estimation of Leaf Chlorophyll Content of Onion and Garlic)

  • 이동호;정찬희;고승환;박종화
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1669-1683
    • /
    • 2021
  • AI지능화 농업과 디지털 농업은 농업분야 과학화를 위해서 중요하다. 잎 엽록소 함량은 작물의 생육상태를 파악하는데 매우 중요한 지표 중 하나이다. 본 연구는 양파와 마늘을 대상으로 드론 기반 RGB 카메라와 다중분광(MSP)센서를 활용하여 SVM 회귀 모델을 제작하고, MSP 센서와 비교를 실시하여 RGB 카메라의 LCC 추정 적용성을 검토하고자 하였다. 연구 결과 RGB 기반 LCC 모형은 MSP 기반 LCC 모형보다 평균 R2에서 0.09, RMSE 18.66, nRMSE 3.46%로 더 낮은 결과를 보였다. 그러나 두 센서 정확도 차이는 크지 않았으며, 다양한 센서와 알고리즘을 활용한 선행연구들과 비교했을 때도 정확도는 크게 떨어지지 않았다. 또한 RGB 기반 LCC 모형은 실제 측정값과 비교하였을 때 현장 LCC 경향을 잘 반영하지만 높은 엽록소 농도에서 과소 추정되는 경향을 보였다. 본 연구로 도출된 결과는 RGB 카메라의 경제성, 범용성을 고려하였을 때 LCC 추정에 적용할 경우 가능성을 확인할 수 있었다. 본 연구에서 얻어진 결과는 인공지능 및 빅데이터 융합 기술을 적용한 AI지능화농업 기술로써 디지털 농업 등에 유용하게 활용될 수 있을 것으로 기대된다.

Neural Network Combination (NNC) 기법을 이용한 부분방전 패턴인식의 신뢰성 향상에 관한 연구 (A Study on the Reliability Improvement of Partial Discharge Pattern Recognition using Neural Network Combination (NNC) Method)

  • 김성일;정승용;구자윤;임윤석;구선근
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 추계학술대회 논문집 전기물성,응용부문
    • /
    • pp.9-11
    • /
    • 2005
  • 본 연구는 GIS 진단신뢰성 향상기술 개발을 목적으로, 16개의 인위적 결함을 이용하여 부분방전 신호를 발생시키고 검출하여 그 패턴인식 확률을 높이기 위하여 신경망에 Genetic Algorithm (GA) 을 적용하였다. 이를 위하여 다음과 같은 5가지 서로 다른 신경망 모델을 선택하였다: Back Propagation (BP), Jordan-Elman Network (JEN), Principal Component Analysis (PCA), Self-Organizing Feature Map (SOFM) 및 Support Vector Machine (SVM). 이와 같이 선택된 모델에 동일한 데이터를 학습 시키고 패턴인식 확률을 비교 및 분석하였다. 실험 결과에 의하면, BP의 인식률이 가장 높고 다음으로 JEN의 인식률이 높이 나타났으며, 후자의 경우 모든 결함에 대하여 정확한 패턴분류를 한 반면에 전자의 경우 1.8% 의 분류 오차가 발생하였다. 따라서 인식률이 높은 신경망이 더 정확한 패턴분류를 보장하지 못한다는 실험적 결과를 고려 할 때, 인식률이 높은 두 개의 모델을 선정하여 각각의 출력에 일정한 가중치를 주고 합산하여 새로운 출력을 얻는 방법을 제안한다.

  • PDF

토픽 모델을 이용한 모바일 앱 설명 노이즈 제거 (Noise Elimination in Mobile App Descriptions Based on Topic Model)

  • 윤희근;김솔;박성배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.64-69
    • /
    • 2013
  • 스마트폰의 대중화로 인하여 앱 마켓 시장이 급속도로 성장하였다. 이로 인하여 하루에도 수십개의 새로운 앱들이 출시되고 있다. 이러한 앱 마켓 시장의 급격한 성장으로 인해 사용자들은 자신이 흥미를 가질만한 앱들을 선택하는데 큰 어려움을 겪고 있어 앱 추천 방법에 대한 연구에 많은 관심이 집중되고 있다. 기존 연구에서 협력 필터링 기반의 추천 방법들을 제안하였으나 이는 콜드 스타트 문제를 지니고 있다. 이와는 달리 컨텐츠 기반 필터링 방식은 콜드 스타트 문제를 효율적으로 해소할 수 있는 방법이지만 앱설명에는 광고, 공지사항등 실질적으로 앱의 특징과는 무관한 노이즈들이 다수 존재하고 이들은 앱 사이의 유사관계를 파악하는데 방해가 된다. 본 논문에서는 이런 문제를 해결하기 위하여 앱 설명에서 노이즈에 해당하는 설명들을 자동으로 제거할 수 있는 모델을 제안한다. 제안하는 모델은 모바일 앱 설명을 구성하고 있는 각 문단을 LDA로 학습된 토픽들의 비율로 나타내고 이들을 분류문제에서 우수한 성능을 보이는 SVM을 이용하여 분류한다. 실험 결과에 따르면 본 논문에서 제안한 방법은 기존에 문서 분류에 많이 사용되는 Bag-of-Word 표현법에 기반한 문서 표현 방식보다 더 나은 분류 성능을 보였다.

  • PDF

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

머신러닝을 이용한 CNC 가공 불량 발생 예측 모델 (Prediction Model of CNC Processing Defects Using Machine Learning)

  • 한용희
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.249-255
    • /
    • 2022
  • 본 연구는 최근 가공 불량 예측 방법으로 주목받고 있는 머신러닝 기반의 모델을 이용하여 CNC 가공 불량 발생의 실시간 예측을 위한 분석 프레임워크를 제안하고, 해당 프레임워크에 기반하여 XGBoost, CatBoost, LightGBM, 랜덤 포레스트, Extra Trees, SVM, k-최근접 이웃, 로지스틱 회귀 모델을 CNC 설비에 기본 내장된 센서들로부터 추출된 데이터에 적용 및 분석하였다. 분석 결과 XGBoost, CatBoost, LightGBM 모델이 동일하게 가장 우수한 정확도, 정밀도, 재현율, F1 점수, AUC 값을 보였으며, 이 중 LightGBM 모델이 소요 실행 시간이 가장 짧은 것으로 나타났다. 이러한 짧은 소요 실행 시간은 실 시스템 구축 비용 절감, 빠른 불량 예측에 따른 CNC 장비 파손 확률 감소, 전체적인 CNC 활용률 증가 등의 실무적 장점을 가지므로 LightGBM 모델이 기본 센서들만 설치된 CNC 설비에 적용 시 가공 불량 예측에 가장 효과적으로 판단된다. 또한 소요 실행 시간 및 컴퓨팅 파워의 제약이 없는 상황에서는 LightGBM, Extra Trees, k-최근접 이웃, 로지스틱 회귀 모형으로 구성된 앙상블 모델을 적용할 경우 분류 성능이 최대화됨을 확인하였다.

울진 소광리 금강소나무 고사발생 특성 분석 및 위험지역 평가 (Risk Assessment of Pine Tree Dieback in Sogwang-Ri, Uljin)

  • 김은숙;이보라;김재범;조낭현;임종환
    • 한국산림과학회지
    • /
    • 제109권3호
    • /
    • pp.259-270
    • /
    • 2020
  • 최근 20년 동안 고온, 건조 등 이상기상 현상이 빈발해지면서 병해충으로 인한 피해가 아닌 생리적 스트레스로 인한 소나무 피해 사례가 지속적으로 보고되고 있다. 2014년도에는 울진 소광리 산림유전자원보호구역 내에 금강소나무(Pinus densiflora for. erecta Uyeki)의 집단고사가 발견되어 이에 대한 원인 구명과 산림관리방안 마련이 요구되었다. 이에 본 연구는 2008~2015년 항공사진에서 발견된 울진 소광리 금강소나무 고사 피해 발생 지역의 지형 및 임분 특성을 파악하여 고사 발생의 영향 요인을 도출하고 이를 기반으로 전체 지역의 고사피해 발생 위험지역을 예측하는 것을 목표로 하였다. 소나무 고사발생 지점 정보와 해발고도, 경사 등의 지형정보, 영급, 경급 등의 임분 정보 등 총 14개의 설명변수를 이용하여 고사발생 예측모델을 구축하였다. 모형 개발에는 Decision Tree, Random Forest (RF), Support Vector Machine (SVM) 등 기계학습 기법을 적용하였으며, RF와 SVM가 정확도 93% 이상으로 좋은 성능을 보였다. 소나무 고사와 관련된 주요 변수 분석 결과, 소나무 고사의 지형적인 취약지역은 해발고도가 높은 동시에 일사량이 높으며 수분 조건이 불리한 지역이었으며, 임분 특성 중에서는 특히 5~15m 높이의 수직적 임분밀도가 높은 소나무림, 그리고 영급이 높은 소나무림에서 고사 위험성이 높다고 평가되었다. RF와 SVM 모형 예측에 따라, 소나무 고사위험도가 높은 지역의 면적은 연구대상지 전체 소나무림 면적의 약 9.5%, 115ha로 평가되었다. 본 연구의 고사위험도 평가 결과는 금강소나무 취약지역의 현황을 조사하고 아직 피해가 발생하지 않은 취약지역에 대한 적극적인 기후변화 적응 산림관리를 수행하기 위한 기반자료로 활용될 수 있다.

교통 빅데이터 활용 시 개인 정보 보호를 위한 연합학습 기반의 경로 선택 모델링 (Federated Learning-based Route Choice Modeling for Preserving Driver's Privacy in Transportation Big Data Application)

  • 심지섭
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.157-167
    • /
    • 2023
  • 본 연구에서는 분산 컴퓨팅 및 개별 디바이스 활용을 통해 개인 정보 보호에 특화된 학습방법인 연합학습 방법론을 기반으로, 모바일 내비게이션 애플리케이션에서 수집된 대규모의 운전자 데이터를 이용하여 경로 선택 예측 모델을 수립하는 방법에 대해 고찰한다. 경로 선택 모델링에서 활용될 수 있는 운전자 데이터의 전처리 및 분석 방법을 수립하고, 서포트벡터머신(SVM) 및 다층 퍼셉트론(MLP)과 같이 기존에 널리 활용되는 학습 방법과 연합학습 방법의 성능과 특성을 비교한다. 분석 결과 연합학습을 통한 모델 성능은 중앙 서버 기반의 모델과의 비교에서 예측 정확도 측면의 차이가 거의 없는 것으로 나타났으나, 개별 데이터가 충분히 확보되는 경우 연합학습 모델과 같은 개인화 모델의 성능이 개선될 수 있다는 점을 확인하였다. 연합학습 모델은 본 연구의 경로 선택 모델링 사례와 같이 모빌리티 부문의 데이터 프라이버시 문제가 중요한 분야에서 대규모 데이터 처리를 필요로 하는 경우에 그 활용 가치가 매우 높을 것으로 기대된다.