• 제목/요약/키워드: 서포트벡터회귀

검색결과 102건 처리시간 0.023초

발전플랜트 성능데이터 학습에 의한 발전기 출력 추정 모델 (A Predictive Model of the Generator Output Based on the Learning of Performance Data in Power Plant)

  • 양학진;김성근
    • 한국산학기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.8753-8759
    • /
    • 2015
  • 터빈 발전 사이클에서의 안정적인 발전 출력 유지관리를 위해서는 검증된 성능 측정 데이터 그룹과 이를 바탕으로 한 발전 출력 성능 계산 절차의 수립이 필요하다. ASME PTC(Performance Test Code)의 성능 계산 절차를 기반으로 본 연구에서는 터빈 출력에 의한 발전기 출력 성능 산정을 위해서 터빈 팽창선 모델과 발전기 출력 측정 데이터의 입력 검증 모델을 구성하였다. 또한 불확실한 측정 데이터에 대한 검증 모델도 구성하였다. 지난 연구에서는 신경회로망과 커널 회귀의 학습 방법을 사용하였으나 본 연구에서는 미측정 데이터에 대한 보완을 하기 위하여 서포트 벡터 머신 모델을 사용하여 발전기 출력 계산 데이터의 학습 모델을 구성하였으며, 학습 모델 구성을 위해서 관련 변수의 선정을 위한 절차와 학습 데이터 구간을 설정하는 알고리듬을 개발하였다. 학습의 결과 오차는 약 1% 범위 안에 있게 되어 추정 및 학습 모델로서 유용함을 입증하였다. 이 학습 모델을 사용하여 측정 데이터 중 상실된 부분에 대한 추정 모델을 구성함으로써, 터빈 사이클 보정 성능 계산의 신뢰성을 향상시킬 수 있음을 검증하였다.

지역 기상 정보를 활용한 단기 전력 수요 예측 모델 (A New Prediction Model for Power Consumption with Local Weather Information)

  • 탁해성;김태용;조환규;김희제
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.488-498
    • /
    • 2016
  • 많은 정보가 데이터로 저장되면서, 데이터를 분석하거나 특수 상황을 예측하기 위한 연구들이 진행되고 있다. 특히, 전력 데이터의 경우 환경적 요인에 의한 예측 연구 및 신재생 에너지를 활용하는 스마트그리드와 마이크로그리드 연구들이 진행 중이다. 본 논문에서는 전력 데이터의 예측을 위해 주변 환경에서 나타나는 데이터를 활용하고자 한다. 이때, 단순 기상 데이터가 아닌 이전 시간에 따른 여러 인자를 반영하여 데이터 예측이 올바르게 이루어지는지를 검증하고자 한다. 검증 과정에서는 유사 기온을 가지는 전력 데이터 선별 예측 결과와 전력 데이터의 길이에 따른 전력 수요 예측 결과를 비교군으로 두고, 기상 정보를 추가 활용하였을 때의 전력 수요 예측 결과를 비교 분석한다. 실험 결과를 통해 기상 정보를 이용할 경우 평균 15% 이내의 최대 오차율 감소 효과를 확인할 수 있다.

뜰개 이동 예측을 위한 신경망 및 통계 기반 기계학습 기법의 성능 비교 (Performance Comparison of Machine Learning Based on Neural Networks and Statistical Methods for Prediction of Drifter Movement)

  • 이찬재;김경도;김용혁
    • 한국융합학회논문지
    • /
    • 제8권10호
    • /
    • pp.45-52
    • /
    • 2017
  • 뜰개는 해양에서 해수의 특성 및 흐름을 관측하기 위한 장비로서, 해수의 흐름 관측을 이용해 유출유 확산 예측을 위해 사용될 수 있다. 본 논문에서는 관측기관에서 사용하는 뜰개가 특정 시간 간격으로 관측한 바람 및 해수의 특성과 이동경로를 기계학습 기법들을 이용하여 학습시키고 예측하는 모델을 제안한다. 서포트벡터 회귀, 방사기저함수 네트워크, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망을 이용하여 뜰개의 이동경로 예측 방법을 제시한다. 기존 MOHID 수치모델과 비교하여 각 기법별로 4 개의 사례중 3 개에서 성능이 개선되었으며, 가장 좋은 개선율을 보인 기법은 LSTM으로 평균 47.59% 개선되었다. 추후 연구에서는 배깅과 부스팅을 이용하여 가중치를 부여하여 정확도를 개선할 예정이다.

신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향 (A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods)

  • 김경도;김용혁
    • 한국융합학회논문지
    • /
    • 제8권10호
    • /
    • pp.1-8
    • /
    • 2017
  • 정확한 예측은 미래에 일어날 현상에 대해 효과적으로 준비 혹은 대처 할 수 있게 해준다. 특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다. 선별한 기계학습 기법을 이용하여 유류유출의 탐지와 바람, 강우량, 오존 등의 기상 데이터를 예측하는 연구들의 연구 방법과 결과 등을 설명하며 이를 활용한 기계학습 기반 유류유출 예측 모델의 적용 가능성을 제시한다.

도시가스 배관압력 예측모델 (City Gas Pipeline Pressure Prediction Model)

  • 정원희;박길주;구영현;김성현;유성준;조영도
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.33-47
    • /
    • 2018
  • 도시가스 배관은 지중에 매설되어 있기 때문에 세부 관리가 어렵고 다양한 위험에 노출되어 있다. 본 연구에서는 도시가스 배관압력 실시간 데이터를 분석해 배관압력 이상을 예측하고 전문가의 의사결정을 돕는 모델을 제안한다. 국내 도시가스 공급업체들 중 하나인 중부도시가스사의 정압기에서 수집하는 실시간 배관압력 데이터와 시간변수, 외부환경변수를 통합해 분석 데이터로 사용한다. 아산시와 천안시에 위치하는 11개 정압기를 분석 대상으로 하며 분 단위 배관압력 예측모델을 구현한다. Random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용해 회귀모델을 구현한 결과 LSTM 모델에서 우수한 성능을 보인다. 아산시 배관압력 예측모델의 경우 LSTM 모델에서 RMSE가 0.011, MAPE가 0.494이며, 천안시 배관압력 예측모델의 경우 LSTM 모델에서 평균제곱근오차(root mean square error, RMSE)가 0.015, 절대평균백분율오차(mean absolute percentage error, MAPE)가 0.668로 가장 낮은 오류율을 보인다.

속성선택방법을 이용한 전기자동차 소셜미디어 데이터의 감성분석 연구 (Exploring the Sentiment Analysis of Electric Vehicles Social Media Data by Using Feature Selection Methods)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.249-259
    • /
    • 2020
  • 본 연구는 전기자동차(EV)에 대한 소셜미디어 데이터를 기반으로 감성분석 (SA)과 속성선택 (FS)방법을 적용하여 전기자동차에 대한 일반 사람들의 의견을 보다 효과적이고 정확히 예측할 수 있는 새로운 방법론을 제안한다. 구체적인 방법은 다음과 같다. 첫째, 유튜브에 있는 전기자동차에 대한 일반 사람들의 의견을 추출하였다. 둘째, 분석의 효과성을 증대하기 위하여 카이 스퀘어, 정보획득량, 릴리프에프 등 세가지 속성선택 방법을 적용하였다. 그 결과 로지스틱 회귀분석 및 서포트 벡터 머신 분류 기법에서 가장 의미있는 결과를 얻을 수 있다는 것이 확인되었다.

불균형적인 이항 자료 분석을 위한 샘플링 알고리즘들: 성능비교 및 주의점 (On sampling algorithms for imbalanced binary data: performance comparison and some caveats)

  • 김한용;이우주
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.681-690
    • /
    • 2017
  • 파산감지, 스팸메일 감지, 불량품 감지 등 일상생활에서 불균형적인 이항 분류 문제를 다양하게 접할 수 있다. 반응변수의 클래스의 비율이 상당히 불균형한 경우 이항 분류 모형의 예측 성능이 좋지 않다는 점은 이미 잘 알려진 사실이다. 이러한 문제점을 해결하기 위해 그 동안 오버 샘플링, 언더 샘플링, SMOTE와 같은 여러 샘플링 기법이 개발되어 왔다. 본 연구에서는 분류 모형으로 많이 사용되는 기계학습모형으로 로지스틱 회귀모형, Lasso, 랜덤포레스트, 부스팅, 서포트 벡터 머신을 위의 샘플링 기법들과 결합하여 사용했을 때의 예측 성능을 살펴보았다. 실질적인 예측 성능의 개선 여부를 확인하기 위해 네 개의 실제 자료를 분석하였다. 이와 더불어, 샘플링 방법이 사용될 때 주의해야 할 점에 대해서 강조하였다.

개선된 네이버 임베딩에 의한 초해상도 기법 (Super Resolution Technique Through Improved Neighbor Embedding)

  • 엄경배
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권6호
    • /
    • pp.737-743
    • /
    • 2014
  • 단일 영상 초해상도 기법에는 보간 기반 방법과 표본 기반 방법 등이 있다. 보간 기반 방법들은 간결성에 강점을 가지고 있으나, 이들 방법들은 선지식을 이용할 수 없기 때문에 톱니 모양의 윤곽선을 가진 고해상도 영상을 생성하는 경향이 있다. 표본 기반 초해상도 기법에서는 최근방 기반 알고리즘들이 널리 이용되어 지고 있다. 그들 중, 네이버 임베딩은 지역적 선형 임베딩이라는 매니폴드 학습 방법의 개념과 같다. 그러나, 네이버 임베딩은 국부 학습 데이터 집합의 크기가 너무 작은데에 따른 빈약한 일반화 능력으로 인하여, 시각적으로나 정량적인 척도에 의해 취약한 성능을 보인다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 개선된 네이버 임베딩 알고리즘을 제안하였다. 저해상도 입력 영상이 주어지면 고해상도 버전의 화소 값들은 개선된 네이버 임베딩 알고리즘에 의해 구해진다. 실험 결과 제안된 방법이 바이큐빅 보간법이나 네이버 임베딩에 비해 정량적인 척도 및 시각적으로도 우수한 결과를 보였다.

P2P 대부 우수 대출자 예측을 위한 합성 소수집단 오버샘플링 기법 성과에 관한 탐색적 연구 (Exploring the Performance of Synthetic Minority Over-sampling Technique (SMOTE) to Predict Good Borrowers in P2P Lending)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.71-78
    • /
    • 2019
  • 본 연구는 P2P 대부 플랫폼에서 우수 대출자를 예측시 유용한 합성 소수집단 오버샘플링 기법을 제안하고 그 성과를 실증적으로 검증하고자 한다. P2P 대부 관련 우수 대출자를 추정할 때 일어나는 문제점중의 하나는 클래스 간 불균형이 심하여 이를 해결하지 않고서는 우수 대출자 예측이 쉽지 않다는 점이다. 이러한 문제를 해결하기 위하여 본 연구에서는 SMOTE, 즉 합성 소수집단 오버샘플링 기법을 제안하고 LendingClub 데이터셋에 적용하여 성과를 검증하였다. 검증결과 SMOTE 방법은 서포트 벡터머신, k-최근접이웃, 로지스틱 회귀, 랜덤 포레스트, 그리고 딥 뉴럴네트워크 분류기와 비교하여 통계적으로 우수한 성과를 보였다.

약물유전체학에서 약물반응 예측모형과 변수선택 방법 (Feature selection and prediction modeling of drug responsiveness in Pharmacogenomics)

  • 김규환;김원국
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.153-166
    • /
    • 2021
  • 약물유전체학 연구의 주요 목표는 고차원의 유전 변수를 기반으로 개인의 약물 반응성을 예측하는 것이다. 변수의 개수가 많기 때문에 변수의 개수를 줄이기 위해서는 변수 선택이 필요하며, 선택된 변수들은 머신러닝 알고리즘을 사용하여 예측 모델을 구축하는데 사용된다. 본 연구에서는 400명의 뇌전증 환자의 차세대 염기서열 분석 데이터에 로지스틱 회귀, ReliefF, TurF, 랜덤 포레스트, LASSO의 조합과 같은 여러 가지 혼합 변수 선택 방법을 적용하였다. 선택된 변수들에 랜덤포레스트, 그래디언트 부스팅, 서포트벡터머신을 포함한 머신러닝 방법들을 적용했고 스태킹을 통해 앙상블 모형을 구축하였다. 본 연구의 결과는 랜덤포레스트와 ReliefF의 혼합 변수 선택 방법을 이용한 스태킹 모형이 다른 모형보다 더 좋은 성능을 보인다는 것을 보여주었다. 5-폴드 교차 검증을 기반으로 하여 적합한 최적 모형의 평균 검증 정확도는 0.727이고 평균 검증 AUC 값은 0.761로 나타났다. 또한, 동일한 변수를 사용할 때 스태킹 모델이 단일 머신러닝 예측 모델보다 성능이 우수한 것으로 나타났다.