• 제목/요약/키워드: SVM 모델

검색결과 389건 처리시간 0.028초

GMM-supervector를 사용한 SVM 기반 화자분류에 대한 연구 (A Study on SVM-Based Speaker Classification Using GMM-supervector)

  • 이경록
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1022-1027
    • /
    • 2020
  • 본 논문에서는 GMM-supervector를 특징 파라미터로 하는 SVM 기반 화자 분류에 대해서 실험하였다. 실험을 위한 화자 클러스터를 생성하기 위해서 기존의 SNR 기반 가중치를 반영한 KL거리 기반 화자변화검출을 실행하였다. SVM 기반 화자 분류는 2단계로 이루어져있다. 1단계는 UBM과 화자 모델들간의 SVM 기반 분류를 시행하여 각 클러스터에 화자 정보를 인덱싱한 다음 화자별로 그룹핑한다. 2단계는 화자 클러스터 그룹에 UBM과 화자모델들간의 SVM 기반 분류를 시행한다. SVM의 커널 함수로는 Linear와 RBF를 사용하였다. 실험결과, 1단계에서는 Linear 커널이 화자 클러스터 148개, MDR 0, FAR 47.3, ER 50.7로 좋은 성능으로 보였다. 2단계 실험결과도 Linear 커널이 화자 클러스터 109개, MDR 1.3, FAR 28.4, ER 32.1로 좋은 성능을 보였다.

Support Vector Machine을 이용한 Reactive ion Etching의 Run-to-Run 오류검출 및 분석 (Run-to-Run Fault Detection of Reactive Ion Etching Using Support Vector Machine)

  • 박영국;홍상진;한승수
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.962-969
    • /
    • 2006
  • 현재 고밀도 반도체제작 환경에서는 반작용적인 이온 식각 과정(reactive ion etching)에서의 생산성을 극대화하기 위해서 비정상적인 공정장비를 발견하는 것이 매우 중요하다. 생산과정에서 오류발견의 중요성을 설명하기 위해 Support Vector Machine (SVM)은 실시간으로 공정오류에 대한 판단을 위해 사용되었다. 반작용적인 이온 식각도구 데이터는 59개 변수들로 구성된 반도체 공정장비로부터 얻는다. 각각의 변수들은 초당 10개의 데이터로 구성되어있다. 식각 런의 11개의 파라미터에 대한 모델을 만들기 위해 baseline런으로부터 얻은 데이터로 SVM모델을 구성하고 정상 런데이터와 비정상 런데이터로 SVM모델을 검증한다. 통계적 공정제어에서 흔히 이용되는 관리한계를 도입하여 정상데이터가 내재하고 있는 램덤변화율이 반영된 SVM 모델 기반의 관리 한계를 수립하고, 그 관리 한계를 바탕으로 오류발견을 실행한다. SVM을 이용함으로써 RIE의 오류발견은 run to run 기반에 정상 런데이터는 0% 오류율이 증명되었다.

인공신경망 기반 온실 외부 온도 예측을 통한 난방부하 추정 (Outside Temperature Prediction Based on Artificial Neural Network for Estimating the Heating Load in Greenhouse)

  • 김상엽;박경섭;류근호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권4호
    • /
    • pp.129-134
    • /
    • 2018
  • 최근, 인공신경망 모델은 예측, 수치제어, 로봇제어, 패턴인식 등의 분야에서 촉망되는 기술이다. 본 연구에서는 인공신경망 모델을 이용하여 온실 외부 온도를 예측하고 이를 온실제어에 활용하는데 목적이 있다. 예측 모델의 성능 평가를 위해 다중회귀모델과 SVM 모델과의 비교분석을 수행하였다. 평가 방법으로는 10-Fold Cross Validation을 사용하였으며, 예측 성능 향상을 위해 상관관계분석 통해 데이터 축소를 수행하였고, 측정 데이터로부터 새로운 Factor 추출하여 데이터의 신뢰성을 확보하였다. 인공신경망 구축을 위해 Backpropagation algorithm을 사용하였으며, 다중회귀모델은 M5 method로 구축하였고, SVM 모델을 epsilon-SVM으로 구축하였다. 각 모델의 비교분석 결과 각각 0.9256, 1.8503과 7.5521로 나타났다. 또한 예측모델을 온실 난방부하 계산에 적용함으로써 온실에 사용되는 에너지 비용 절감을 통한 수입증대에 기여할 수 있다. 실험한 온실의 난방부하는 3326.4kcal/h이며, 총 난방시간이 $10000^{\circ}C/h$일 때 연료소비량은 453.8L로 예측된다. 아울러 데이터 마이닝 기술 중 하나인 인공신경망을 정밀온실제어, 재배기법, 수확예측 등 다양한 농업 분야에 적용함으로써 스마트 농업으로의 발전에 기여할 수 있다.

VRIFA: LRBF 커널과 Nomogram을 이용한 예측 및 비선형 SVM 시각화도구 (VRIFA: A Prediction and Nonlinear SVM Visualization Tool using LRBF kernel and Nomogram)

  • 김성철;유환조
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.722-729
    • /
    • 2010
  • 예측 문제를 해결하기 위한 데이타마이닝 기법은 다양한 분야에서 주목받고 있다. 이것에 대한 한 예로 컴퓨터-기반의 질병의 예측 혹은 진단은 CDSS(Clinical Decision support System)에서 가장 중요한 요소이기도 하다. 이러한 예측 문제를 해결하기 위해서 RBF커널 같은 비선형 커널을 사용한 SVM이 가장 널리 사용되고 있는데, 이는 비선형 SVM이 어떠한 다른 분류기법보다 정확한 성능을 보이기 때문이다. 하지만 비선형 SVM을 사용한 경우에는 모델내부를 시각화하는 일이 어려워서 예측결과에 대한 직관적인 이해가 힘들고, 의학 전문가들은 이러한 비선형 SVM의 사용을 기피하고 있는 실정이다. Nomogram은 SVM을 시각화하기 위해 제안된 기법이다. 하지만 이는 선형 SVM의 경우에만 사용이 가능하고. 이 문제를 해결하기 위해서 LRBF 커널이 제안된 바 있다. LRBF 커널은 기존의 RBF 커널을 사용한 SVM과 대등한 결과를 보이면서도 예측결과의 선형적 분석도 가능하게 한다. 본 논문에서는 노모그램(Nomogram)과 LRBF 커널을 사용한 SVM이 통합되어 있는 예측 툴 VRIFA를 제안한다. 이 툴은 사용자와 상호작용하며 비선형 SVM 모델의 내부구조를 데이타의 각 속성별로 보여주는 방법으로 사용자가 예측결과를 직관적으로 이해하도록 도와준다. VRIFA는 Nomogram기반의 피쳐선택(feature selection) 기능도 포함하고 있는데, 이 기능은 예측결과에 부정적인 영향을 끼치거나 중복된 연관성을 보이는 속성을 제거함으로써 모델의 정확도를 높이는 데 기여한다. 그리고 데이터에 포함된 클래스의 비율이 한 쪽으로 치우쳐져 있는 경우에는 ROC 곡선 넓이(AUC)를 예측결과를 평가하기 위한 측도로 사용할 수 있다. 이 툴은 컴퓨터-기반의 질병 예측 혹은 질병의 위험 요소 분석에 대해 연구하는 연구자들에게 유용하게 사용될 것으로 전망하는 바이다.

SVM 모델을 이용한 3차원 패치 기반 단백질 상호작용 사이트 예측기법 (Prediction of Protein-Protein Interaction Sites Based on 3D Surface Patches Using SVM)

  • 박성희
    • 정보처리학회논문지D
    • /
    • 제19D권1호
    • /
    • pp.21-28
    • /
    • 2012
  • 모노머 단백질의 상호작용 사이트 예측은 기능을 알지 못하는 단백질에 대해서 이것과 상호작용하는 단백질로부터 기능을 예측하거나 단백질 도킹을 위한 검색 공간의 감소에 중요한 역할을 한다. 그러나 상호작용사이트 예측은 대부분 단백질 상호작용이 세포 내에서 순간적 반응에 일어나는 약한 상호작용으로 실험에 의한 3차원 결정 구조 식별의 어려움이 따르며 이로 인해 3차원의 복합체 데이터가 제한적으로 양산된다. 이 논문에서는 모노머 단백질의 3차원 패치 계산을 통하여 구조가 알려진 복합체의 상호작용사이트와 비상호작용사이트에 대한 패치 속성을 추출하고 이를 기반으로 Support Vector Machine (SVM) 분류기법을 이용한 예측 모델 개발을 제시한다. 타겟 클래스의 데이터 불균형 문제 해결을 위해 under-sampling 기법을 이용한다. 사용된 패치속성은 2차 구조 요소와 아미노산 구성으로부터 총 9개가 추출된다. 147개의 단백질 복합체에 대해서 10 fold cross validation을 통해서 다양한 분류모델의 성능 평가를 하였다. 평가한 분류 모델 중 SVM은 92.7%의 높은 정확성을 보이고 이를 이용하여 분류 모델을 개발하였다.

선박용 밸브의 내부 누설 진단을 위한 음향방출신호의 머신러닝 기법 적용 연구 (Diagnosis of Valve Internal Leakage for Ship Piping System using Acoustic Emission Signal-based Machine Learning Approach)

  • 이정형
    • 해양환경안전학회지
    • /
    • 제28권1호
    • /
    • pp.184-192
    • /
    • 2022
  • 밸브의 내부 누설 현상은 밸브의 내부 부품의 손상에 의해 발생하며 배관 시스템의 사고와 운전정지를 일으키는 주요 요인이다. 본 연구는 버터플라이형 밸브의 내부 누설에 따라 배관계에서 발생하는 음향방출 신호를 이용하여 배관 가동 중 실시간 누설 진단의 가능성을 검토하였다. 이를 위해 밸브의 작동 모드별로 측정한 시간영역의 AE 원시신호를 취득하였으며 이로부터 구축한 데이터셋은 데이터 기반의 인공지능 알고리즘에 적용하여 밸브의 내부 누설 유무를 진단하는 모델을 생성하였다. 누설 유무진단을 분류의 문제로 정의하여 SVM 기반의 머신러닝과 CNN 기반의 딥러닝 분류 알고리즘을 적용하였다. 데이터의 특징 추출에 기반한 SVM 분류 모델의 경우, 이진분류 모델에서 구축된 모델에 따라 83~90%의 정확도를 나타냈으며, 다중 클래스인 경우 분류 정확도가 66%로 감소하였다. 반면, CNN 기반의 다중 클래스 분류 모델의 경우 99.85%의 분류 정확도를 얻을 수 있었다. 결론적으로 밸브 내부 누설 진단을 위한 SVM 분류모델은 다중 클래스의 정확도 향상을 위해 적절한 특징 추출이 필요하며, CNN 기반의 분류모델은 프로세서의 성능 저하만 없다면 누설진단과 밸브 개도 분류에 효율적인 접근방법임을 확인하였다.

생체 신호의 특징 추출 및 SVM을 이용한 분류 (Feature Extraction and Classification using SVM for Biomedical Signal)

  • 김만선;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2003
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 다양한 생체 신호를 분석하기 위하여 데이터 마이닝 기법을 이용할 수 있다. 본 논문에서는 심전도 신호의 패턴을 분류하기 위하여 신경망 기법을 적용하였다. 최근 패턴분류에 있어서 각광을 받고 있는 SVM 모델은 학습과정에서 얻어진 확률분포를 이용하여 의사결정함수를 추정한 후 이 함수에 따라 새로운 데이터를 이원분류 하는 것으로 분류 문제에 있어서 일반화 기능이 매우 높다. 기존에 많이 이용되던 BP 모델과 비교평가 하였다.

  • PDF

SVM 기반 기술정보 문서분류를 위한 특징 선택 기법 (Feature Selection for Document Classifier for IT documents based on SVM)

  • 강윤희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.577-580
    • /
    • 2002
  • 인터넷상의 정보의 급증에 따라 필요한 정보를 발견하고 관련된 정보를 조직화하기가 더욱 어려워지고 있으며 정보 접근의 부하를 줄이기 위한 효율적인 문서 분류의 중요성 및 필요성이 증가하고 있다. 본 논문에서는 디렉토리 내의 학습 문서 집합을 기반으로 구성된 디렉토리 내의 대표 용어 집합으로 구성된 모델을 학습 및 분류하기 위해 SVM을 사용한다. 문서분류를 위해 정보통신 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 학습을 수행한 후 문서 분류를 수행한다. 또한 TFiDF를 기반으로 특징을 표현하기 위해 벡터공간 모델을 사용하였고 이를 기반으로 성능 평가를 수행한다.

  • PDF

로봇의 목표물 추적을 위한 SVM과 12각형 기반의 Q-learning 알고리즘 (Dodecagon-based Q-learning Algorithm using SVM for Object Search of Robot)

  • 서상욱;장인훈;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.227-230
    • /
    • 2007
  • 본 논문에서는 로봇의 목표물 추적을 위하여 SVM을 이용한 12각형 기반의 Q-learning 알고리즘을 제안한다. 제안한 알고리즘의 유효성을 보이기 위해 본 논문에서는 두 대의 로봇과 장애물 그리고 하나의 목표물로 정하고, 각각의 로봇이 숨겨진 목표물을 찾아내는 실험을 가정하여 무작위, DBAM과 AMAB의 융합 모델, 마지막으로는 본 논문에서 제안한 SVM과 12각형 기반의 Q-learning 알고리즘을 이용하여 실험을 수행하고, 이 3가지 방법을 비교하여 본 논문의 유효성을 검증하였다.

  • PDF

다중선형회귀와 기계학습 모델을 이용한 PM10 농도 예측 및 평가 (Evaluation and Predicting PM10 Concentration Using Multiple Linear Regression and Machine Learning)

  • 손상훈;김진수
    • 대한원격탐사학회지
    • /
    • 제36권6_3호
    • /
    • pp.1711-1720
    • /
    • 2020
  • 최근 급속한 산업화와 도시화로 인해 인위적으로 발생하는 미세먼지(Particulate matter, PM)는 기상 조건에 따라 이동 및 분산되면서 피부와 호흡기 등 인체에 악영향을 미친다. 본 연구는 기상인자를 multiple linear regression(MLR), support vector machine(SVM), 그리고 random forest(RF) 모델의 입력자료로 하여 서울시 PM10 농도를 예측하고, 모델 간 성능을 비교 평가하는데 그 목적을 둔다. 먼저 서울시에 소재한 39개소 대기오염측정망(air quality monitoring sites, AQMS)에서 관측된 PM10 농도 자료를 8:2 비율로 구분하여 모델 훈련과 검증 데이터셋으로 사용되었다. 또한 기상관측소(automatic weather system, AWS)에서 관측되고 있는 자료 중 9개 기상인자(평균기온, 최고기온, 최저기온, 일 강수량, 평균풍속, 최대순간풍속, 최대순간풍속풍향, 황사발생유무, 상대습도)가 모델의 입력자료로 선정되었다. 각 AQMS에서 관측된 PM10 농도와 MLR, SVM, 그리고 RF 모델에 의해 예측된 PM10 농도 간 결정계수(R2)는 각각 0.260, 0.772, 그리고 0.793이었고, RF 모델이 PM10 농도 예측에 가장 높은 성능을 나타냈다. 특히 모델 검증에 사용되는 AQMS 중 관악구와 강남대로 AQMS는 상대적으로 AWS에 가까워 SVM과 RF 모델에서 높은 정확도를 나타냈다. 종로구 AQMS는 AWS에서 비교적 멀리 떨어져 있지만, 인접한 두 AQMS 데이터가 모델 학습에 사용되었기 때문에 두 모델에서 높은 정확도를 나타냈다. 반면 용산구 AQMS는 AQMS 및 AWS에서 비교적 멀리 떨어져 있기에 두 모델의 성능이 낮게 나타냈다.