• 제목/요약/키워드: SVM feature extraction

검색결과 138건 처리시간 0.03초

Support Vector Machine을 이용한 온라인 리뷰의 용어기반 감성분류모형 (Terms Based Sentiment Classification for Online Review Using Support Vector Machine)

  • 이태원;홍태호
    • 경영정보학연구
    • /
    • 제17권1호
    • /
    • pp.49-64
    • /
    • 2015
  • SNS의 확산으로 온라인 상점에서는 상품에 대한 주관적인 의견이 내포되어 있는 고객리뷰 정보가 빠르게 생성되고 확산되어 다른 고객들에게 큰 영향을 미치고 있다. 이와 더불어, 고객들의 긍정적 또는 부정적 의견을 분석하여 개선방안을 모색하려는 오피니언마이닝(opinion mining)이 주목 받고 있다. 고객리뷰에 내포된 감성정보를 가진 용어들은 감성분류를 하는데 가장 중요한 역할을 하기 때문에 영향력이 높은 용어를 선별하는 것이 가장 중요하다. 본 연구에서는 품사태깅을 이용하여 최적의 용어들을 선별하고 용어정보에 기반한 문서수준에서의 감성분류모형을 제안하고자 한다. 고객리뷰의 감성분류모형에 대표적인 기계학습기법인 SVM을 적용하고, SVM의 입력변수 선정과정에 품사태깅 방식과 용어추출기법을 다르게 조합하고 사용하여 긍정적/부정적 문서를 분류하였다. 본 연구에서 제안한 감성분류모형의 성과를 검증하기 위해 아마존(Amazon.com)의 영화와 도서에 대한 고객리뷰 80,000개를 수집하여 불필요한 용어들을 제거한 후 품사태깅을 통해 용어를 추출하였다. 추출된 용어는 문서빈도, TF-IDF, 정보획득량, 카이제곱 통계량의 값을 산출하여 값을 통해 용어들을 순위화하고, 각 상위 20개에 해당하는 최적의 용어를 선정한 후 SVM을 이용하였다. 제안된 감성분류모형을 통해 기존 연구에서 언급한 형용사만을 사용한 예측변수와 4품사를 사용한 예측변수에서의 실험결과를 통해 비교 분석하였다. 카이제곱 통계량 기반의 감성분류모형이 다른 모형보다 예측성과가 가장 우수하게 나타나는 것을 확인할 수 있었다. 본 연구에서 제안된 문서수준에서의 용어기반 감성분류모형을 이용함으로써 온라인 상점에서의 서비스 개선과 경쟁력 확보에 많은 도움이 될 것으로 기대된다.

선박용 밸브의 내부 누설 진단을 위한 음향방출신호의 머신러닝 기법 적용 연구 (Diagnosis of Valve Internal Leakage for Ship Piping System using Acoustic Emission Signal-based Machine Learning Approach)

  • 이정형
    • 해양환경안전학회지
    • /
    • 제28권1호
    • /
    • pp.184-192
    • /
    • 2022
  • 밸브의 내부 누설 현상은 밸브의 내부 부품의 손상에 의해 발생하며 배관 시스템의 사고와 운전정지를 일으키는 주요 요인이다. 본 연구는 버터플라이형 밸브의 내부 누설에 따라 배관계에서 발생하는 음향방출 신호를 이용하여 배관 가동 중 실시간 누설 진단의 가능성을 검토하였다. 이를 위해 밸브의 작동 모드별로 측정한 시간영역의 AE 원시신호를 취득하였으며 이로부터 구축한 데이터셋은 데이터 기반의 인공지능 알고리즘에 적용하여 밸브의 내부 누설 유무를 진단하는 모델을 생성하였다. 누설 유무진단을 분류의 문제로 정의하여 SVM 기반의 머신러닝과 CNN 기반의 딥러닝 분류 알고리즘을 적용하였다. 데이터의 특징 추출에 기반한 SVM 분류 모델의 경우, 이진분류 모델에서 구축된 모델에 따라 83~90%의 정확도를 나타냈으며, 다중 클래스인 경우 분류 정확도가 66%로 감소하였다. 반면, CNN 기반의 다중 클래스 분류 모델의 경우 99.85%의 분류 정확도를 얻을 수 있었다. 결론적으로 밸브 내부 누설 진단을 위한 SVM 분류모델은 다중 클래스의 정확도 향상을 위해 적절한 특징 추출이 필요하며, CNN 기반의 분류모델은 프로세서의 성능 저하만 없다면 누설진단과 밸브 개도 분류에 효율적인 접근방법임을 확인하였다.

복합 특성 정보와 SVM을 이용한 차량 번호판 추출 및 검증 (Vehicle License Plate Extraction and Verification Using Compounded Feature Information and Support Vector Machines)

  • 김하영;안명석;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.493-496
    • /
    • 2005
  • 본 논문에서는 번호판 고유의 복합 색상 정보와 수직 에지 정보를 이용한 번호판 후보 영역 추출기법을 제안한다. 또한 추출된 번호판 영역의 정확성을 높이기 위해서, Fast DCT를 거쳐 압축된 이미지에 대하여 Support Vector Machines(SVM)을 이용한 검증 과정을 제안한다. 제안하는 기법은 차량번호판 인식의 대상이 되는 자동차의 위치가 정면, 후면을 구분하지 않는 다양함을 가지고, 주변 배경이 충분히 포함되는 상황에서 다양한 크기를 가지는 355장의 영상들을 대상으로 한다. 실험 결과, SVM을 이용한 검증 과정을 거친 방법이 그렇지 않은 경우보다 20%이상 향상된 번호판 추출 성공률을 나타내었다.

  • PDF

RFA: Recursive Feature Addition Algorithm for Machine Learning-Based Malware Classification

  • Byeon, Ji-Yun;Kim, Dae-Ho;Kim, Hee-Chul;Choi, Sang-Yong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권2호
    • /
    • pp.61-68
    • /
    • 2021
  • 최근 악성코드와 정상 바이너리를 분류하기 위해 기계학습을 이용하는 기술이 다양하게 연구되고 있다. 효과적인 기계학습을 위해서는 악성코드와 정상 바이너리를 식별하기 위한 Feature를 잘 추출하는 것이 무엇보다 중요하다. 본 논문에서는 재귀적인 방법을 이용하여 기계학습에 활용하기 위한 Feature 추출 방법인 RFA(Recursive Feature Addition) 제안한다. 제안하는 방법은 기계학습의 성능을 극대화 하기 위해 개별 Feature를 대상으로 재귀적인 방법을 사용하여 최종 Feature Set을 선정한다. 세부적으로는 매 단계마다 개별 Feature 중 최고성능을 내는 Feature를 추출하여, 추출한 Feature를 결합하는 방법을 사용한다. 제안하는 방법을 활용하여 Decision tree, SVM, Random forest, KNN등의 기계학습 알고리즘에 적용한 결과 단계가 지속될수록 기계학습의 성능이 향상되는 것을 검증하였다.

감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템 (A Korean Sentence and Document Sentiment Classification System Using Sentiment Features)

  • 황재원;고영중
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.336-340
    • /
    • 2008
  • 최근 감정 분류에 대한 관심이 높아져 연구가 활발히 진행되고 있다. 문서 전체에 관한 감정의 분류도 중요하지만, 문서를 이루고 있는 문장에 관한 분류도 점차 그 필요성이 높아지고 있다. 본 논문에서는 한국어 감정 분류 시스템 구축을 위해서 추출된 한국어 감정 자질을 이용한 한국어 문장 및 문서 감정 분류에 관해 연구한다. 한국어 감정 분류의 시작은 감정을 내포한 대표적인 어휘로부터 시작하며, 이와 같은 감정 자질들은 문장 및 문서의 감정을 분류하는데 결정적인 관여를 한다. 한국어 감정 자질의 추출을 위하여 영어 단어 시소러스 정보를 이용하여 자질들을 확장하고, 영한사전을 통해 확장된 자질들을 번역함으로써 감정 자질들을 추출하였다. 추출된 감정 자질들을 사용하여, 단어 벡터로 표현된 입력문서를 이진 분류기인 지지벡터 기계(SVM: Support Vector Machine)를 이용하여 문장과 문서에 내포된 감정을 판단하고 평가하였다.

Support Vector Machine Based Phoneme Segmentation for Lip Synch Application

  • Lee, Kun-Young;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.193-210
    • /
    • 2004
  • In this paper, we develop a real time lip-synch system that activates 2-D avatar's lip motion in synch with an incoming speech utterance. To realize the 'real time' operation of the system, we contain the processing time by invoking merge and split procedures performing coarse-to-fine phoneme classification. At each stage of phoneme classification, we apply the support vector machine (SVM) to reduce the computational load while retraining the desired accuracy. The coarse-to-fine phoneme classification is accomplished via two stages of feature extraction: first, each speech frame is acoustically analyzed for 3 classes of lip opening using Mel Frequency Cepstral Coefficients (MFCC) as a feature; secondly, each frame is further refined in classification for detailed lip shape using formant information. We implemented the system with 2-D lip animation that shows the effectiveness of the proposed two-stage procedure in accomplishing a real-time lip-synch task. It was observed that the method of using phoneme merging and SVM achieved about twice faster speed in recognition than the method employing the Hidden Markov Model (HMM). A typical latency time per a single frame observed for our method was in the order of 18.22 milliseconds while an HMM method applied under identical conditions resulted about 30.67 milliseconds.

  • PDF

초분광 영상 특징선택과 밴드비 기법을 이용한 유사색상의 특이재질 검출기법 (Specific Material Detection with Similar Colors using Feature Selection and Band Ratio in Hyperspectral Image)

  • 심민섭;김성호
    • 제어로봇시스템학회논문지
    • /
    • 제19권12호
    • /
    • pp.1081-1088
    • /
    • 2013
  • Hyperspectral cameras acquire reflectance values at many different wavelength bands. Dimensions tend to increase because spectral information is stored in each pixel. Several attempts have been made to reduce dimensional problems such as the feature selection using Adaboost and dimension reduction using the Simulated Annealing technique. We propose a novel material detection method that consists of four steps: feature band selection, feature extraction, SVM (Support Vector Machine) learning, and target and specific region detection. It is a combination of the band ratio method and Simulated Annealing algorithm based on detection rate. The experimental results validate the effectiveness of the proposed feature selection and band ratio method.

계층구조의 분류기에 의한 유도전동기 고장진단 (Fault Diagnosis of Induction Motor by Hierarchical Classifier)

  • 이대종;송창규;이재경;전명근
    • 제어로봇시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.513-518
    • /
    • 2007
  • In this paper, we propose a fault diagnosis scheme tor induction motor by adopting a hierarchical classifier consisting of k-Nearest Neighbors(k-NN) and Support Vector Machine(SVM). First, some motor conditions are classified by a simple k-NN classifier in advance. And then, more complicated classes are distinguished by SVM. To obtain the normal and fault data, we established an experimental unit with induction motor system and data acquisition module. Feature extraction is performed by Principal Component Analysis(PCA). To show its effectiveness, the proposed fault diagnostic system has been intensively tested with various data acquired under the different electrical and mechanical faults with varying load.

SVM 분류기를 통한 심실세동 검출 (SVM Classifier for the Detection of Ventricular Fibrillation)

  • 송미혜;이전;조성필;이경중
    • 전자공학회논문지SC
    • /
    • 제42권5호
    • /
    • pp.27-34
    • /
    • 2005
  • 심실세동은 심장의 무질서한 전기적 활동으로 인해 심근 수축이 동시에 이뤄지지 않게 되어 급성심장사에 이르게 하는 부정맥이다. 본 연구에서는 이러한 심실세동 검출을 위해 적은 양의 학습 데이터만으로 좋은 분류 성능을 보이는 SVM(Support Vector Machine) 분류기 기반의 심실세동 검출 알고리즘을 제안하였다. 심전도 신호로부터 SVM 분류기에 입력할 입력 특징을 추출하기 위하여 웨이브렛 변환기반의 대역통과 필터링, R점 검출, 입력 특징 추출구간 설정의 전처리 과정을 수행하였으며 입력 특징으로는 리듬 기반의 정보 및 웨이브렛 변환 계수를 선택하였다. SVM 다원분류기는 정상리듬(NSR) 분류기, 심실 세동과 유사한 심실빈맥(VT) 분류기, 심실세동(VF) 분류기 그리고 그 외 부정맥 분류기로 구성하였다. SVM 분류기의 파라미터 C값과 ${\alpha}$값은 실험을 통하여 최고 성능을 나타내는 C=10, ${\alpha}=1$을 선택하였다. SVM 다원 분류기를 통한 정상리듬, 심실빈맥 심실세동의 검출 평균값은 98.39%, 96.92%, 99.88%의 우수한 검출 성능을 나타냈다. 본 연구에서 제안된 동일 입력특징을 사용하여 SVM 분류기의 심실세동 검출 결과와 다층퍼셉트론 신경망 및 퍼지추론 방법에 의한 결과를 비교하였으며 SVM 분류기가 비슷하거나 우수한 결과를 보였다. 또한 기존 다른 알고리즘에 비하여도 우수한 결과를 보임으로써 제안된 입력 특징을 통한 SVM 분류기 기반의 심실세동 검출이 유용함을 확인할 수 있었다.

RBF 커널과 다중 클래스 SVM을 이용한 생리적 반응 기반 감정 인식 기술 (Physiological Responses-Based Emotion Recognition Using Multi-Class SVM with RBF Kernel)

  • 마카라 완니;고광은;박승민;심귀보
    • 제어로봇시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.364-371
    • /
    • 2013
  • Emotion Recognition is one of the important part to develop in human-human and human computer interaction. In this paper, we have focused on the performance of multi-class SVM (Support Vector Machine) with Gaussian RFB (Radial Basis function) kernel, which has been used to solve the problem of emotion recognition from physiological signals and to improve the accuracy of emotion recognition. The experimental paradigm for data acquisition, visual-stimuli of IAPS (International Affective Picture System) are used to induce emotional states, such as fear, disgust, joy, and neutral for each subject. The raw signals of acquisited data are splitted in the trial from each session to pre-process the data. The mean value and standard deviation are employed to extract the data for feature extraction and preparing in the next step of classification. The experimental results are proving that the proposed approach of multi-class SVM with Gaussian RBF kernel with OVO (One-Versus-One) method provided the successful performance, accuracies of classification, which has been performed over these four emotions.