• 제목/요약/키워드: classifiers

검색결과 743건 처리시간 0.03초

앙상블 학습을 이용한 적조 발생 예측의 성능향상 (Enhancing of Red Tide Blooms Prediction using Ensemble Train)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.41-48
    • /
    • 2012
  • 적조란 유해조류의 일시적인 대 번식으로 바다를 적색으로 변화시키며 양식장의 어패류를 집단 폐사 시킬 뿐 아니라 연안환경 및 바다 생태계에 악영향을 미치는 자연 현상이다. 적조에 의한 양식어업의 피해는 매년 발생하고 있으며 매년 적조방제에 많은 비용을 소비하고 있다. 이 때문에 적조 발생을 미리 예측할 수 있으면 적조에 대한 피해 및 방재 비용을 최소화 시킬수 있다. 본 논문은 앙상블 학습은 이용한 적조발생 예측 방법을 제안한다. 제안방법은 앙상블 학습의 bagging과 boosting 방법을 이용하여서 적조를 예측의 성능을 향상시킨다. 실험결과 제안방법은 단일 분류기에 비하여서 더 좋은 적조 발생 예측 성능을 보였다.

웨이브릿 변환을 이용한 디지털 변조타입 자동 인식 (Automatic Recognition of Digital Modulation Types using Wavelet Transformation)

  • 박철순;나선필;양종원;최준호
    • 대한전자공학회논문지TC
    • /
    • 제45권4호
    • /
    • pp.22-30
    • /
    • 2008
  • 본 논문은 웨이브릿 변환을 이용하여 사전정보 없이 입사하는 디지털 신호의 변조타입 자동식별 방법에 관한 것이다. 변조인식에 사용되는 특징(key features)은 변조타입에 대한 민감도가 우수하고, SNR에 대한 변화가 적은 속성을 가져야 한다. 잡음에 대한 변화가 적은 속성을 가진 웨이브릿 변환 계수에서 변조인식을 위해 4개의 특징(key features)을 선정하였다. 또한 선정된 특징들을 이용하여 총 8종의 디지털변조 신호를 분류하기 위해 시뮬레이션을 수행하였다. 소프트웨어 라디오의 변조인식 모듈 탑재를 고려하여, 3 타입의 변조인식기에 대한 인식 정확도 및 수행시간을 비교 분석하였다. 시뮬레이션 결과 전체 인식시간은 MDC(Minimum Distance Classifier)와 DTC(Decision Tree Classifier)가 빠르게 수행되었고, 인식정확도는 MDC와 SVMC(Support Vector Machine Classifier)가 우수하게 제시되었다.

가우시안 기반 Hyper-Rectangle 생성을 이용한 효율적 단일 분류기 (An Efficient One Class Classifier Using Gaussian-based Hyper-Rectangle Generation)

  • 김도균;최진영;고정한
    • 산업경영시스템학회지
    • /
    • 제41권2호
    • /
    • pp.56-64
    • /
    • 2018
  • In recent years, imbalanced data is one of the most important and frequent issue for quality control in industrial field. As an example, defect rate has been drastically reduced thanks to highly developed technology and quality management, so that only few defective data can be obtained from production process. Therefore, quality classification should be performed under the condition that one class (defective dataset) is even smaller than the other class (good dataset). However, traditional multi-class classification methods are not appropriate to deal with such an imbalanced dataset, since they classify data from the difference between one class and the others that can hardly be found in imbalanced datasets. Thus, one-class classification that thoroughly learns patterns of target class is more suitable for imbalanced dataset since it only focuses on data in a target class. So far, several one-class classification methods such as one-class support vector machine, neural network and decision tree there have been suggested. One-class support vector machine and neural network can guarantee good classification rate, and decision tree can provide a set of rules that can be clearly interpreted. However, the classifiers obtained from the former two methods consist of complex mathematical functions and cannot be easily understood by users. In case of decision tree, the criterion for rule generation is ambiguous. Therefore, as an alternative, a new one-class classifier using hyper-rectangles was proposed, which performs precise classification compared to other methods and generates rules clearly understood by users as well. In this paper, we suggest an approach for improving the limitations of those previous one-class classification algorithms. Specifically, the suggested approach produces more improved one-class classifier using hyper-rectangles generated by using Gaussian function. The performance of the suggested algorithm is verified by a numerical experiment, which uses several datasets in UCI machine learning repository.

LFSR을 이용한 패턴분류기의 생성 (Generation of Pattern Classifier using LFSRs)

  • 권숙희;조성진;최언숙;김한두;김나령
    • 한국전자통신학회논문지
    • /
    • 제9권6호
    • /
    • pp.673-679
    • /
    • 2014
  • 패턴분류기 설계의 중요한 조건은 데이터 처리량이 크고 저장 공간은 작고 낮은 가격대로 구현하는 것이다. Maji 등에 의해 제안된 MACA 기반의 패턴분류기는 DV와 DS를 사용하여 복잡도를 $O(n^3)$에서 O(n)으로 줄였다. 본 논문에서는 효율적으로 시간과 공간의 복잡성을 개선하기 위해 LFSR 기반 패턴 분류기를 생성하고 0-기본경로를 이용하여 DV를 구할 수 있는 방법을 제안한다. 그리고 생성한 패턴분류기의 DV와 끌개에 대해 살펴본다. n-비트 DS=(11 ${\cdots}$ 11)를 m개의 $DV_i$로 분할할 수 있고 다양한 패턴분류기를 생성할 수 있다.

온라인 리뷰에서 평점의 분류 (Classification of ratings in online reviews)

  • 최동준;최호식;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.845-854
    • /
    • 2016
  • 감성분석 (sentiment analysis) 혹은 오피니언 마이닝 (opinion mining)은 블로그, 리뷰, 신문기사나 소셜네트워크 등의 문서에서 개인의 주관적인 정보 혹은 의견을 알아보는데 사용되는 텍스트 마이닝의 기법이다. 평점이 있는 온라인 리뷰에서 리뷰 텍스트에 기반한 평점의 분류문제에 대한 선행연구에서는 이진 분류만을 고려하였다. 그러나 긍정과 부정 외에도 중립적인 의견도 있을 수 있기 때문에 이진 분류보다는 다범주 분류가 더 적합할 것이다. 본 연구에서는 리뷰 텍스트에 기반한 평점의 다범주 분류문제를 고려한다. 전처리에서는 카이제곱 통계량을 이용하여 평점과 연관된 단어들을 추출하고 이를 입력변수로 삼아 지지벡터기계 (support vector machines)와 비례오즈 모형 (proportional odds model) 등 다범주 분류기의 예측력을 비교한다.

Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안 (Effective Korean sentiment classification method using word2vec and ensemble classifier)

  • 박성수;이건창
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.133-140
    • /
    • 2018
  • 감성 분석에서 정확한 감성 분류는 중요한 연구 주제이다. 본 연구는 최근 많은 연구가 이루어지는 word2vec과 앙상블 방법을 이용하여 효과적으로 한국어 리뷰를 감성 분류하는 방법을 제시한다. 연구는 20 만 개의 한국 영화 리뷰 텍스트에 대해, 품사 기반 BOW 자질과 word2vec를 사용한 자질을 생성하고, 두 개의 자질 표현을 결합한 통합 자질을 생성했다. 감성 분류를 위해 Logistic Regression, Decision Tree, Naive Bayes, Support Vector Machine의 단일 분류기와 Adaptive Boost, Bagging, Gradient Boosting, Random Forest의 앙상블 분류기를 사용하였다. 연구 결과로 형용사와 부사를 포함한 BOW자질과 word2vec자질로 구성된 통합 자질 표현이 가장 높은 감성 분류 정확도를 보였다. 실증결과, 단일 분류기인 SVM이 가장 높은 성능을 나타내었지만, 앙상블 분류기는 단일 분류기와 비슷하거나 약간 낮은 성능을 보였다.

Support Vector Machine을 이용한 문맥 인지형 융합 (Context-Aware Fusion with Support Vector Machine)

  • 허경용;김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.19-26
    • /
    • 2014
  • 앙상블 분류기는 여러 개의 분류기에서의 예측 결과를 결합함으로써 단일 분류기에 비해 신뢰성 높은 예측 결과를 얻을 수 있는 방법으로 널리 사용되고 있다. 앙상블 분류기를 위해서는 여러 가지 방법이 사용되고 있으며 흔히 사용되는 방법으로는 부스팅이 있다. 하지만 부스팅은 단계적인 학습을 통해 이전 단계에서 잘못 분류된 샘플들을 다음 단계에서 다시 분류하는 방식으로 이전 단계로의 피드백이 불완전한 순차적인 방법이라는 한계가 있다. 이 논문에서는 단일 분류기 중 가장 성능이 좋은 것으로 알려진 SVM을 기본분류기로 사용하여 동시에 여러개의 SVM을 학습하는 문맥 감지형 SVM 앙상블알고리즘을 제안한다. 제안하는 방법에서는 특징 공간을 문맥으로 나누는 클러스터링과 SVM 학습을 동시에 진행하므로 특징 공간 분할과 학습이 서로의 결과를 사용할 수 있어 기존 앙상블학습에 비해 더 나은 결과를 얻을 수 있으며 이는 실험 결과를 통해 확인할 수 있다.

다단계 퓨전기법을 이용한 비유사도 기반 식별기의 최적화 (On Optimizing Dissimilarity-Based Classifier Using Multi-level Fusion Strategies)

  • 김상운;로버트 듀인
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.15-24
    • /
    • 2008
  • 얼굴인식 등과 같은 고차원 식별문제에서는 샘플패턴의 수가 패턴의 차원보다 작아지게 된다. 이러한 상황에서 차원을 축소하기위해 선형판별분석법을 적용할 경우, 희소성(Small Sample Size: SSS)문제가 발생한다. 최근, SSS 문제를 해결하기 위하여 비유사도에 기반 한 식별법(Dissimilarity-Based Classification: DBC)을 이용하는 방법이 검토되었다. DBC에서는 특징 벡터 대신에 학습 샘플들로부터 추출한 프로토타입들과의 비유사도를 측정하여 입력 패턴을 식별하는 방법이다. 본 논문에서는 비유사도 표현단계와 DBC 학습단계에서 퓨전기법을 중복 적용하는 다단계 퓨전기법(Multi-level Fusion Strategies: MFS)으로 DBCs를 최적화시키는 방법을 제안한다. 제안 방법을 벤취마크 얼굴영상 데이터베이스를 대상으로 실험한 결과, 식별률을 향상시킬 수 있음을 확인하였다.

얼굴정렬과 AdaBoost를 이용한 얼굴 표정 인식 (Facial Expression Recognition using Face Alignment and AdaBoost)

  • 정경중;최재식;장길진
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.193-201
    • /
    • 2014
  • 본 논문에서는 얼굴영상에 나타난 사람의 표정을 인식하기 위해 얼굴검출, 얼굴정렬, 얼굴단위 추출, 그리고 AdaBoost를 이용한 학습 방법과 효과적인 인식방법을 제안한다. 입력영상에서 얼굴 영역을 찾기 위해서 얼굴검출을 수행하고, 검출된 얼굴영상에 대하여 학습된 얼굴모델과 정렬(Face Alignment)을 수행한 후, 얼굴의 표정을 나타내는 단위요소(Facial Units)들을 추출한다. 본 논문에서 제안하는 얼굴 단위요소들을 표정을 표현하기 위한 기본적인 액션유닛(AU, Action Units)의 하위집합으로 눈썹, 눈, 코, 입 부분으로 나눠지며, 이러한 액션유닛에 대하여 AdaBoost 학습을 수행하여 표정을 인식한다. 얼굴유닛은 얼굴표정을 더욱 효율적으로 표현할 수 있고 학습 및 테스트에서 동작하는 시간을 줄여주기 때문에 실시간 응용분야에 적용하기 적합하다. 실험결과, 제안하는 표정인식 시스템은 실시간 환경에서 90% 이상의 우수한 성능을 보여준다.

워드 임베딩을 이용한 아마존 패션 상품 리뷰의 사용자 감성 분석 (User Sentiment Analysis on Amazon Fashion Product Review Using Word Embedding)

  • 이동엽;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제8권4호
    • /
    • pp.1-8
    • /
    • 2017
  • 현대 사회에서 패션 시장의 규모는 해외와 국내 모두 지속적으로 증가하고 있다. 전자상거래를 통해 상품을 구입하는 경우 다른 소비자들이 작성한 상품에 대한 평가 데이터는 소비자가 상품의 구입 여부를 결정하는데에 영향을 미친다. 기업의 입장에서도 상품에 대한 소비자의 평가 데이터를 분석하여 소비자의 피드백을 반영한다면 기업의 성과에 긍정적인 영향을 미칠 수 있다. 이에 본 논문에서는 아마존 패션 상품의 리뷰 데이터를 학습하여 형성된 워드임베딩 공간을 이용하여 사용자의 감성을 분석하는 모델을 구축하는 방법을 제안한다. 실험은 아마존 리뷰 데이터 570만건을 학습하여 형성된 워드임베딩 공간을 이용하여 긍정, 부정 리뷰 데이터의 개수에 따라 총 3개의 SVM 분류기 모델을 학습하는 방식으로 진행하였다. 실험 결과 긍정 리뷰 데이터 5만건, 부정 리뷰데이터 5만건을 이용하여 SVM 분류기를 학습하였을 때 88.0%로 가장 높은 정확도(accuracy)를 나타냈다.