• 제목/요약/키워드: multiple classifiers

검색결과 98건 처리시간 0.03초

커널 주성분 분석의 앙상블을 이용한 다양한 환경에서의 화자 식별 (Speaker Identification on Various Environments Using an Ensemble of Kernel Principal Component Analysis)

  • 양일호;김민석;소병민;김명재;유하진
    • 한국음향학회지
    • /
    • 제31권3호
    • /
    • pp.188-196
    • /
    • 2012
  • 본 논문에서는 커널 주성분 분석 (KPCA, kernel principal component analysis)으로 강화한 화자 특징을 이용하여 복수의 분류기를 학습하고 이를 앙상블 결합하는 화자 식별 방법을 제안한다. 이 때, 계산량과 메모리 요구량을 줄이기 위해 전체 화자 특징 벡터 중 일부를 랜덤 선택하여 커널 주성분 분석의 기저를 추정한다. 실험 결과, 제안한 방법이 그리디 커널 주성분 분석 (GKPCA, greedy kernel principal component analysis)보다 높은 화자 식별률을 보였다.

Adaboost 최적 특징점을 이용한 차량 검출 (Vehicle Detection Using Optimal Features for Adaboost)

  • 김규영;이근후;김재호;박장식
    • 한국전자통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1129-1135
    • /
    • 2013
  • 본 논문에서는 최적 특징점 선택기법를 적용한 다중 최적 Adaboost 분류기를 기반으로 새로운 차량 검출 알고리즘을 제안한다. 제안하는 알고리즘은 2 가지 주요 모듈로 구성된다. 첫 번째는 설치된 카메라의 사이트 모델링을 이용한 영상 스케일링을 기반으로 하는 이론적 DDISF(Distance Dependent Image Scaling Factor) 모듈이며, 두 번째는 차량과 카메라의 거리에 대응하는 최적 Haar-like 특징을 활용하는 것이다. 실험 결과 제안하는 알고리즘은 기존의 방법에 비하여 인식 성능이 개선됨을 확인하였다. 제안하는 알고리즘은 96.43% 의 인식률과 약 3.77%의 오검출이 발생하였다. 이러한 성능은 기존의 표준 Adabooost 알고리즘에 비하여 각각 3.69%와 1.28% 의 성능을 개선한 것이다.

DLDW: Deep Learning and Dynamic Weighing-based Method for Predicting COVID-19 Cases in Saudi Arabia

  • Albeshri, Aiiad
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.212-222
    • /
    • 2021
  • Multiple waves of COVID-19 highlighted one crucial aspect of this pandemic worldwide that factors affecting the spread of COVID-19 infection are evolving based on various regional and local practices and events. The introduction of vaccines since early 2021 is expected to significantly control and reduce the cases. However, virus mutations and its new variant has challenged these expectations. Several countries, which contained the COVID-19 pandemic successfully in the first wave, failed to repeat the same in the second and third waves. This work focuses on COVID-19 pandemic control and management in Saudi Arabia. This work aims to predict new cases using deep learning using various important factors. The proposed method is called Deep Learning and Dynamic Weighing-based (DLDW) COVID-19 cases prediction method. Special consideration has been given to the evolving factors that are responsible for recent surges in the pandemic. For this purpose, two weights are assigned to data instance which are based on feature importance and dynamic weight-based time. Older data is given fewer weights and vice-versa. Feature selection identifies the factors affecting the rate of new cases evolved over the period. The DLDW method produced 80.39% prediction accuracy, 6.54%, 9.15%, and 7.19% higher than the three other classifiers, Deep learning (DL), Random Forest (RF), and Gradient Boosting Machine (GBM). Further in Saudi Arabia, our study implicitly concluded that lockdowns, vaccination, and self-aware restricted mobility of residents are effective tools in controlling and managing the COVID-19 pandemic.

Toward Practical Augmentation of Raman Spectra for Deep Learning Classification of Contamination in HDD

  • Seksan Laitrakun;Somrudee Deepaisarn;Sarun Gulyanon;Chayud Srisumarnk;Nattapol Chiewnawintawat;Angkoon Angkoonsawaengsuk;Pakorn Opaprakasit;Jirawan Jindakaew;Narisara Jaikaew
    • Journal of information and communication convergence engineering
    • /
    • 제21권3호
    • /
    • pp.208-215
    • /
    • 2023
  • Deep learning techniques provide powerful solutions to several pattern-recognition problems, including Raman spectral classification. However, these networks require large amounts of labeled data to perform well. Labeled data, which are typically obtained in a laboratory, can potentially be alleviated by data augmentation. This study investigated various data augmentation techniques and applied multiple deep learning methods to Raman spectral classification. Raman spectra yield fingerprint-like information about chemical compositions, but are prone to noise when the particles of the material are small. Five augmentation models were investigated to build robust deep learning classifiers: weighted sums of spectral signals, imitated chemical backgrounds, extended multiplicative signal augmentation, and generated Gaussian and Poisson-distributed noise. We compared the performance of nine state-of-the-art convolutional neural networks with all the augmentation techniques. The LeNet5 models with background noise augmentation yielded the highest accuracy when tested on real-world Raman spectral classification at 88.33% accuracy. A class activation map of the model was generated to provide a qualitative observation of the results.

Classification of algae in watersheds using elastic shape

  • Tae-Young Heo;Jaehoon Kim;Min Ho Cho
    • Communications for Statistical Applications and Methods
    • /
    • 제31권3호
    • /
    • pp.309-322
    • /
    • 2024
  • Identifying algae in water is important for managing algal blooms which have great impact on drinking water supply systems. There have been various microscopic approaches developed for algae classification. Many of them are based on the morphological features of algae. However, there have seldom been mathematical frameworks for comparing the shape of algae, represented as a planar continuous curve obtained from an image. In this work, we describe a recent framework for computing shape distance between two different algae based on the elastic metric and a novel functional representation called the square root velocity function (SRVF). We further introduce statistical procedures for multiple shapes of algae including computing the sample mean, the sample covariance, and performing the principal component analysis (PCA). Based on the shape distance, we classify six algal species in watersheds experiencing algal blooms, including three cyanobacteria (Microcystis, Oscillatoria, and Anabaena), two diatoms (Fragilaria and Synedra), and one green algae (Pediastrum). We provide and compare the classification performance of various distance-based and model-based methods. We additionally compare elastic shape distance to non-elastic distance using the nearest neighbor classifiers.

행정 빅데이터 환경에서 컷오프-투표 분류기를 활용한 빅데이터 예측모형의 실험 (Operation Plan of Big Data Prediction Model using Cut-off-Voting Classifier in Administrative Big Data Environment)

  • 이우식
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.145-154
    • /
    • 2024
  • 행정 빅데이터를 활용하는 예측 모형을 운영하기 위해서는 정책의 변화 및 변동성 심한 데이터의 특성이 고려가 되어야만 한다. 이런 상황을 고려하여 본 연구에서는 Cut-off Voting Classifier(CVC) 알고리즘을 제안한다. 제안하는 알고리즘은 여러개의 약 분류기를 활용하여 적중률이 급격하게 하락하는 것을 방지하는 알고리즘이다. 본 연구에서는 제안하는 알고리즘을 실험을 통해 성능을 검증한다. 성능검증 결과 급격하게 예측모형 적중률이 하락하는 상황에서도 안정적으로 예측률을 유지한다는 것을 입증할 수 있었다.

Text Classification with Heterogeneous Data Using Multiple Self-Training Classifiers

  • William Xiu Shun Wong;Donghoon Lee;Namgyu Kim
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.789-816
    • /
    • 2019
  • Text classification is a challenging task, especially when dealing with a huge amount of text data. The performance of a classification model can be varied depending on what type of words contained in the document corpus and what type of features generated for classification. Aside from proposing a new modified version of the existing algorithm or creating a new algorithm, we attempt to modify the use of data. The classifier performance is usually affected by the quality of learning data as the classifier is built based on these training data. We assume that the data from different domains might have different characteristics of noise, which can be utilized in the process of learning the classifier. Therefore, we attempt to enhance the robustness of the classifier by injecting the heterogeneous data artificially into the learning process in order to improve the classification accuracy. Semi-supervised approach was applied for utilizing the heterogeneous data in the process of learning the document classifier. However, the performance of document classifier might be degraded by the unlabeled data. Therefore, we further proposed an algorithm to extract only the documents that contribute to the accuracy improvement of the classifier.

마이크로어레이 기반 miRNA 모듈 분석을 위한 하이퍼망 분류 기법 (Hypernetwork Classifiers for Microarray-Based miRNA Module Analysis)

  • 김선;김수진;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.347-356
    • /
    • 2008
  • 마이크로어레이는 분자 생물학 실험에 있어 중요한 도구로 사용되고 있으며, 마이크로어레이 데이타 분석을 위한 다양한 계산학적 방법이 개발되어 왔다. 그러나, 기존 분석방법은 주어진 조건에 영향을 주는 개별 유전자를 추출하는 데 강한 방면, 유전자 간의 복합작용에 의한 영향을 분석하기 힘들다는 단점을 가지고 있다. 하이퍼망 모델은 생물학적인 네트워크 작용을 모방한 구조이며, 계산과정에서 요소간의 복합작용을 직접 고려하기 때문에 기존 방법에서 다루기 힘들었던 요소간 상호작용 분석이 가능하다는 장점을 가진다. 본 논문에서는 마이크로어레이 데이타를 기반으로 microRNA(miRNA) 프로파일 분석을 위한 하이퍼망 분류 기법을 소개한다. 하이퍼망 분류기는 miRNA 쌍을 기본 요소로 하여 진화 과정을 통해 miRNA 분류 데이타를 학습한다. 학습된 하이퍼망으로부터 유의하다.고 판단되는 miRNA 모듈을 쉽게 추출할 수 있으며, 사용자는 추출된 모듈의 유치미성을 직접 판단할 수 있다. 하이퍼망 분류기는 암 관련 miRNA 발현 데이타 분류 실험을 통해 91.46%의 정확도를 보임으로써 기존 기계학습 방법에 비해 뛰어난 성능을 보여주었으며, 하이퍼망 분석을 통해 생물학적으로 유의한 miRNA 모듈을 찾을 수 있음을 확인하였다.

얼굴의 등고선 영역을 이용한 퍼지적분 기반의 3차원 얼굴 인식 (3D Face Recognition in the Multiple-Contour Line Area Using Fuzzy Integral)

  • 이영학
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.423-433
    • /
    • 2008
  • 얼굴 표면에 대한 곡률의 특성은 사람의 특징을 나타내는 중요 요소 중의 하나이며, 깊이 간에 따른 얼굴의 형상 또한 사람마다 다른 모양을 가지고 있으므로 중요한 특징의 하나로 간주 될 수 있다. 본 논문은 3차원 얼굴 영상으로부터 추출된 표면 곡률을 얼굴의 등고선 값에 따라 추출된 영역에 대하여 퍼지적분을 이용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대한 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 사람마다 서로 다른 형상 특징을 가지게 된다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 얼굴의 표면 특성 정보인 주 곡률, 평균 곡률 그리고 가우시안 곡률 값을 추출한다. 각각의 등고선 영역에 대해 차원의 감소를 위하여 고유 얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형판별분석 알고리즘을 이용하여 유사도를 비교하였다. 그리고 클래스간의 분별 정보를 등고선 영역들에 대해 퍼지적분 방법을 사용하여 인식률을 향상 시켰다. 제안된 방법으로 수행한 결과, 코끝으로부터 깊이 값 40 (DT 40)인 등고선 영역이 가장 높은 인식률을 나타내었으며, 퍼지적분을 사용한 방법이 다른 알고리즘보다 놀은 인식률을 나타내었으며, 곡률은 주 곡률의 최대 곡률이 98%의 높은 인식률을 나타내었다.

  • PDF

다중 생체신호를 이용한 신경망 기반 전산화 감정해석 (Neural-network based Computerized Emotion Analysis using Multiple Biological Signals)

  • 이지은;김병남;유선국
    • 감성과학
    • /
    • 제20권2호
    • /
    • pp.161-170
    • /
    • 2017
  • 감정은 학습능력, 행동, 판단력 등 삶의 많은 부분에 영향을 끼치므로 인간의 본질을 이해하는 데 중요한 역할을 한다. 그러나 감정은 개인이 느끼는 강도가 다르며, 시각 영상 자극을 통해 감정을 유도하는 경우 감정이 지속적으로 유지되지 않는다. 이러한 문제점을 극복하기 위하여 총 4가지 감정자극(행복, 슬픔, 공포, 보통) 시 생체신호(뇌전도, 맥파, 피부전도도, 피부 온도)를 획득하고, 이로부터 특징을 추출하여 분류기의 입력으로 사용하였다. 감정 패턴을 확률적으로 해석하여 다른 공간으로 매핑시켜주는 역할을 하는 Restricted Boltzmann Machine (RBM)과 Multilayer Neural Network (MNN)의 은닉층 노드를 이용하여 비선형적인 성질의 감정을 구별하는 Deep Belief Network (DBN) 감정 패턴 분류기를 설계하였다. 그 결과, DBN의 정확도(약 94%)는 오류 역전파 알고리즘의 정확도(약 40%)보다 높은 정확도를 가지며 감정 패턴 분류기로서 우수성을 가짐을 확인하였다. 이는 향후 인지과학 및 HCI 분야 등에서 활용 가능할 것으로 사료된다.