• 제목/요약/키워드: 다중 클래스 분류

검색결과 134건 처리시간 0.022초

다중 클래스 분류를 위한 FSVM (FSVM for Multi Class Classification)

  • 이선영;김성수
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 D
    • /
    • pp.3004-3006
    • /
    • 2005
  • Support vector machine(SVM)은 입력 데이터를 두개의 다른 클래스로 구별하는 결정면을 학습과정을 통하여 구한다. 기존의 SVM은 단지 이차 클래스에 대하여 적용되어지나, 많은 응용분야에서 입력 데이터들은 몇 개의 다중 클래스로 분류해야 한다. 다중 클래스 분류 문제는 기존의 SVM을 사용할 수 있는 일반적으로 몇 개의 2차 문제로 분해하여 풀 수 있다. 실례로 one-against-all 방법을 적용하면, n 클래스 문제는 n 개의 두 클래스 문제로 변환 하여 풀 수 있다. 본 논문에서는 입력 패턴들을 다중 클래스로 분류 할 때 퍼지 소속도를 응용한 소프트 마진 알고리즘의 상한 경계값을 각 클래스에 따라 다르게 적용함으로써 기존의 SVM 보다 더 우수한 학습 능력을 가짐을 보였다.

  • PDF

SVM 학습을 이용한 다중 클래스 뉴스그룹 문서 분류 (Classification of Multiclass Newsgroup Documents Using SVM Learning)

  • 오장민;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.60-62
    • /
    • 1999
  • 다중 클래스 문서분류는 주어진 여러 개의 관심사별로 문서를 선별해 주는 문제이다. 문서 분류 문제의 특징은 문서가 매우 높은 차원으로 표현된다는 것이다. 다른 학습 알고리즘에 비해 SVM 알고리즘은 차원을 전혀 줄이지 않고 문제를 해결한다. 본 논문에서는 SVM 학습 알고리즘을 이용하여 대규모의 뉴스 그룹 문서 분류 문제를 다룬다. 다중 클래스 문서 분류를 위해서 각 클래스에 대한 SVM학습 결과를 효과적으로 결합하였으며 실험을 통하여 SVM과 다른 학습 알고리즘과의 성능을 비교하였다.

  • PDF

나이브 베이스 분류기를 이용한 유전발현 데이타기반 암 분류를 위한 순위기반 다중클래스 유전자 선택 (Rank-based Multiclass Gene Selection for Cancer Classification with Naive Bayes Classifiers based on Gene Expression Profiles)

  • 홍진혁;조성배
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권8호
    • /
    • pp.372-377
    • /
    • 2008
  • 최근 활발히 연구가 진행 중인 유전발현 데이타를 이용한 다중클래스 암 분류는 DNA 마이크로어레이로부터 획득된 대규모의 유전자 정보를 분석하여 암의 종류를 판단한다. 수집된 유전발현 데이타에는 대상 암과 관련이 없는 유전자도 포함되어 있기 때문에 높은 성능의 분류 결과를 얻기 위해서 유용한 유전자를 선택하는 것이 필요하다. 기존의 순위기반 유전자 선택은 이진클래스를 대상으로 고안되었고 이상표식 유전자(Ideal marker gene)를 이용하기 때문에 다중클래스 암 분류에 직접 적용하기에는 한계가 있다. 본 논문에서는 이상표식 유전자를 사용하지 않고 유전발현 수준의 분포를 직접 분석하는 순위기반 다중클래스 유전자 선택 기법을 제안한다. 유전발현 수준을 이산화하고 학습 데이타로부터 빈도를 계산하여 클래스 간 분별력을 측정한 후, 선택된 유전자를 이용하여 나이브 베이즈 분류기를 사용해 다중 암 분류를 수행한다. 제안하는 방법을 다수의 다중클래스 암 분류 데이타에 적용하여 기존 유전자 선택 방법에 비해 우수함을 확인하였다.

다중 클래스 SVMs를 이용한 얼굴 인식의 성능 개선 (The Performance Improvement of Face Recognition Using Multi-Class SVMs)

  • 박성욱;박종욱
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.43-49
    • /
    • 2004
  • 기존의 다중 클래스 SVMs은 클래스의 개수가 증가되면, 이진 클래스 SVMs의 수도 증가되어 분류를 위해 많은 시간이 요구된다. 본 논문에서는 분류 시간을 줄이기 위하여, PCA+LDA 특징 부 공간에서 NNR을 적용하여 클래스의 개수를 줄이는 방법을 제안한다. 제안된 방법은 PCA+LDA 특징 부 공간에서 간단한 NNR을 사용하여, 입력된 테스트 특징 데이터와 근접된 얼굴 클래스들을 추출함으로서 얼굴 클래스의 개수를 줄이는 방법이다. 클래스 개수를 줄임으로, 본 방법은 기존의 다중 클래스 SVMs에 비하여 훈련 횟수와 비교 횟수를 줄일 수 있고, 결과적으로 하나의 테스트 영상을 위한 분류 시간을 크게 줄일 수 있다. 또한 실험 결과, 제안된 방법은 NNC 기법보다 낮은 에러 율을 가지며, 기존의 다중 클래스 SVMs보다 동일한 에러 율을 갖지만, 보다 빠른 분류시간을 가짐을 확인할 수 있었다.

다중 클래스 아다부스트 알고리즘 (Multiclass-based AdaBoost Algorithm)

  • 김태현;박동철
    • 전자공학회논문지CI
    • /
    • 제48권1호
    • /
    • pp.44-50
    • /
    • 2011
  • 본 논문은 다중 클래스 데이터의 효율적 분류를 위한 새로운 아다부스트 알고리즘을 제안한다. 기존의 아다부스트 알고리즘은 기본적으로 이진 분류기이므로 다중 클래스 데이터 분류의 적용에는 매우 제한적이었다. 이를 극복하기 위하여 제안된 알고리즘은 여러 개의 이진 분류기 대신 하나의 다중 분류기를 약 분류기로 사용함으로써 학습시간을 단축시키고 안정적인 정확도를 얻을 수 있는 장점이 있다. 제안하는 알고리즘의 성능을 평가하기 위하여 Caltech 영상 데이터베이스에서 4가지클래스의 영상 데이터를 총 800개 수집하여 영상 분류 실험을 진행하였다. 실험의 결과 제안된 다중 클래스 아다부스트 알고리즘은 Adaboost.M2 알고리즘에 비해 분류정확도는 대등한 결과를 얻었지만, 학습시간을 학습단계에 따라 83.1%까지 감소시킬 수 있었다.

Hyperion 영상의 분류를 위한 밴드 추출 (Feature Selection for Image Classification of Hyperion Data)

  • 한동엽;김혜진;김대성;조영욱;김용일
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.94-99
    • /
    • 2003
  • 다중분광 영상의 정확한 지형지물 분류를 수행하기 위하여 분류 클래스의 훈련지역 선정과 선정된 클래스의 분리도 분포가 중요하다. 최근에 이용되고 있는 위성탑재 초다중분광 영상은 많은 밴드를 포함하고 있기 때문에 데이터 처리가 어렵고, 노이즈로 인하여 다중분광 영상보다 분류 결과가 나쁜 경우도 나타난다. 특히 대상지역의 클래스에 따른 훈련지역의 선정시 밴드수에 비해 상대적으로 제한된 훈련화소 크기로 인하여 공분산 행렬의 계산에 어려움이 따른다. 따라서 본 연구에서는 Hyperion 데이터를 이용한 분류를 수행하기 위하여 필요한 유효 밴드 추출 방식을 알아보고, 분류영상의 정확도 평가를 통하여 추출된 밴드와 분류 클래스의 적합성 관계를 확인하고자 한다 이 과정에서 클래스 분리도를 이용하여 정확도 평가 이전에 밴드와 클래스 선정의 타당성을 확인할 수 있다.

  • PDF

다중 클래스 분류를 위한 강인한 SVM 설계 방법 - 생체 인식 데이터에의 적용 - (Robust SVM Design for Multi-Class Classification - Application to Biometric data -)

  • 조민국;박혜영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.760-762
    • /
    • 2005
  • Support vector machine(SVM)은 졸은 일반화 능력을 가진 학습시스템으로, 최근 다양한 패턴 인식 분야에서 적용되고 있다. SVM은 기본적으로 이진 분류기이므로 두 개 이상의 클래스를 분류하기 위해서는 다중 클래스 분류가 가능한 형태로의 설계 방법이 필요하다. 이를 위해 각 클래스별로 독립적인 SVM들을 만들어 결과를 병합하는 방식이 주로 사용되어 왔다. 그러나 이러한 방법은 클래스의 수는 않고 한 클래스 내의 데이터의 수가 많지 않은 경우에는 SVM의 일반화 성능을 저하시키고 노이즈에 민감해지는 문제점을 가지고 있다. 이를 해결하기 위해 본 논문에서는 각 클래스내의 데이터간의 유사도 측정을 위한 통계적 정보를 안정적으로 추출하기 위해 두 데이터의 쌍을 입력으로 받는 새로운 SVM 설계 방법을 제시한다. 제안한 방법을 실제 생체인식 데이터에 적용한 실험에서 기존의 방법보다 우수한 분류 성능을 보임을 확인할 수 있었다.

  • PDF

다중결정템플릿기반 SVM결합모델을 통한 지문분류 (Fingerprint Classification Using SVM Combination Models based on Multiple Decision Templates)

  • 민준기;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2005
  • 지문을 5가지 클래스로 나누는 헨리시스템을 기반으로 신경망이나 SVM(Support Vector Machines) 등과 같은 다양한 패턴분류 기법들이 지문분류에 많이 사용되고 있다. 특히 최근에는 높은 분류 성능을 보이는 SVM 분류기의 결합을 이용한 연구가 활발히 진행되고 있다. 지문은 클래스 구분이 모호한 영상이 많아서 단일결합모델로는 분류에 한계가 있다. 이를 위해 본 논문에서는 새로운 분류기 결합모델인 다중결정템플릿(Multiple Decision Templates, MuDTs)을 제안한다. 이 방법은 하나의 지문클래스로부터 서로 다른 특성을 갖는 클러스터들을 추출하여 각 클러스터에 적합한 결합모델을 생성한다. NIST-database4 데이터로부터 추출한 핑거코드에 대해 실험한 결과. 5클래스와 4클래스 분류문제에 대하여 각각 $90.4\%$$94.9\%$의 분류성능(거부율 $1.8\%$)을 획득하였다.

  • PDF

Support Vector Machines을 이용한 다중 클래스 문제 해결 (Solving Multi-class Problem using Support Vector Machines)

  • 고재필
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권12호
    • /
    • pp.1260-1270
    • /
    • 2005
  • 최근 기계학습 분야에서 커널머신을 이용한 대표적 학습기로 Support Vector Machines (SVM)이 주목 받고 있다. SVM은 통계적 학습이론에 기반하여 뛰어난 일반화 성능을 보여주며, 다양한 패턴인식 문제에 적용되고 있다. 그러나. SVM은 이진 분류기이므로 일반적인 다중 클래스 문제에 곧바로 적용할 수 없다. SVM을 다중 클래스 문제의 하나인 얼굴인식에 도입하기 위한 방법으로는, One-Per-Class와 All-Pairs가 대표적이다. 상기 두 방법은 다중 클래스 문제를 여러 개의 이진 클래스 문제로 분할하고, 이들을 다시 종합하여 최종 결정을 내리는 출력코딩이라는 일반적인 방법에 속한다. 본 논문에서는 이진 분류기인 SVM의 다중 클래스 분류기 확장 방안으로 출력코딩 방법론을 설명한다. 또한 출력코딩 방법론의 대표적인 이론적 기반인 ECOC(Ewor-Correcting Output Codes)를 근간으로 하는 새로운 출력코딩 방법들을 제안하고, 얼굴인식 실험을 통해 SVM을 기반 분류기로 사용할 경우의, 출력코딩 방법의 특성을 비교$\cdot$분석한다.

신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화 (Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets)

  • 박예원;양동일;김수필;이강욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-22
    • /
    • 2019
  • FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.

  • PDF