• 제목/요약/키워드: 분류기 알고리즘

검색결과 596건 처리시간 0.031초

명제화된 어트리뷰트 택소노미를 이용하는 나이브 베이스 학습 알고리즘 (Naive Bayes Learner for Propositionalized Attribute Taxonomy)

  • 강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.406-409
    • /
    • 2008
  • 본 논문에서는 명제화된 어트리뷰트 택소노미를 이용하여 간결하고 강건한 분류기를 생성하는 문제를 고려한다. 이 문제를 해결하기 위해 명제화된 어트리뷰트 택소노미(Propositionalized Attribute Taxonomy)를 이용하는 나이브 베이스 학습 알고리즘(Naive Bayes Learner)인 PAT-NBL을 소개한다. PAT-NBL은 명제화 된 어트리뷰트들의 택소노미를 선험 지식으로 이용하여 간결하고 정확한 분류기를 귀납적으로 학습하는 알고리즘이다. PAT-NBL은 주어진 택소노미에서 지역적으로 최적의 컷(cut)을 찾아내기 위해 하향식 탐색과 상향식 탐색을 사용한다. 찾아낸 최적의 컷은 명제화 된 어트리뷰트 택소노미와 데이터로부터 그에 상응하는 인스턴스 공간(instance space)을 구성할 수 있게 해준다. University of California-Irvine (UCI) 저장소의 기계학습 벤치마크 데이터에 대한 실험 결과를 보면, 제안된 알고리즘이 표준적인 나이브 베이스 학습 알고리즘에 의해 만들어진 분류기들과 비교해 볼 때, 가끔은 보다 간결하고 더 정확한 분류기를 생성해 낸다는 사실을 알 수 있었다.

  • PDF

음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘 (New Automatic Taxonomy Generation Algorithm for the Audio Genre Classification)

  • 최택성;문선국;박영철;윤대희;이석필
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.111-118
    • /
    • 2008
  • 본 논문에서는 음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘을 제안한다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된 분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는 것이다. 제안된 알고리즘에서의 분류 확률 예측은 훈련 데이터를 k-fold cross validation을 이용하여 분류기에 적용함으로써 이루어진다. 제안된 알고리즘을 기반으로 한 분류 성능 측정은 2 클래스로 이루어진 각각의 노드에 2개 범주 분류에 효과적인 support vector machine을 적용함으로써 이루어진다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 알고리즘과 기존의 다중 범주 분류기들을 이용하여 분류성능을 평가하였다. 다양한 실험결과 제안된 알고리즘은 기존의 알고리즘에 비하여 5%에서 25%정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터를 이용한 분류 실험에서는 10% 에서 25% 향상된 좋은 성능을 보였다.

가상예제를 이용한 $Na{\ddot{i}}ve$ Bayes 분류기 성능 향상 (Improving Performance for $Na{\ddot{i}}ve$ Bayes Classifier Using Virtual Examples)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.655-657
    • /
    • 2005
  • 기계학습에서 분류는 훈련 예제들로 학습하여 생성한 분류기를 활용하여 새로운 예제에 어느 한 범주를 부여하는 것을 말한다. 일반적으로 분류의 성능 즉 정확도의 향상은 학습 알고리즘을 개선하거나 훈련예제 집합을 변형시킴으로써 가능하다. 본 논문에서 소개하는 가상예제를 이용한 분류기 성능 향상 방안은 후자에 속한다. 실세계 분류문제에서 많은 수의 훈련예제들을 수집하는 일은 대상문제에 따라 비용이 많이 드는 경우가 있다. 또한 적은 수의 훈련예제를 학습해 생성한 분류기는 분류성능이 좋지 않을 수 있다. 본 논문에서는 이런 문제를 해결하기 위해서 가상예제를 생성해 훈련예제 집합에 추가하는 방안을 제안하고자 한다. 가상예제를 이용한 분류성능 향상방안이 $Na{\ddot{i}}ve$ Bayes 학습 알고리즘 성능 개선에 효과가 있음을 실험을 통해 확인하였다.

  • PDF

사각지역경보시스템을 위한 실시간 측후방 차량검출 알고리즘 (Real-Time Side-Rear Vehicle Detection Algorithm for Blind Spot Warning Systems)

  • 강현우;백장운;한병길;정윤수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권7호
    • /
    • pp.408-416
    • /
    • 2017
  • 본 논문에서는 주행 중 사각지역내의 차량을 빠르고 정확하게 실시간으로 검출하는 측후방 차량 검출 알고리즘을 제안한다. 제안 알고리즘은 실시간 처리를 위해 MCT(Modified Census Transformation) 특징벡터를 기반으로 에이다부스트 학습을 통해 생성되는 캐스케이드 분류기를 사용한다. MCT 분류기는 검출윈도우가 작을수록 처리속도가 빠르고, 검출윈도우가 클수록 정확도가 증가한다. 제안 알고리즘은 이러한 특징을 이용하여 검출윈도우가 작은 분류기로 차량후보를 빠르게 생성한 후 보다 큰 사이즈의 검출윈도우를 가지는 분류기로 생성된 차량후보에 대해 정확하게 차량인지 검증한다. 또한, 차량분류기와 바퀴분류기를 동시에 사용하여 사각지역내로 진입하는 차량과 사각지역내의 인접차량을 효과적으로 검출한다.

사각형 특징 기반 분류기와 클래스 매칭을 이용한 실시간 얼굴 검출 및 인식 (Real Time Face Detection and Recognition using Rectangular Feature based Classifier and Class Matching Algorithm)

  • 김종민;강명아
    • 한국콘텐츠학회논문지
    • /
    • 제10권1호
    • /
    • pp.19-26
    • /
    • 2010
  • 본 논문은 사각형 특징 기반 분류기를 제안하여 실시간으로 얼굴 영역을 검출하며, 계산의 효율성과 검출 성능을 동시에 만족시키는 강인한 검출 알고리즘을 구현하고자 한다. 제안한 알고리즘은 특징 생성, 분류기 학습, 실시간 얼굴 영역 검출의 세 단계로 구성된다. 특징 생성은 제안된 5개의 사각형 특징으로 특징 집합을 구성하며, SAT(Summed-Area Tables)를 이용하여 특징 값을 효율적으로 계산한다. 분류기 학습은 AdaBoost 알고리즘을 이용하여, 분류기를 계층적으로 생성한다. 또한 중요한 얼굴 패턴은 다음 레벨에 반복적으로 적용함으로써 우수한 검출 성능을 가진다. 실시간 얼굴 영역 검출은 생성된 사각형 특징 기반 분류기를 통해, 빠르고 효율적으로 얼굴 영역을 찾아낸다. 또한 얼굴 영역을 검출한 영역을 인식의 입력 영상으로 사용하여 PCA와 KNN 알고리즘을 이용하여 기존의 매칭 방법인 Point to point 방법이 아닌 Class to Class 방식을 이용하여 인식률을 향상시켰다.

명제화된 어트리뷰트 택소노미를 이용하는 나이브 베이스 학습 알고리즘 (Propositionalized Attribute Taxonomy Guided Naive Bayes Learning Algorithm)

  • 강대기;차경환
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2357-2364
    • /
    • 2008
  • 본 논문에서는 명제화된 어트리뷰트 택소노미를 이용하여 간결하고 강건한 분류기를 생성하는 문제를 고려한다. 이 문제를 해결하기 위해 명제화된 어트리뷰트 택소노미(Propositionalized Attribute Taxonomy)를 이용하는 나이브 베이스 학습 알고리즘(Naive Bayes Learner)인 PAT-NBL을 소개한다. PAT-NBL은 명제화된 어트리뷰트들의 택소노미를 선험 지식으로 이용하여 간결하고 정확한 분류기를 귀납적으로 학습하는 알고리즘이다. PAT-NBL은 주어진 택소노미에서 지역적으로 최적의 컷(cut)을 찾아내기 위해 하향식 탐색과 상향식 탐색을 사용한다. 찾아낸 최적의 컷은 명제화된 어트리뷰트 택소노미와 데이터로부터 그에 상응하는 인스턴스 공간(instance space)을 구성 할 수 있게 해준다. University of California-Irvine (UCI) 저장소의 기계학습 벤치마크 데이터에 대한 실험 결과를 보면, 제안된 알고리즘이 표준적인 나이브 베이스 학습 알고리즘에 의해 만들어진 분류기들과 비교해 볼 때, 가끔은 보다 간결하고 더 정확한 분류기를 생성해 낸다는 사실을 알 수 있었다.

나이브 베이즈 분류기를 이용한 돌발상황 검지 알고리즘 개발 (Development of Incident Detection Algorithm Using Naive Bayes Classification)

  • 강성관;권봉경;권철우;박상민;윤일수
    • 한국ITS학회 논문지
    • /
    • 제17권6호
    • /
    • pp.25-39
    • /
    • 2018
  • 본 연구에서는 최근 활발하게 활용되고 있는 머신러닝 기법을 교통분야에 적용하여 효율적인 돌발상황 검지 알고리즘을 개발하는 것을 목적으로 하였다. 미시교통시뮬레이션 모형을 통하여 대상지의 네트워크를 구축하였고 돌발상황에 영향을 줄 것으로 예상되는 변수의 여러 조합을 통해 시나리오를 설정하여 가상의 돌발상황 데이터를 수집하였다. 다음으로 대표적인 돌발상황 검지 알고리즘인 McMaster 알고리즘과 본 연구에서 개발한 나이브 베이즈 분류기를 구현하여 비교 평가하였다. 비교 결과, 나이브 베이즈 분류기가 McMaster 알고리즘에 비해 돌발상황 검지 간격에 따른 부정적인 영향이 적었고 더 우수한 검지율을 보였다. 하지만 검지율이 증가하는 만큼 오검지율 또한 증가하는 것을 확인할 수 있었다. McMaster 알고리즘은 4주기를 통해 검지가 가능하지만 나이브 베이즈 분류기는 1주기(30초)만으로 돌발상황을 판단할 수 있다. 본 연구를 통해 개발한 나이브 베이즈 분류기가 효율적으로 돌발을 파악할 수 있다는 것을 확인할 수 있었다.

유전자 알고리즘을 이용한 림프종 암의 최적 분류기 앙상블 (Optimal Classifier Ensemble for Lymphoma Cancer Using Genetic Algorithm)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.356-358
    • /
    • 2003
  • DNA microarray기술의 발달로 한꺼번에 수천 개 유전자의 발현 정보를 얻는 것이 가능해졌는데, 이렇게 얻어진 데이터를 효과적으로 분류하는 시스템을 만들어놓으면 새로운 샘플이 정상상태인지, 질병을 가진 상태인지 예측할 수 있다. 분류 시스템을 위하여 여러 가지 특징선택방법들과 분류기법들을 사용할 수 있는데, 모든 상황에서 항상 뛰어난 성능을 보이는 특징선택법이나 분류기를 찾기는 힘들다. 안정되고 개선된 성능을 내기 위해서 특징-분류기의 앙상블을 이용할 수 있는데, 앙상블에 이용될 수 있는 특징선택 방법이나 분류기의 수가 많다면, 앙상블을 만들 수 있는 조합이 많아지기 때문에, 모든 조합에 대하여 앙상블 결과를 구하기는 거의 불가능하다. 이를 해결하기 위하여 본 논문에서는 유전자알고리즘을 이용하여 모든 앙상블 결과를 계산하지 않으면서 최적의 앙상블을 찾아내는 방법을 제안하였으며, 실제로 림프종 암 데이터에 적용한 결과 100%의 결합결과를 보이는 최적의 앙상블을 효과적으로 찾아내었다.

  • PDF

기계학습 알고리즘을 이용한 주택 모기지 금리에 대한 시민들의 감정예측 (Prediction of Citizens' Emotions on Home Mortgage Rates Using Machine Learning Algorithms)

  • 김윤기
    • 지적과 국토정보
    • /
    • 제49권1호
    • /
    • pp.65-84
    • /
    • 2019
  • 본 연구의 목적은 기계학습 알고리즘을 이용하여 주택모기지 금리에 대한 시민들의 감정을 예측하는 것이었다. 연구목적을 달성하기 위해 본 연구는 관련문헌을 검토한 다음 두개의 연구 질문을 설정하였다. 또한 연구 질문에 대한 답을 구하기 위해 본 연구는 Akman의 분류에 따라 감정을 분류 한 다음 여섯 가지 기계학습 알고리즘을 이용하여 모기지 금리에 대한 시민들의 감정을 예측하였다. 분석결과 AdaBoost가 모든 평가범주에서 가장 우수한 분류기로 확인되었다. 그러나 Naive Bayes의 성능수준은 다른 분류기들의 성능수준보다 낮은 것으로 밝혀졌다. 또한 본 연구는 어느 분류기가 각 감정범주를 잘 예측해주는지를 파악하기 위해 ROC 분석을 실시하였다. 분석결과, AdaBoost가 모든 감정범주에서 주택모기지 금리에 대한 주민들의 감정을 가장 잘 예측해주는 것으로 확인되었다. 그러나 슬픔범주에서 여섯 가지 알고리즘의 성능수준은 다른 감정범주보다 훨씬 낮게 나타났다.

계층적 분류체계를 위한 자동분류 기법에 관한 연구 (An Experimental Study on Text Categorization for Hierarchical Classification)

  • 이영숙;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.173-176
    • /
    • 2001
  • 이 연구는 계층적 분류체계를 기반으로 자동분류를 수행할 HiCat 알고리즘을 제안한다. HiCat 알고리즘은 DDC 지식베이스의 주제어와 기계학습을 거친 정보를 동시에 이용하고, 각 계층별로 주제적합성가중치를 구해 최종 주제범주를 결정한다. 이 알고리즘이 최적의 성능을 보이는 조건을 알아보고, 일반 분류기와의 성능 비교를 통해 HiCat 알고리즘을 평가해 보았다.

  • PDF