• 제목/요약/키워드: 분류알고리즘

검색결과 3,152건 처리시간 0.035초

Apriori-Genetic 알고리즘을 이용한 베이지안 자동 문서 분류 (Bayesian Automatic Document Categorization Using Apriori-Genetic Algorithm)

  • 고수정;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.251-260
    • /
    • 2001
  • 기존의 베이지안 문서 분류는 문서의 특징 표현에 있어서 단어간의 의미를 정확하게 반영하지 못하는 문제점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류 방법을 제안한다. Apriori 알고리즘은 단어간의 의미를 반영한 연관 단어의 형태로 문서의 특징을 추출하며 추출된 연관 단어로 연관 단어 지식베이스를 구축한다. Aprrori 알고리즘만으로 연관 단어 지식베이스를 구축할 경우, 지식베이스 안에 부적당한 연관 단어가 포함된다. 따라서 문서 분류의 정확도가 낮아지는 단점이 있다. 이러한 단점을 보완하기 위해, Genetic 알고리즘을 이용하여 연관 단어 지식베이스를 최적화하는 방법을 사용한다. 베이지안 확률을 이용하는 분류자는 최적화된 연관 단어 지식베이스를 기반으로 문서를 클래스별로 분류한다. Apriori-Genetic 알고리즘을 이용한 베이지안 문서 분류의 성능을 평가하기 위해, Apriori 알고리즘을 이용한 베이지안 문서 분류 방법, 역문헌빈도를 사용한 베이지안 문서 분류 방법, 기존의 단순 베이지안 분류 방법과 비교하였다.

  • PDF

PCM 알고리즘과 베이시안 분류의 통합기법 (Integrating Classification Method using PCM Algorithm and Bayesian Method)

  • 전영준;김진일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.790-792
    • /
    • 2004
  • 본 논문은 PCM(Possibilistic C-Means) 알고리즘과 베이시안 분류 알고리즘을 통합한 고해상도 위성영상의 효과적인 분류방법을 제안하였다. 제안된 알고리즘은 학습데이터를 참고로 하여 PCM 알고리즘을 반복적인 과정 없이 수행한다. 각 분류항목별로 분류된 데이터에서 평균내부거리 내부에 해당되는 데이터들을 선정하여 각 항목별 비율을 구한 후 베이시안 분류기법의 사전확률로 적용하여 분류를 수행한다 PCM 알고리즘은 각 데이터와 특정 클러스터와의 거리에 소속도를 부여하는 퍼지 C-Means 알고리즘과 달리 소속도를 각 데이터와 클러스터 중심간의 절대거리에 의존하는 방법으로 퍼지 C-Means 알고리즘이 가지는 상대성 문제를 해결하였다. 제안된 분류 기법을 고해상도 다중분광 데이터인 IKONOS 위성영상에 적용하여 분류를 수행한 후 최대우도 분류기법과 비교한다.

  • PDF

초중등학생 대상 알고리즘 교육을 위한 분류체계 모형 설계 (Classification System Model Design for Algorithm Education for Elementary and Secondary Students)

  • 이영호;구덕회
    • 정보교육학회논문지
    • /
    • 제21권3호
    • /
    • pp.297-307
    • /
    • 2017
  • 본 연구의 목적은 초중등학생 대상 알고리즘 교육을 위한 알고리즘 분류체계를 제안하는 것이다. 연구자는 알고리즘의 구성요소를 정의하고, 분석합성식 방법으로 알고리즘 분류체계를 표현하였다. 연구의 내용은 다음과 같다. 첫째, 분류의 목적과 분류의 종류에 대한 이론적인 탐색을 실시하였다. 둘째, 기존에 제안된 알고리즘 내용에 대한 분류체계의 내용과 그 한계에 대해 살펴보았다. 이와 더불어 알고리즘 교육 연구에서 사용되었던 알고리즘 교육 내용 및 선정 기준에 대해 살펴보았다. 셋째, 알고리즘의 분류를 위해 알고리즘 구성요소를 NRC에서 제시한 핵심 아이디어와 관통 개념을 사용하여 재정의하였다. 그리고 알고리즘 관통 개념을 디자인 구조와 자료구조로 세분화하여 그 내용을 제시하였으며, 이 내용을 분석합성식 분류체계를 사용하여 표현하였다. 마지막으로 전문가 집단의 검토를 통해 제안한 내용에 대한 타당도를 검증하였다. 알고리즘 분류체계에 대한 연구는 알고리즘 교육에 있어 내용 선정 및 교육 방법에 많은 시사점을 제공할 것으로 기대한다.

분류 알고리즘에 대한 경험적 비교연구

  • 전홍석;이주영
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2000년도 춘계학술대회
    • /
    • pp.411-422
    • /
    • 2000
  • 본 연구에서는 결정트리 분야에서 각 분류알고리즘을 살펴보고 통계학의 판별분석과 기계학습(Machine Learning)분야에서 분류알고리즘을 비교하고, 자료에 따라 오분류율을 분석 하였다.

  • PDF

음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘 (New Automatic Taxonomy Generation Algorithm for the Audio Genre Classification)

  • 최택성;문선국;박영철;윤대희;이석필
    • 한국음향학회지
    • /
    • 제27권3호
    • /
    • pp.111-118
    • /
    • 2008
  • 본 논문에서는 음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘을 제안한다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된 분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는 것이다. 제안된 알고리즘에서의 분류 확률 예측은 훈련 데이터를 k-fold cross validation을 이용하여 분류기에 적용함으로써 이루어진다. 제안된 알고리즘을 기반으로 한 분류 성능 측정은 2 클래스로 이루어진 각각의 노드에 2개 범주 분류에 효과적인 support vector machine을 적용함으로써 이루어진다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 알고리즘과 기존의 다중 범주 분류기들을 이용하여 분류성능을 평가하였다. 다양한 실험결과 제안된 알고리즘은 기존의 알고리즘에 비하여 5%에서 25%정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터를 이용한 분류 실험에서는 10% 에서 25% 향상된 좋은 성능을 보였다.

퍼지 알고리즘의 융합에 의한 다중분광 영상의 패턴분류 (Pattern Classification of Multi-Spectral Satellite Images based on Fusion of Fuzzy Algorithms)

  • 전영준;김진일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.674-682
    • /
    • 2005
  • 본 논문에서는 다중분광 영상의 분류를 위하여 퍼지 G-K(Gustafson- Kessel) 알고리즘과 PCM 알고리즘을 융합한 분류방법을 제안하였다. 제안된 방법은 학습데이타를 이용하여 퍼지 G-K 알고리즘을 수행한 후 그 결과를 이용하여 PCM 알고리즘을 수행한다 PCM 알고리즘과 퍼지 G-K 알고리즘 분류결과를 비교하여 그 결과가 일치하면 해당 항목으로 분류항목을 결정한다. 일치하지 않는 화소는 PCM 알고리즘의 평균내부거리 안쪽에 있는 화소들을 새로운 학습데이타로 하여 베이시안 최대우도 분류를 수행하여 분류항목을 결정한다. 평균내부거리 안쪽에 있는 화소 데이타는 정규분포형태를 보여준다. 다차원 다중분광 영상인 IKONOS와 LANDSAT TM 위성영상을 이용하여 제안된 알고리즘의 효율성을 검증한 결과 퍼지 G-K 알고리즘과 PCM 알고리즘 그리고 전통적인 분류 방법인 최대우도 분류 알고리즘보다 전체 정확도가 더 높은 결과를 얻을 수 있었다

최적 퍼지 룰 베이스 시스템의 설계를 위한 유전 알고리즘 (Genetic Algorithm for Designing the Optimal Fuzzy Rule-base Systems)

  • 김동훈;김종율
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.772-775
    • /
    • 2008
  • 본 논문은 퍼지 분류 시스템을 위한 퍼지 규칙베이스에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화를 하는 유전 알고리즘을 제안한다. 제안하는 유전 알고리즘은 분류 성능을 보다 더 향상시키기 위해서 인식에 사용된 규칙에 대한 확실성 정도를 개선하는 방법을 포함한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

유전알고리즘을 이용한 최적퍼지 규칙베이스 시스템의 설계 (Design of Optimal Fuzzy Rule-base Systems with Genetic Algorithm)

  • 김종율
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.439-442
    • /
    • 2007
  • 본 논문은 퍼지 분류를 위한 퍼지 규칙베이스 시스템에 대한 최적화 해법으로서 유전 알고리즘에 대해 살펴본다. 즉 퍼지 규칙베이스를 이용하는 퍼지 분류 시스템을 최적화률 하는 유전 알고리즘을 제안한다. 본 논문에서 다루는 최적화는 추출되는 퍼지 규칙의 수와 퍼지 분류 시스템의 입력 패턴을 정확하게 분류하는 지에 대한 성능을 포괄적으로 수행하는 것을 의미한다. 마지막으로 본 논문에서 제안하는 유전 알고리즘을 이용하여 수치실험을 수행하고 그 결과를 통해 제안하는 알고리즘의 유효성과 효율성을 생성된 퍼지 규칙의 수와 퍼지 분류 시스템의 성능의 관점에서 논의한다.

  • PDF

나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘 (Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier)

  • 장재영;김한준
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.369-376
    • /
    • 2006
  • 본 논문은 온라인 전자문서환경에서 전통적 베이지안 통계기반 문서분류시스템의 분류성능을 개선하기 위해 EM(Expectation Maximization) 가속 알고리즘을 접목한 방법을 제안한다. 기계학습 기반의 문서분류시스템의 중요한 문제 중의 하나는 양질의 학습문서를 확보하는 것이다. EM 알고리즘은 소량의 학습문서집합으로 베이지안 문서분류 알고리즘의 성능을 높이는데 활용된다. 그러나 EM 알고리즘은 최적화 과정에서 느린 수렴성과 성능 저하 현상을 나타내는데, EM 알고리즘의 기본 가정을 따르지 않는 온라인 전자문서환경에서 특히 그러하다. 제안 기법의 주요 아이디어는 전통적 EM 알고리즘을 개선하기 위해 불확정성도 기반 선택적 샘플링 기법을 활용한 것이다. 성능평가를 위해 Reuter-21578 문서집합을 사용하여, 제안 알고리즘의 빠른 수렴성을 보이고 전통적 베이지안 알고리즘의 분류 정확성을 향상시켰음을 보인다.

머신러닝 기법올 적용한 CS-RANSAC 알고리즘 (CS-RANSAC Algorithm using Machine Learning Technique)

  • 고승현;윤의녕;주마벡;조근식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.632-635
    • /
    • 2016
  • 증강현실에서 영상과 증강된 콘텐츠 간의 이질감을 줄이기 위해서 정확한 호모그래피 행렬을 추정해야 하며, 정확한 호모그래피 행렬을 추정할때 RANSAC 알고리즘이 널리 사용된다. 그러나 RANSAC 알고리즘은 랜덤 샘플링 과정을 반복적으로 거치기 때문에 불필요한 연산 과정이 발생하고 이로 인해 알고리즘의 효율이 저하된다. 이러한 단점을 극복하기 위해 DCS-RANSAC 알고리즘이 제안되었다. 제안된 DCS-RANSAC 알고리즘은 이미지를 특징점 분포 패턴에 따라 그룹으로 분류하고 각 그룹에 제약조건 문제를 적용하여 불필요한 연산 과정을 줄이고 정확도를 향상시킨 알고리즘이다. 그러나 DCS-RANSAC 알고리즘에서 사용된 이미지 그룹 데이터는 수동적인 방법을 통해 직관적으로 분류되어 있지만 특징점 분포 패턴이 다양하지 않아 분류시 정확도가 저하되는 경우가 있다. 위의 문제점을 해결하기 위해 본 논문에서는 머신러닝 기법을 통해 이미지들을 자동으로 분류하고 각 그룹마다 각기 다른 제약조건을 적용하는 MCS-RANSAC 알고리즘을 제안한다. 제안하는 알고리즘은 머신러닝 기법을 사용하여 전처리 단계에서 이미지를 분류하고 분류된 이미지에 제약조건을 적용시켜 알고리즘의 처리시간을 줄이고 정확도를 향상시켰다. 실험 결과 본 논문에서 제안하는 MCS-RANSAC은 DCS-RANSAC 알고리즘에 비해 수행시간이 약 6% 단축되었고 호모그래피 오차율은 약 15% 줄어들었으며 참정보 비율은 2.8% 증가한 것으로 확인되었다.