• 제목/요약/키워드: 분류기 알고리즘

검색결과 596건 처리시간 0.029초

K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측 (Classification of Heart Disease Using K-Nearest Neighbor Imputation)

  • 박평우;이석원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.742-745
    • /
    • 2017
  • 본 논문은 심장질환 도메인에 데이터 마이닝 기법을 적용한 연구로, 기존 환자의 정보에 대하여 K-최근접 이웃 알고리즘을 통해 결측 값을 대체하고, 대표적인 예측 분류기인 나이브 베이지안, 소포트 벡터 머신, 그리고 다층 퍼셉트론을 적용하여 각각 결과를 비교 및 분석한다. 본 연구의 실험은 K 최적화 과정을 포함하고 10-겹 교차 검증 방식으로 수행되었으며, 비교 및 분석은 정확도와 카파 통계치를 통해 판별한다.

Pan-Tilt 카메라를 이용한 실시간 얼굴 검출 및 추적 시스템 (The Real-Time Face Detection and Tracking System using Pan-Tilt Camera)

  • 임옥현;김진철;이배호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.814-816
    • /
    • 2004
  • 본 논문에서는 웨이블릿을 이용한 알고리즘으로 얼굴을 검출하고 검출된 얼굴을 움직이는 Pan-Tilt 카메라상에서 추적하는 방법을 제안하고자 한다. 우리는 얼굴 검출을 위해 다섯 종류의 간단한 웨이블릿을 사용하여 특징을 추출하였고 AdaBoost(Adaptive Boosting) 알고리즘을 이용한 계층적 분류기를 통하여 추출된 특징들 중에서 얼굴을 검출하는데 강인한 특징들만을 모았다. 이렇게 만들어진 특징집합들을 이용하여 입력받은 영상에서 초당 20프레임의 실시간으로 얼굴을 검출하였고 영상에서 얼굴 위치와 Pan-Tilt 카메라 위치를 계산하여 실시간으로 움직임을 추적하는데 성공하였다.

  • PDF

간단한 특징에 기반한 얼굴 검출 (The Real-Time Face Detection based on Simple Feature)

  • 임옥현;이우주;이경일;이배호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.247-250
    • /
    • 2004
  • 본 논문에서는 간단한 사각형 특징과 계층적 분류기를 이용하여 실시간으로 얼굴을 검출하는 방법을 제안하고자 한다. 우리는 다섯 가지 형태의 기본적인 특징 모델을 바탕으로 20*20 크기의 훈련 영상에 적용하여 많은 초기 특징 집합을 구성하였다. AdaBoost(Adaptive Boosting) 알고리즘을 이용한 학습을 통하여 초기 특징 집합 중에서 얼굴 검출하는데 강인한 집합들만을 선택하였다. 제안된 알고리즘을 이용한 실제 실험에서 90% 이상의 높은 검출율을 확인하였고 초당 10프레임의 실시간 검출에도 성공하였다.

  • PDF

엔트로피 분포를 이용한 규칙기반 분류분석 연구 (Rule-Based Classification Analysis Using Entropy Distribution)

  • 이정진;박해기
    • Communications for Statistical Applications and Methods
    • /
    • 제17권4호
    • /
    • pp.527-540
    • /
    • 2010
  • 규칙기반 분류분석(rule-based classification analysis)은 직관적인 이해가 쉽고 알고리즘이 복잡하지 않아 최근 대용량 데이터마이닝에 많이 이용되는 기법이다. 하지만 현재의 규칙기반 분석은 여러 개의 규칙들을 찾은후 이 규칙들을 단순히 다수결이나 또는 중요도의 가중 합으로서 새로운 데이터를 분류한다. 본 연구에서는 다항분포를 이용한 이항데이터의 분류분석 기법을 규칙 조합방법에 응용하고자한다. 다향분포의 추정을 위해서는 변형된 반복 비율 적합(iterative proportional fitting; IPF) 알고리즘을 이용하여 최대 엔트로피 분포(entropy distribution)를 찾는다. 시뮬레이션 실험 결과 이 방법은 두 집단의 데이터가 서로 유사한 경우 어느 정도 의미 있는 분류 결과를 보여주였다.

재귀 분할 평균 법을 이용한 새로운 메모리기반 추론 알고리즘 (A New Memory-Based Reasoning Algorithm using the Recursive Partition Averaging)

  • 이형일;정태선;윤충화;강경식
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1849-1857
    • /
    • 1999
  • 메모리 기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여, 재귀 분할 평균 기법을 제안하였다. 이 알고리즘은 패턴공간을 구성하는 각 초월 평면이 동일한 클래스소속으로 패턴으로 구성될 때까지 재귀적으로 분할한 후, 초월 평면별로 소속된 패턴들의 평균값을 계산하여 대표패턴을 추출한다. 또한 각 특징과 클래스간의 상호정보를 특징의 가중치로 사용하여 분류 성능의 향상을 시도하였다. 제안된 알고리즘은 k-NN(k-Nearest Neighbors) 분류기에서 필요로 하는 메모리 공간의 30~90%만을 사용하며, 분류에 있어서도 k-NN과 유사한 인식 성능을 보이고 있다. 또한 저장된 패턴 개수의 감소로 인하여, 실제 분류에 소요되는 시간에 있어서도 k-NN보다 월등히 우수한 성능을 보이고 있다.

  • PDF

객체검출을 위한 빠르고 효율적인 Haar-Like 피쳐 선택 알고리즘 (A Fast and Efficient Haar-Like Feature Selection Algorithm for Object Detection)

  • 정병우;박기영;황선영
    • 한국통신학회논문지
    • /
    • 제38A권6호
    • /
    • pp.486-491
    • /
    • 2013
  • 본 논문은 객체검출(object detection)에 사용되는 분류기의 학습을 위한 빠르고 효율적인 Haar-like feature 선택 알고리듬을 제안한다. 기존 AdaBoost를 이용한 Haar-like feature 선택 알고리듬은 학습 샘플들에 대한 피쳐의 에러만을 고려하여 형태적으로 유사하거나 중복되는 피쳐가 선택되는 경우가 많았다. 제안하는 알고리듬은 피쳐의 형태와 피쳐간의 거리로부터 피쳐의 유사도를 계산하고 이미 선택된 피쳐와 유사도가 큰 피쳐들을 피쳐 세트에서 제거하여 빠르고 효율적인 피쳐 선택이 이루어지도록 하였다. FERET 얼굴 데이터베이스를 사용하여 제안된 알고리듬을 사용하여 학습시킨 분류기와 기존 알고리듬을 사용한 분류기의 성능을 비교하였다. 실험 결과 제안한 피쳐 선택 방법을 사용하여 학습시킨 분류기가 기존 방법을 사용한 분류기보다 향상된 성능을 보였으며, 동일한 성능을 갖도록 학습시켰을 경우 분류기의 피쳐 수가 20% 감소하였다.

SVM 분류기를 이용한 필기체 숫자인식 (Recognition of Handwritten Numerals using SVM Classifiers)

  • 박중조;김경민
    • 융합신호처리학회논문지
    • /
    • 제8권3호
    • /
    • pp.136-142
    • /
    • 2007
  • 최근의 인식 시스템 연구들에 의하면 SVM 분류기가 여러 다른 분류기에 비해 우수한 인식 성능을 나타내고 있다. 이에 본 논문에서는 SVM 분류기를 사용하여 필기체 숫자를 인식하는 알고리즘을 제시한다. 본 기법에서는 필기체 숫자의 특징으로서 망특징과 Kirsch 연산자에 의한 방향 특징 및 오목특징을 사용하는데, 이중에서 처음 두 특징은 숫자를 이루는 선에 대한 전경 정보를 표현하며, 마지막 특징은 숫자의 배경 정보를 표현하여 상호 보완적인 역학을 수행한다. 본질적으로 SVM은 두 클래스 분류기이므로 이를 다중 클래스 분류기로 사용하기 위해서는 여러 개의 SVM들을 결합하여 사용해야 하는데, 본 논문에서는 "일대일" 방법과 "일대다" 방법을 사용하여 주어진 특징에 대한 인식을 수행하였다. 제시된 기법의 성능 평가를 위해 CENPARMI 필기체 숫자 데이터베이스를 사용하여 실험하였으며, 그 결과 98.45%의 인식률을 얻을 수 있었다.

  • PDF

Okapi BM25 단어 가중치법 적용을 통한 문서 범주화의 성능 향상 (A Research on Enhancement of Text Categorization Performance by using Okapi BM25 Word Weight Method)

  • 이용훈;이상범
    • 한국산학기술학회논문지
    • /
    • 제11권12호
    • /
    • pp.5089-5096
    • /
    • 2010
  • 문서 범주화는 정보검색 시스템의 중요한 기능중의 하나로 문서들을 어떤 기준에 의해 그룹화를 하는 것을 말한다. 범주화의 일반적인 방법은 대상 문서에서 중요한 단어들을 추출하고 가중치를 부여한 후에 분류 알고리즘에 따라 문서를 분류한다. 따라서 성능과 정확성은 분류 알고리즘에 의해 결정됨으로 알고리즘의 효율성이 중요하다. 본 논문에서는 단어 가중치 계산 방법을 개선하여 문서분류 성능을 향상시키는 것을 소개하였다. Okapi BM25 단어 가중치법은 일반적인 정보검색분야에서 사용되어 검색 결과에 좋은 결과를 보여주고 있다. 이를 적용하여 문서 범주화에서도 좋은 성능을 보이는지를 실험하였다. 비교한 단어 가중치법에는 가장 일반적인 TF-IDF법와 문서분류에 최적화된 가중치법 TF-ICF법, 그리고 문서요약에서 많이 사용되는 TF-ISF법을 이용하여 4가지 가중치법에 따라 결과를 측정하였다. 실험에 사용한 문서로는 Reuter-21578 문서를 사용하였으며 분류기 알고리즘으로는 Support Vector Machine(SVM)와 K-Nearest Neighbor(KNN)알고리즘을 사용하여 실험하였다. 사용된 가중치법 중 Okapi BM25 법이 가장 좋은 성능을 보였다.

자질 선정 기준과 가중치 할당 방식간의 관계를 고려한 문서 자동분류의 개선에 대한 연구 (An Empirical Study on Improving the Performance of Text Categorization Considering the Relationships between Feature Selection Criteria and Weighting Methods)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제39권2호
    • /
    • pp.123-146
    • /
    • 2005
  • 이 연구에서는 문서 자동분류에서 분류자질 선정과 가중치 할당을 위해서 일관된 전략을 채택하여 kNN 분류기의 성능을 향상시킬 수 있는 방안을 모색하였다. 문서 자동 분류에서 분류자질 선정 방식과 자질 가중치 할당 방식은 자동분류 알고리즘과 함께 분류성능을 좌우하는 중요한 요소이다. 기존 연구에서는 이 두 방식을 결정할 때 상반된 전략을 사용해왔다. 이 연구에서는 색인파일 저장공간과 실행시간에 따른 분류성능을 기준으로 분류자질 선정 결과를 평가해서 기존 연구와 다른 결과를 얻었다. 상호정보량과 같은 저빈도 자질 선호 기준이나 심지어는 역문헌빈도를 이용해서 분류 자질을 선정하는 것이 kNN 분류기의 분류 효과와 효율 면에서 바람직한 것으로 나타났다. 자질 선정기준으로 저빈도 자질 선호 척도를 자질 선정 및 자질 가중치 할당에 일관되게 이용한 결과 분류성능의 저하 없이 kNN 분류기의 처리 속도를 약 3배에서 5배정도 향상시킬 수 있었다.

SIFT와 신경망을 이용한 학습 기반 차량 번호판 검출 (Learning-based Detection of License Plate using SIFT and Neural Network)

  • 홍원주;김민우;오일석
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.187-195
    • /
    • 2013
  • 차량 번호판 검출의 기존 연구들은 대부분 높은 성능을 얻기 위해 영상 획득 환경을 제한한다. 본 논문은 제약사항이 적은 환경에서 다양한 종류의 차량 번호판을 검출하기 위해 SIFT와 신경망을 이용한 새로운 방법을 제안한다. SIFT는 영상의 크기, 회전 변화에 불변하는 지역특징으로서 처리해야 할 환경이 고정되지 않은 경우에도 분별력이 뛰어나다. 영상에서 추출한 SIFT를 번호판 내부의 것(내부 부류)과 외부의 것(외부 부류)으로 나누어 2부류 분류기를 학습한다. 분류기는 신경망을 사용하며, 찾고자 하는 번호판의 종류를 학습 집합에 포함하는 것으로 다양한 종류의 번호판을 동일한 알고리즘으로 검출할 수 있다. 제안하는 방법은 입력 영상에서 지역특징을 추출하고 미리 학습한 분류기로 번호판 내부 부류를 가려낸다. 분류기의 성능이 높지 않더라도 분류 결과 내부 부류는 번호판 내부에 밀집하여 나타나고 번호판 외부에서는 흩어져 나타난다. 이러한 특성을 이용해 지역특징 맵을 만들고, 이 맵에서 임계값 이상인 전역 최댓값을 번호판 영역으로 검출한다. 다양한 환경에서 데이터 베이스를 수집하고 지역특징 분류와 번호판 검출 알고리즘을 실험한다. 지역특징을 분류기로 분류한 결과 정인식률은 97.1%, 정확률은 62.0%, 재현율은 50.2%를 보였다. 정인식률에 비해 정확률과 재현율은 낮았지만, 번호판 검출 결과 98.6%의 높은 검출 성능을 보였다.