• 제목/요약/키워드: 최적 분류

검색결과 1,054건 처리시간 0.024초

그룹분류가능계획를 이용한 최적 블록 CDC의 설계

  • 김진;배종성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.109-114
    • /
    • 2001
  • m=2 또는 n=2이고, ${\lambda}_1<{\lambda}_2$인 그룹분류가능계획을 매개디자인으로 사용한 완전이면교배가 A-최적, D-최적임을 보였다. 또한, ${\lambda}_2={\lambda}_1+1$이면 일반화된 최적계획이 됨을 보였다.

  • PDF

DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기 (Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF

부분 AUC와 최적분류점들 (Partial AUC and optimal thresholds)

  • 홍종선;조현수
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.187-198
    • /
    • 2019
  • ROC와 CAP 곡선을 이용하여 다양한 정확도 측도를 바탕으로 최적분류점을 추정하는 많은 연구가 있다. 본 연구에서는 ROC와 CAP 곡선의 특정한 부분 면적을 나타내는 대안적인 통계량을 제안한다. 새롭게 정의된 부분 면적을 나타내는 통계량의 미분방정식을 이용하여 ROC와 CAP 함수와의 관계를 살펴보고, 다음으로는 ROC와 CAP 곡선에 대한 다양한 정확도 측도들의 조건에서의 최적분류점과의 관계를 유도한다. 혼합분포를 구성하는 두 종류의 분포함수를 다양한 정규분포로 가정하여 최적분류점을 설정하고, 다양한 정확도 측도들의 조건에서의 최적분류점에 대응하는 제1종과 제2종 오류의 크기를 탐색하고 토론한다.

혼동행렬의 상관계수를 이용한 최적분류점 (Optimal threshold using the correlation coefficient for the confusion matrix)

  • 홍종선;오세현;최예원
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.77-91
    • /
    • 2022
  • 의학통계와 신용평가 분야에서 혼합분포함수를 판별하는 최적분류점 추정하기 위하여 판별력을 측정하는 다양한 정확도 측도들이 존재한다. 최근에 혼동행렬 빈도수로 표현되는 Matthews의 상관계수와 정밀도와 재현율의 조화평균인 F1 통계량의 정확도 측도들이 최적분류점을 추정하는데 연구되었다. 본 연구에서는 이런 정확도 측도들 중에서 표본크기에 의존하는 정확도 측도들은 두 표본크기 차이가 많은 경우에 최적분류점을 설정하는데 적절하지 않음을 발견한다. 그리고 대안적인 정확도 측도로 혼동행렬의 비율들의 함수인 상관계수를 정의하고, 이를 최대화하는 분류점을 최적분류점으로 추정하는 방법을 제안하고 이 방법의 유용성과 활용성에 대하여 토론한다.

인공신경망 모형을 이용한 영상자료의 토지피복분류 (Land Cover Classification of Image Data Using Artificial Neural Networks)

  • 강문성;박승우;윤광식
    • 농촌계획
    • /
    • 제12권1호
    • /
    • pp.75-83
    • /
    • 2006
  • 본 연구에서는 최대우도법과 인공신경망 모형에 의해 카테고리 분류를 수행하고 각각의 분류 성능을 비교 평가하였다. 인공신경망 모형은 오류역전파 알고리즘을 이용한 것으로서 학습을 통한 은닉층의 최적노드수를 결정하여 카테고리 분류를 수행하도록 하였다. 인공신경망 최적 모형은 입력층의 노드수가 7개, 은닉층의 최적노드수가 18개, 그리고 출력층의 노드수가 5개인 것으로 구성하였다. 위성영상은 1996년에 촬영된 Landsat TM-5 영상을 사용하였고, 최대우도법과 인공신경망 모형에 의한 카테고리 분류를 위하여 각각의 카테고리에 대한 분광특성을 대표하는 지역을 절취하였다. 분류 정확도는 인공신경망 모형에 의한 방법이 90%, 최대우도법이 83%로서, 인공신경망 모형의 분류 성능이 뛰어난 것으로 나타났다. 카테고리 분류 항목인 토지 피복 상태에 따른 분류는 두 가지 방법에서 밭과 주거지의 분류오차가 큰 것으로 나타났다. 특히, 최대우도법에 의한 밭에서의 태만오차는 62.6%로서 매우 큰 값을 보였다. 이는 밭이나 주거지의 특성이 위성영상 촬영시기에 따라 나지의 형태로 분류되거나 산림, 또는 논으로도 분류되는 경향이 있기 때문인 것으로 보인다. 차후에 카테고리 분류를 위한 각각의 클래스의 보조적인 정보를 추가한다면, 카테고리 분류 향상이 이루어질 것으로 기대된다.

유전자 알고리즘을 이용한 림프종 암의 최적 분류기 앙상블 (Optimal Classifier Ensemble for Lymphoma Cancer Using Genetic Algorithm)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.356-358
    • /
    • 2003
  • DNA microarray기술의 발달로 한꺼번에 수천 개 유전자의 발현 정보를 얻는 것이 가능해졌는데, 이렇게 얻어진 데이터를 효과적으로 분류하는 시스템을 만들어놓으면 새로운 샘플이 정상상태인지, 질병을 가진 상태인지 예측할 수 있다. 분류 시스템을 위하여 여러 가지 특징선택방법들과 분류기법들을 사용할 수 있는데, 모든 상황에서 항상 뛰어난 성능을 보이는 특징선택법이나 분류기를 찾기는 힘들다. 안정되고 개선된 성능을 내기 위해서 특징-분류기의 앙상블을 이용할 수 있는데, 앙상블에 이용될 수 있는 특징선택 방법이나 분류기의 수가 많다면, 앙상블을 만들 수 있는 조합이 많아지기 때문에, 모든 조합에 대하여 앙상블 결과를 구하기는 거의 불가능하다. 이를 해결하기 위하여 본 논문에서는 유전자알고리즘을 이용하여 모든 앙상블 결과를 계산하지 않으면서 최적의 앙상블을 찾아내는 방법을 제안하였으며, 실제로 림프종 암 데이터에 적용한 결과 100%의 결합결과를 보이는 최적의 앙상블을 효과적으로 찾아내었다.

  • PDF

최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축 (The database construction of a classification system using an optimal cluster analysis model)

  • 이현숙
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1045-1050
    • /
    • 1998
  • 데이타의 분류기법은 공장자동화나 로보틱스 분야에서 사용되는 지능시스템의 중요한 기능이다. 일반적으로 이러한 분류시스템을 설계하고자 할때, 준비된 데이타는 레이블링 되어야 하고, 분류하고자하는 클래스의 수도 설정되어야한다. 본 연구에서는 이러한 사전 정보없이 분류 시스템을 설계하고자 최적 클러스터 분석 모델, OFCAM을 제안한다. 이때 사용되는 최적 클러스터 분석 모델은 데이타의 구조에 대한 사전정보 없이, 주어진 데이타의 최적 클러스터의 수와 클러스터 중심점 및 각 데이타에 대한 소속정보를 구해준다. 이를 위하여 OFCAM에서는 목적합수를 가지는 비교사 학습신경망과 클러스터 타당성 전략을 결합하고 있다. OFCAM의 결과를 바탕으로 분류시스템의 데이터베이스, PCSDB가 구축되며 이는 결정 모듈에서 쉽게 활용될 수 있음을 보인다. 이와같은 방법은 하나의 데이타베이스 안에서 필요한 테이블만을 첨가하므로 독립적으로 여러 응용의 분류문제를 다룰 수 있다.

  • PDF

비정규 혼합분포에서의 최적분류점 (Optimal Thresholds from Non-Normal Mixture)

  • 홍종선;주재선
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.943-953
    • /
    • 2010
  • 신용평가연구에서 확률변수 스코어와 정상과 부도상태의 모수공간으로 정의된 혼합분포에서 확률밀도함수의 관계식으로 최적분류점을 추정하고 이에 대응하는 오류합의 크기를 비교하는 연구가 정규분포의 가정하에 이루어져있는데 본 연구에서는 비정규분포인 와이블, 로지스틱 그리고 감마분포로 확장하여 가설검정을 이용하는 방법과 전체정확도와 진실율을 최대화하는 방법에 의한 최적분류점을 각각 구하고 최적분류점에 대응하는 제I종과 제II종 오류합의 크기를 비교하여 효율성을 비교 토론한다.

혼합분포에서 최적분류점 (Optimal Thresholds from Mixture Distributions)

  • 홍종선;주재선;최진수
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.13-28
    • /
    • 2010
  • 혼합분포를 가정한 신용평가연구에서 부도차주를 정상으로 예측하거나 정상차주를 부도로 예측하는 오류를 최소화하는 분류점을 추정하는 방법을 토론한다. 확률변수 스코어와 정상과 부도상태의 모수공간으로 정의된 확률밀도함수들에 대하여 강력검정과 일반화가능도비검정을 이용하여 최적분류점의 추정방법을 제안하고, ROC와 CAP 곡선에서 분류정확도를 측정하는 정확도(accuarcy)와 진실율(true rate)을 이용하여 이 측도를 최대로 하는 최적분류점을 확률밀도함수의 관계식으로 추정하는 방법을 제안한다. 다양한 정규분포에서 가설검정, 정확도 그러고 진실율을 이용하는 세가지 방법의 최적분류점을 구하고 각최적분류점에 대응하는 제 I 종과 제 II 종 오류합의 크기를 비교하여 효율성을 토론한다.

오즈 곡선과 최적분류점 (Odds curve and optimal threshold)

  • 홍종선;오태규;오세현
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.807-822
    • /
    • 2021
  • 오즈 곡선으로 설명이 가능한 정확도 측도들을 살펴보고, 오즈 곡선의 성질을 바탕으로 대안적인 최대 사각형 정확도 측도를 제안한다. 다양한 확률분포함수와 실증예제를 고려하여 정확도 측도들에 대응하는 분류점을 구하고, 분류점을 측정하는 통계량들을 비교하면서 특징을 토론한다. 그러므로 ROC 곡선 등과 유사하게 오즈 곡선으로부터도 최적분류점들을 발견하고 설명할 수 있으며, 최대사각형 측도는 이진 분류모형의 성능을 향상시킬 수 있는 정확도 측도로 활용할 수 있다.