• 제목/요약/키워드: Misclassification

검색결과 226건 처리시간 0.034초

Hyperparameter Selection for APC-ECOC

  • Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권4호
    • /
    • pp.1219-1231
    • /
    • 2008
  • The main object of this paper is to develop a leave-one-out(LOO) bound of all pairwise comparison error correcting output codes (APC-ECOC). To avoid using classifiers whose corresponding target values are 0 in APC-ECOC and requiring pilot estimates we developed a bound based on mean misclassification probability(MMP). It can be used to tune kernel hyperparameters. Our empirical experiment using kernel mean squared estimate(KMSE) as the binary classifier indicates that the bound leads to good estimates of kernel hyperparameters.

  • PDF

PfSGA를 이용한 MLP 분류기의 구조 학습 (A Structural Learning of MLP Classifiers Using PfSGA)

  • 愼晟孝;金 商雲
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.1277-1280
    • /
    • 1998
  • We propose a structural learning method of MLP classifiers for a given application using PfSGA (parameter-free species genetic algorithm), which is a combining of species genetic algorithm(SGA) and parameter-free genetic algorithm(PfGA). experimental results show that PfSGA can reduce the learing time of SGA and has no influence of parameter values on structural learning. And we also convince that PfSGA is more efficient than the other methods in the aspect of misclassification ratio, learning rate, and complexity of MLP structure.

  • PDF

화질의 국소적 변화를 고려한 의용화상처리 (Medical Image Processing with Local Variati on of the Image Quality)

  • 홍승홍
    • 대한전자공학회논문지
    • /
    • 제12권1호
    • /
    • pp.1-6
    • /
    • 1975
  • 잡음을 포함한 저화질의용화상의 배경과 목적대상정을 분할하는 환경영역은 중요한 정보로 의학상 진단에 큰 의의를 갖고 있다. 이 논문의 목적은 화상의 농도변화를 정총화하여 통계적수법에 의해 환경영역을 결정하는 threshold를 구하는 방법을 제시하고 이를 비 scintigram에 적용하여 실험을 행했다. 전화상을 64개의 소영역으로 나누고 경계영역이 존재하는 부분온 선택하며 이 부분에 maximum likelihood법을 적용하여 threshold를 결정한뒤 내삽법에 의해 전화소에 대한 threshold를 구하고 수곽을 포함한 2식화면을 구했다. 이의 결과는 인간의 인식과 거의 같은 결과로 동적해석방법의 유효성이 증명되었다. The boundary has been one of the most important information in radiographic images and the degrees of difficulty involved varies greatly with the quality of the picture. These Buantifications are the means to diagnoses. The purpose of this paper is to quantify intensity variation and the threshold decision which is based on statistical principles and is developed to detect limits in liver scintigrams the entire picture is devide4 into 64 small regions. The kurtosis and variances for each smal region are used as indications to select the histograms the thresholds are computed according to the method o(maximum likelihood which minimizes the probability o( misclassification. Therefore Ive have demonstrated the applicability of the boundary detection and proved good agreement with human recognition, and we can use it for the diagnosis data of liver disease.

  • PDF

1차원 메디안 필터 기반 문서영상 영역해석 (The Region Analysis of Document Images Based on One Dimensional Median Filter)

  • 박승호;장대근;황찬식
    • 대한전자공학회논문지SP
    • /
    • 제40권3호
    • /
    • pp.194-202
    • /
    • 2003
  • 인쇄문서를 전자문서로 자동변환하기 위해서는 문서영상 영역해석과 문자인식 기술이 필요하다. 이들 중 영역해석은 문서영상을 세부 영역으로 분할하고, 분할한 영역을 문자, 그림, 표 등의 형태로 분류한파. 그러나 문자와 그림의 일부는 크기, 밀도, 화소분포의 복잡도가 비슷하여 정확한 분류가 어렵다. 따라서 영역해석에서의 오 분류는 자동변환을 어렵게 만드는 주된 원인이 된다. 본 논문에서는 분서영상을 문자와 그림영역으로 분할하는 영역해석 방법을 제안한다. 문자와 그림의 분류는 1차원 메디안 필터링을 기반으로 한 방법을 이용하여 언급한 문제점을 해결한다. 또한 메디안 필터링에 의해 발생하는 볼드체 문자와 그래프나 표와 같은 그림영역의 오 분류 문제를 표피 제거 필터와 문자의 최대크기를 이용하여 해결한다. 따라서 상용제품을 포함한 기존의 영역해석 방법보다 그 성능이 우수하다.

다수의 분류 기법의 예측 결과를 결합하기 위한 혼합 정수 계획법의 사용 (Aggregating Prediction Outputs of Multiple Classification Techniques Using Mixed Integer Programming)

  • Jo, Hongkyu;Han, Ingoo
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.71-89
    • /
    • 2003
  • 경영 분류 문제에 대한 많은 연구들은 여러가지 기법들간의 성과 비교에 대한 것이었지만, 각각의 연구들마다 가장 좋은 기법이 어떤 것인가에 대해서는 상이한 결론을 내고 있다. 다수의 분류 기법 중에서 가장 좋은 것을 사용하는 방법에 대한 대안으로,분류 기법을 통합하여 성과를 향상시키는 방법이 있다. 본 연구에서는 개별 분류 기법의 결과를 선형 결합하여 예측력을 높이는 방법을 제시하였다. 최 적 선형 결합 가중치를 계산하기 위해 혼합 정수 계 획 법을 사용하였다. 목적 함수로 사용한 오분류 비용의 최소화에서 오분류 비용은 부도 기업을 모형에서 정상으로 예측한 오류와 정상기업을 모형에서 부도 기업으로 예측한 오류의 합으로 정의하였다. 문제 풀이 과정을 단순화하기 위하여 본 논문에서는 절사점 (cutoff value)을 고정하였고, 경계 함수 (threshold function)를 배제하였다. 정수계획법의 계산을 위해 branch 8, bound 방법을 사용하였다. 선형 결합에 의한 모형의 예측력이 개별 기법에 의해 구축된 모형의 예측력을 상회하였고, 그 차이가 통계적으로도 유의하였다.

  • PDF

규칙기반 리듬 분류에 의한 심전도 신호의 비정상 검출 (Abnormality Detection of ECG Signal by Rule-based Rhythm Classification)

  • 류춘하;김성완;김세윤;김태훈;최병재;박길흠
    • 한국지능시스템학회논문지
    • /
    • 제22권4호
    • /
    • pp.405-413
    • /
    • 2012
  • 심전도 신호의 신뢰성 있는 진단을 위해서는 높은 분류 정확도와 함께 낮은 오분류 성능이 중요하며, 특히 비정상을 정상으로 진단하는 것은 심검자에게 치명적인 문제로 귀결될 수 있다. 본 논문에서는 임상 진단 기준을 반영하는 규칙기반 분류 알고리즘을 이용하여 비정상 리듬을 검출 및 분류하는 방법을 제안한다. 규칙기반 분류는 리듬 구간의 특징에 대한 규칙 베이스를 이용하여 리듬 유형을 분류하도록 하며, 이 때 규칙 베이스는 임상 및 내과 분야의 심전도 전문 임상 자료에 기반한 본 논문의 기준표에 따라 구성된다. MIT-BIH 부정맥 데이터베이스를 이용한 제안 방법의 실험을 통하여 정상동조율, 박동조율, 및 다양한 비정상 리듬에 대한 리듬 유형의 분류가 가능함을 확인하였으며, 특히 비정상 리듬 검출 측면에서는 오분류가 전혀 발생되지 않는 결과를 보였다.

두 단계 수리계획 접근법에 의한 신용평점 모델 (Credit Score Modelling in A Two-Phase Mathematical Programming)

  • Sung Chang Sup;Lee Sung Wook
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2002년도 춘계공동학술대회
    • /
    • pp.1044-1051
    • /
    • 2002
  • This paper proposes a two-phase mathematical programming approach by considering classification gap to solve the proposed credit scoring problem so as to complement any theoretical shortcomings. Specifically, by using the linear programming (LP) approach, phase 1 is to make the associated decisions such as issuing grant of credit or denial of credit to applicants. or to seek any additional information before making the final decision. Phase 2 is to find a cut-off value, which minimizes any misclassification penalty (cost) to be incurred due to granting credit to 'bad' loan applicant or denying credit to 'good' loan applicant by using the mixed-integer programming (MIP) approach. This approach is expected to and appropriate classification scores and a cut-off value with respect to deviation and misclassification cost, respectively. Statistical discriminant analysis methods have been commonly considered to deal with classification problems for credit scoring. In recent years, much theoretical research has focused on the application of mathematical programming techniques to the discriminant problems. It has been reported that mathematical programming techniques could outperform statistical discriminant techniques in some applications, while mathematical programming techniques may suffer from some theoretical shortcomings. The performance of the proposed two-phase approach is evaluated in this paper with line data and loan applicants data, by comparing with three other approaches including Fisher's linear discriminant function, logistic regression and some other existing mathematical programming approaches, which are considered as the performance benchmarks. The evaluation results show that the proposed two-phase mathematical programming approach outperforms the aforementioned statistical approaches. In some cases, two-phase mathematical programming approach marginally outperforms both the statistical approaches and the other existing mathematical programming approaches.

  • PDF

이변량 프로빗모형을 이용한 미결정자 추론 (Undecided inference using bivariate probit models)

  • 홍종선;정미향
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1017-1028
    • /
    • 2011
  • 신용평가를 판단하기 어렵기 때문에 평가를 유보하고 특별한 전문가에게 재심사를 의뢰하기 위하여 결정이 보류된 미결정자에 대한 미결정자 추론은 신용평가 분야 이외에도 의학통계와 스포츠통계등 대부분의 통계적 모형에서 발생하는 문제이다. 본 연구에서는 미결정자 추론을 비임의결측 가정하에서의 결측자료 유형으로 간주하고, 표본선택모형 중의 하나인 이변량 프로빗모형을 이용한다. 결정된 차주의 특성을 나타내는 확률변수를 사용하여 미결정자를 추론하는 방법과 보다 정확한 정보를 수집한 후 추가적인 확률변수를 사용하여 추론하는 방법을 제안한다. 실증예제를 통하여 특성변수의 조합과 다양한 미결정 구간, 그리고 절단점의 변동에 따라 미결정자와 전체 오분류율을 비교한다. 미결정구간을 확대하거나 정확한 신용정보를 모형에 추가하여 사용하면 정상 집단과 부도 집단의 정보를 더욱 정확하게 반영할 수 있기 때문에 미결정자와 전체 오분류율의 큰 감소효과를 기대할 수 있다.

악성코드 변종 분석을 위한 AI 모델의 Robust 수준 측정 및 개선 연구 (A Study on Robustness Evaluation and Improvement of AI Model for Malware Variation Analysis)

  • 이은규;정시온;이현우;이태진
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.997-1008
    • /
    • 2022
  • 오늘날 AI(Artificial Intelligence) 기술은 악성코드 분야를 비롯하여 다양한 분야에서 광범위하게 연구되고 있다. 중요한 의사결정 및 자원을 보호하는 역할에 AI 시스템을 도입하기 위해서는 신뢰할 수 있는 AI 모델이어야 한다. 학습 데이터셋에 의존적인 AI 모델은 새로운 공격에 대해서도 견고한지 확인이 필요하다. 공격자는 악성코드를 새로 생성하기보단, 기존에 탐지되었던 악성코드의 변종을 대량 생산하여 공격에 성공하는 악성코드를 탐색다. AI 모델의 Misclassification을 유도하는 Adversarial attack과 같이 대부분의 공격은 기존 공격에 약간에 변형을 가해 만든 공격들이다. 이러한 변종에도 대응 가능한 Robust한 모델이 필요하며, AI 평가지표로 많이 사용되는 Accuracy, Recall 등으로는 모델의 Robustness 수준을 측정할 수 없다. 본 논문에서는 Adversarial attack 중 하나인 C&W attack을 기반으로 Adversarial sample을 생성하여 Robustness 수준을 측정하고 Adversarial training 을 통해 Robustness 수준을 개선하는 방법을 실험한다. 본 연구의 악성코드 데이터셋 기반 실험을 통해 악성코드 분야에서 해당 제안 방법의 한계 및 가능성을 확인하였다.

Exploring the Feasibility of Neural Networks for Criminal Propensity Detection through Facial Features Analysis

  • Amal Alshahrani;Sumayyah Albarakati;Reyouf Wasil;Hanan Farouquee;Maryam Alobthani;Someah Al-Qarni
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.11-20
    • /
    • 2024
  • While artificial neural networks are adept at identifying patterns, they can struggle to distinguish between actual correlations and false associations between extracted facial features and criminal behavior within the training data. These associations may not indicate causal connections. Socioeconomic factors, ethnicity, or even chance occurrences in the data can influence both facial features and criminal activity. Consequently, the artificial neural network might identify linked features without understanding the underlying cause. This raises concerns about incorrect linkages and potential misclassification of individuals based on features unrelated to criminal tendencies. To address this challenge, we propose a novel region-based training approach for artificial neural networks focused on criminal propensity detection. Instead of solely relying on overall facial recognition, the network would systematically analyze each facial feature in isolation. This fine-grained approach would enable the network to identify which specific features hold the strongest correlations with criminal activity within the training data. By focusing on these key features, the network can be optimized for more accurate and reliable criminal propensity prediction. This study examines the effectiveness of various algorithms for criminal propensity classification. We evaluate YOLO versions YOLOv5 and YOLOv8 alongside VGG-16. Our findings indicate that YOLO achieved the highest accuracy 0.93 in classifying criminal and non-criminal facial features. While these results are promising, we acknowledge the need for further research on bias and misclassification in criminal justice applications