• 제목/요약/키워드: One-Class Classification

검색결과 348건 처리시간 0.025초

기업부실 예측 데이터의 불균형 문제 해결을 위한 앙상블 학습 (Ensemble Learning for Solving Data Imbalance in Bankruptcy Prediction)

  • 김명종
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.1-15
    • /
    • 2009
  • 데이터 불균형 문제는 분류 및 예측 문제에서 하나의 범주에 속하는 표본의 수가 다른 범주들에 속하는 표본 수에 비하여 현저하게 적을 경우 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류 경계영역이 왜곡되고 결과적으로 분류자의 학습성과가 저하되는 문제가 발생한다. 본 연구에서는 데이터 불균형 문제를 해결하기 위하여 Geometric Mean-based Boosting (GM-Boost) 알고리즘을 제안하고자 한다. GM-Boost 알고리즘은 기하평균 개념에 기초하고 있어 다수 범주와 소수 범주를 동시에 고려한 학습이 가능하고 오분류된 표본에 집중하여 학습을 강화할 수 있는 장점이 있다. 기업부실 예측문제를 활용하여 GM-Boost 알고리즘의 성과를 검증한 결과 기존의Under-Sampling, Over-Sampling 및 AdaBoost 알고리즘에 비하여 우수한 분류 정확성을 보여주었고 데이터 불균형 정도에 관계없이 견고한 학습성과를 나타냈다.

  • PDF

퍼지 매핑을 이용한 퍼지 패턴 분류기의 Feature Selection (Feature Selection of Fuzzy Pattern Classifier by using Fuzzy Mapping)

  • 노석범;김용수;안태천
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.646-650
    • /
    • 2014
  • 본 논문에서는 다차원 문제로 인하여 발생하는 패턴 분류 성능의 저하를 방지 하여 퍼지 패턴 분류기의 성능을 개선하기 위하여 다수의 Feature들 중에서 패턴 분류 성능 향상에 기여하는 Feature를 선택하기 위한 새로운 Feature Selection 방법을 제안 한다. 새로운 Feature Selection 방법은 각각의 Feature 들을 퍼지 클러스터링 기법을 이용하여 클러스터링 한 후 각 클러스터가 임의의 class에 속하는 정도를 계산하고 얻어진 값을 이용하여 해당 feature 가 fuzzy pattern classifier에 적용될 경우 패턴 분류 성능 개선 가능성을 평가한다. 평가된 성능 개선 가능성을 기반으로 이미 정해진 개수만큼의 Feature를 선택하는 Feature Selection을 수행한다. 본 논문에서는 제안된 방법의 성능을 평가, 비교하기 위하여 다수의 머신 러닝 데이터 집합에 적용한다.

한국 호소 상층부의 영양상태지수 제안 (Suggestion for Trophic State Index of Korean Lakes (Upper Layer))

  • 공동수;김범철
    • 한국물환경학회지
    • /
    • 제35권4호
    • /
    • pp.340-351
    • /
    • 2019
  • In this study, the relationship between trophic state indices was analyzed based on the monthly or weekly water quality data of 81 lakes (mostly man-made) in Korea between 2013-2017. Carlson's $TSI_C$ and Aizaki's $TSI_m$ were calculated using the summer (Jun.-Sep.) average data at the upper water layer. The previous Korean trophic state index ($TSI_{KO}$) and the newly suggested index ($TSI_{KON}$) was calculated using the annual average data at the whole layer and at the upper layer, respectively. While previous trophic state index (TSI) such as Carlson's TSI included logarithmic function, we devised newly Monod-type $TSI_{KON}$(Chl) that is 50 when half-saturation concentration of chlorophyll ${\alpha}$ ($Chl.{\alpha}$) measured by UNESCO-method is $10{\mu}gL^{-1}$. MMF-type $TSI_{KON}$(TP) was derived based on the relationship between TP and $Chl.{\alpha}$. A comprehensive $TSI_{KON}$ was decided as the larger one of the two $TSI_{KON}$ values. The range of previous TSI was usually 40-50 for the mesotrophic state, which seemed narrow to discriminate trophic characteristics of the class. The upper limits of $TSI_{KON}$ for oligotrophic, mesotrophic, and eutrophic state were set to 23, 50 and 75, respectively. Classification by $TSI_C$ and $TSI_m$ showed higher frequency of eutrophic class compared to $TSI_{KO}$ and $TSI_{KON}$. This means that the estimation by TSIs developed in foreign natural lakes can lead to distorted results in the classification of the trophic state of Korean lakes. This is due to the decrease of transparency by non-algal material and the reduction in phosphorus availability to algal growth, particularly in Monsoon period.

더미 클래스를 가지는 열린 집합 얼굴 인식 방법의 유효성 검증에 대한 연구 (A Study on the Validation Test for Open Set Face Recognition Method with a Dummy Class)

  • 안정호;최권택
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권3호
    • /
    • pp.525-534
    • /
    • 2017
  • 열린 집합 인식 방법론은 테스트 데이터의 클래스를 학습 시에 모두 파악할 수 없는 경우에 대한 인식 방법론이다. 따라서 열린 집합 인식 방법론은 분류와 유효성 검증의 절차를 필요로 한다. 이러한 연구는 얼굴 인식 모듈의 상용화를 위해 필수적이지만 지금까지 국내에서 연구 결과들이 거의 발표되지 않았다. 우리는 두 개의 검증 단계를 가지는 열린 집합 얼굴 인식 방법론을 제안한다. 첫 번째 단계에서는 학습 클래스 외에 더미 클래스들을 설정하고 희소표현 기반 분류를 수행한다. 이 때 테스트 데이터가 더미 클래스로 분류되면 무효 데이터로 판별하고, 유효한 클래스로 분류되면 다음 유효성 검증 단계로 넘어간다. 두 번째 단계에서 제안하는 네 가지 특징을 추출하고, 확률분포에 기반을 둔 판별함수를 통해 유효성 검증을 수행한다. 우리는 실험을 통해 열린 집합 인식 방법론의 시뮬레이션 방법을 제안하였고 제안하는 방법론의 성능을 제시하고, 희소기반 분류 방식에서 널리 사용되는 SCI 지표를 이용한 유효성 테스트보다 높은 성능을 보임을 입증할 수 있었다.

원격탐사 영상의 분류정확도 향상을 위한 인공지능형 시스템의 적용 (An Application of Artificial Intelligence System for Accuracy Improvement in Classification of Remotely Sensed Images)

  • 양인태;한성만;박재국
    • 한국측량학회지
    • /
    • 제20권1호
    • /
    • pp.21-31
    • /
    • 2002
  • 이 연구는 원격탐사 영상의 분류정확도를 향상시키기 위한 방법으로써 신경망 이론과 퍼지집합이론을 각각 적용하였다. 원격탐사 영상은 토지피복도, 식생도, 지질도 등 주제도를 만드는데 많이 이용되고 있다. 원격탐사 영상의 감독분류에 대한 정확도는 트레이닝 지역의 선정, 분류항목의 할당 문제로 인해 많은 차이를 보인다. 일반적인 영상 분류법은 영상 내의 모든 영상소가 균질하다고 가정한다. 그러나, 이러한 가정은 영상내의 수많은 혼합 영상소를 분류해내는 데에는 적합하지 않다. 이러한 문제를 극복하기 위해 퍼지 집합이론을 적용하였으며, 퍼지 집합이론의 멤버쉽을 이용하였다. 퍼지 집합이론은 하나의 영상소를 멤버쉽의 정도에 따라 여러 가지 항목으로 분류할 수 있는 장점이 있다. 그러나, 퍼지분류법과 통계학적인 분류법은 화소값의 분포가 비정규적일 때 좋지 않은 분류 결과를 나타내며 처리 시간이 늦고 많은 컴퓨팅 비용이 드는 단점이 있다. 그 대안적인 방법으로서 신경망분류법을 들 수 있는데, 신경망 분류법은 비모수적 분류법으로서 일반적인 분류기법보다 좀 더 좋은 결과를 나타내고 있고, 한번 트레이닝 되면 빠르게 데이터를 분류할 수 있다.

분류 오류 최소화를 위한 클러스터링 기법 (A New Clustering Method for Minimum Classification Error)

  • 허경용;김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권7호
    • /
    • pp.1-8
    • /
    • 2014
  • 클러스터링은 대표적인 비교사 학습 방법의 하나로 균일한 특성을 가지는 데이터를 군집으로 묶기 위해 사용된다. 균일한 특성을 가지는 데이터 부분집합을 문맥으로 정의하고 문맥 내에서 국부적으로 분류를 행하는 융합 방법이 사용되고 있지만 클러스터링은 비교사 학습 방법이라는 한계로 인해 클러스터링 결과로 만들어지는 문맥이 분류에 있어 최선임을 보장하기 어렵다. 이 논문에서는 생성된 클러스터를 문맥으로 가정하고 각 문맥에서 분류를 시행하는 경우 최소의 오류를 보일 수 있는, 분류를 고려한 클러스터링 기법을 제안한다. 제안하는 방법은 선형 판별 분석에서와 유사하게 클러스터 내 동일한 클래스에 속하는 데이터 쌍은 작은 거리 값을, 서로 다른 클래스에 속하는 데이터 쌍은 큰 거리 값을 가지도록 하기 위한 제약 조건을 적용하여 분류 오류를 줄이도록 하였다. 제안한 방법의 실효성은 실험 결과를 통해 확인할 수 있다.

이진 분류를 위하여 거리계산을 이용한 특징 변환 기반의 가중된 최소 자승법 (Weighted Least Squares Based on Feature Transformation using Distance Computation for Binary Classification)

  • 장세인;박충식
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.219-224
    • /
    • 2020
  • 이진 분류(binary classification)는 머신러닝(machine learning) 분야에서 많이 다루어진 주제이다. 게다가 이진 분류는 다중 분류로 쉽게 발전될 수 있는 중요한 분야이다. 머신러닝 방법들을 적용할 때에 전처리(preprocessing)이나 특징 추출(feature extraction)과 같은 작업이 필수적이다. 이는 분류기 성능을 향상시키기 위한 중요한 작업이다. 본 논문에서는 가중된 최소 자승법을 기반으로 새로운 머신러닝 방법을 제안한다. 또한, 특징 변환시킬 수 있는 새로운 가중치 계산 방법을 제안한다. 이를 통해 특징 변환과 동시에 학습을 진행할 수 있는 방법을 제안한다. 본 제안을 다섯 개의 머신러닝 데이터베이스에서 실험을 진행하였으며 이 데이터베이스에서 우수한 성능을 얻을 수 있었다.

점진적 중심 갱신을 이용한 deep support vector data description 기반의 온라인 비정상 탐지 알고리즘 (Online anomaly detection algorithm based on deep support vector data description using incremental centroid update)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.199-209
    • /
    • 2022
  • 일반적인 비정상 탐지 알고리즘은 사전 데이터를 이용하여 학습된다. 따라서 시간에 따른 정상 데이터의 특징이 변화되는 경우에 기존의 배치 학습 기반 알고리즘의 성능 저하가 불가피하다. 본 논문에서는 정상 데이터의 점진적 특징 변화를 고려할 수 있는 온라인 비정상 탐지 알고리즘을 제안한다. 제안하는 알고리즘은 단일 클래스 분류 모델에 기반하며 오프라인 및 온라인 단계의 학습 과정을 포함한다. 제안된 알고리즘의 오프라인 학습 단계에서는 사전 데이터가 잠재 공간의 중심에 근접하도록 학습하고, 이후 온라인 학습단계에서는 신규 데이터에 의한 점진적 잠재 공간의 중심을 갱신하고, 갱신된 중심을 기준으로 계속 학습을 진행한다. 공개된 수중 음향 데이터를 이용한 실험결과 제안된 온라인 비정상 탐지 알고리즘은 점진적 중심 갱신 및 학습을 위해 단지 2 % 정도의 추가 학습시간이 소요되는 것으로 확인되었다. 반면에 시변 정상데이터가 수신되는 경우에 오프라인 학습 모델과 비교하여 19.10 % 개선된 Area Under the receiver operating characteristic Curve(AUC) 성능을 보였다.

Accuracy of one-step automated orthodontic diagnosis model using a convolutional neural network and lateral cephalogram images with different qualities obtained from nationwide multi-hospitals

  • Yim, Sunjin;Kim, Sungchul;Kim, Inhwan;Park, Jae-Woo;Cho, Jin-Hyoung;Hong, Mihee;Kang, Kyung-Hwa;Kim, Minji;Kim, Su-Jung;Kim, Yoon-Ji;Kim, Young Ho;Lim, Sung-Hoon;Sung, Sang Jin;Kim, Namkug;Baek, Seung-Hak
    • 대한치과교정학회지
    • /
    • 제52권1호
    • /
    • pp.3-19
    • /
    • 2022
  • Objective: The purpose of this study was to investigate the accuracy of one-step automated orthodontic diagnosis of skeletodental discrepancies using a convolutional neural network (CNN) and lateral cephalogram images with different qualities from nationwide multi-hospitals. Methods: Among 2,174 lateral cephalograms, 1,993 cephalograms from two hospitals were used for training and internal test sets and 181 cephalograms from eight other hospitals were used for an external test set. They were divided into three classification groups according to anteroposterior skeletal discrepancies (Class I, II, and III), vertical skeletal discrepancies (normodivergent, hypodivergent, and hyperdivergent patterns), and vertical dental discrepancies (normal overbite, deep bite, and open bite) as a gold standard. Pre-trained DenseNet-169 was used as a CNN classifier model. Diagnostic performance was evaluated by receiver operating characteristic (ROC) analysis, t-stochastic neighbor embedding (t-SNE), and gradient-weighted class activation mapping (Grad-CAM). Results: In the ROC analysis, the mean area under the curve and the mean accuracy of all classifications were high with both internal and external test sets (all, > 0.89 and > 0.80). In the t-SNE analysis, our model succeeded in creating good separation between three classification groups. Grad-CAM figures showed differences in the location and size of the focus areas between three classification groups in each diagnosis. Conclusions: Since the accuracy of our model was validated with both internal and external test sets, it shows the possible usefulness of a one-step automated orthodontic diagnosis tool using a CNN model. However, it still needs technical improvement in terms of classifying vertical dental discrepancies.

청아치과병원 교정과에 내원한 환자의 분포와 부정교합의 유형 (A Study On Malocclusion Patients From Department Of Orthodontics, Chong-A Dental Hospital)

  • 김남중;이청재
    • 대한치과기공학회지
    • /
    • 제29권2호
    • /
    • pp.197-211
    • /
    • 2007
  • With the development of orthodontics and increasing concerns on physical appearance, the number of patients has been steadily increasing. It is quite important not only to make effective cure plans and accurate diagnoses but also to have a thorough grasp of patients' malocclusion types and their occurrence frequency, in addition to patients' personality in order to cure the patients appropriately. This study is based on 946 malocclusion patients who had visited Chong-A Dental Hospital from 1999 to 2004 and investigated their aspects of malocclusion and characteristics of their gender, age and residence. The results are as follows. 1. The number of patients per year had been decreased until 2001, after which year the number had fluctuated. The number was the largest in 1999, 169 and the smallest in 2001, 140. Female occupied 68.0% of the total, twice as many as male, 32.0%) 2. Based on the Angle's classification, 19 or over year - old group was the largest of the total, 59.3% and 6 or younger year - old group, the smallest, 0.5%. The 19 or over year old group was less than a half of the total (47.4%) in 2003 and there were no patients who belonged to the 6 or younger year - old group in 2003 and 2004. 3. Distributions on the types of malocclusion have shown that 39.9 % of the total are in the Class I, the largest, 31.0% in the Class I and 29.2 in the Class II, the smallest. 1) The number of the ClassI was 73, the largest, that of the Class III being 35, the smallest in 1999. On the whole, the number of the Class I accounted for the largest part of the total. 2) The number of male patients in the Class II was the smallest, generally being the largest in the Class I. In case of female, that of the Class III was the smallest. 3) Based on the age, the Class I was the highest in between 7 and 13 age group, the Class III the lowest. The Class I occupied the largest around 40%. 4) In the shape of physiognomy, the meso occupied the largest part among all the Class, of which the Class II was the highest, 64.2%. The bracy was the largest in the Class I, and the dolicho in the Class III. 5) In the profile, the convex shape was the largest in the Class I and II, and especially in the Class II, over 3/4 of the total, 75.4%. In contrast, the direct shape was the largest in the Class III and the sunken shape occupied 33.3%, which was nearly ten times more than the case of the Class I and III. 6) In the asymmetry of physiognomy, the number of patients of the Class IIIwas the largest, 34.1% and that of the Class II, the smallest, 19.5%. It was found that about one fourth of the malocclusion patients were under the asymmetry of physiognomy. 4. In the distribution of patients' residence, 81.4% were from the Seoul Metropolis and 48.2% from Gangnam-Gu where Chong-A Dental Hospital is located and Seocho-Gu and Songpa-Gu which are adjacent to Gangnam-Gu.

  • PDF