• 제목/요약/키워드: Classification Algorithms

검색결과 1,182건 처리시간 0.033초

가우시안 기반 Hyper-Rectangle 생성을 이용한 효율적 단일 분류기 (An Efficient One Class Classifier Using Gaussian-based Hyper-Rectangle Generation)

  • 김도균;최진영;고정한
    • 산업경영시스템학회지
    • /
    • 제41권2호
    • /
    • pp.56-64
    • /
    • 2018
  • In recent years, imbalanced data is one of the most important and frequent issue for quality control in industrial field. As an example, defect rate has been drastically reduced thanks to highly developed technology and quality management, so that only few defective data can be obtained from production process. Therefore, quality classification should be performed under the condition that one class (defective dataset) is even smaller than the other class (good dataset). However, traditional multi-class classification methods are not appropriate to deal with such an imbalanced dataset, since they classify data from the difference between one class and the others that can hardly be found in imbalanced datasets. Thus, one-class classification that thoroughly learns patterns of target class is more suitable for imbalanced dataset since it only focuses on data in a target class. So far, several one-class classification methods such as one-class support vector machine, neural network and decision tree there have been suggested. One-class support vector machine and neural network can guarantee good classification rate, and decision tree can provide a set of rules that can be clearly interpreted. However, the classifiers obtained from the former two methods consist of complex mathematical functions and cannot be easily understood by users. In case of decision tree, the criterion for rule generation is ambiguous. Therefore, as an alternative, a new one-class classifier using hyper-rectangles was proposed, which performs precise classification compared to other methods and generates rules clearly understood by users as well. In this paper, we suggest an approach for improving the limitations of those previous one-class classification algorithms. Specifically, the suggested approach produces more improved one-class classifier using hyper-rectangles generated by using Gaussian function. The performance of the suggested algorithm is verified by a numerical experiment, which uses several datasets in UCI machine learning repository.

프로세스 정보와 QoS를 고려한 웹 서비스 발견 (Web Service Discovery based on Process Information and QoS)

  • 유소연;유정연;이규철
    • 한국전자거래학회지
    • /
    • 제10권3호
    • /
    • pp.85-110
    • /
    • 2005
  • 현재 시맨틱 웹 서비스 발견에 대한 연구는 OWL-S를 중심으로 LARKS프로젝트와 METEOR-S 프로젝트에서 활발히 이루어지고 있다. 그러나 이들 프로젝트들은 OWL-S의 발견 요소를 모두 포함하고 있지 않고 발견 알고리즘을 개선할 필요가 있다. 따라서 본 논문에서는 OWL-S의 발견 요소 중 기존 연구에서 고려하지 않은 프로세스 구조 매칭 알고리즘과 METEOR-S 프로젝트의 QoS 매칭에 대한 알고리즘을 개선한 QoS 매칭 알고리즘을 제안한다. 또한 서비스 분류 매칭과 비즈니스 패턴 매칭을 새롭게 정의한다. 마지막으로 사용자의 선호도를 고려한 매칭 통합 알고리즘을 제안한다.

  • PDF

Fake News Detector using Machine Learning Algorithms

  • Diaa Salama;yomna Ibrahim;Radwa Mostafa;Abdelrahman Tolba;Mariam Khaled;John Gerges;Diaa Salama
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.195-201
    • /
    • 2024
  • With the Covid-19(Corona Virus) spread all around the world, people are using this propaganda and the desperate need of the citizens to know the news about this mysterious virus by spreading fake news. Some Countries arrested people who spread fake news about this, and others made them pay a fine. And since Social Media has become a significant source of news, .there is a profound need to detect these fake news. The main aim of this research is to develop a web-based model using a combination of machine learning algorithms to detect fake news. The proposed model includes an advanced framework to identify tweets with fake news using Context Analysis; We assumed that Natural Language Processing(NLP) wouldn't be enough alone to make context analysis as Tweets are usually short and do not follow even the most straightforward syntactic rules, so we used Tweets Features as several retweets, several likes and tweet-length we also added statistical credibility analysis for Twitter users. The proposed algorithms are tested on four different benchmark datasets. And Finally, to get the best accuracy, we combined two of the best algorithms used SVM ( which is widely accepted as baseline classifier, especially with binary classification problems ) and Naive Base.

SVM과 meta-learning algorithm을 이용한 고지혈증 유병 예측모형 개발과 활용 (Development and application of prediction model of hyperlipidemia using SVM and meta-learning algorithm)

  • 이슬기;신택수
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.111-124
    • /
    • 2018
  • 본 연구는 만성질환 중의 하나인 고지혈증 유병을 예측하는 분류모형을 개발하고자 한다. 이를 위해 SVM과 meta-learning 알고리즘을 이용하여 성과를 비교하였다. 또한 각 알고리즘에서 성과를 향상시키기 위해 변수선정 방법을 통해 유의한 변수만을 선정하여 투입하여 분석하였고 이 결과 역시 각각 성과를 비교하였다. 본 연구목적을 달성하기 위해 한국의료패널 2012년 자료를 이용하였고, 변수 선정을 위해 세 가지 방법을 사용하였다. 먼저 단계적 회귀분석(stepwise regression)을 실시하였다. 둘째, 의사결정나무(decision tree) 알고리즘을 사용하였다. 마지막으로 유전자 알고리즘을 사용하여 변수를 선정하였다. 한편, 이렇게 선정된 변수를 기준으로 SVM, meta-learning 알고리즘 등을 이용하여 고지혈증 환자분류 예측모형을 비교하였고, TP rate, precision 등을 사용하여 분류 성과를 비교분석하였다. 이에 대한 분석결과는 다음과 같다. 첫째, 모든 변수를 투입하여 분류한 결과 SVM의 정확도는 88.4%, 인공신경망의 정확도는 86.7%로 SVM의 정확도가 좀 더 높았다. 둘째, stepwise를 통해 선정된 변수만을 투입하여 분류한 결과 전체 변수를 투입하였을 때보다 각각 정확도가 약간 높았다. 셋째, 의사결정나무에 의해 선정된 변수 3개만을 투입하였을 때 인공신경망의 정확도가 SVM보다 높았다. 유전자 알고리즘을 통해 선정된 변수를 투입하여 분류한 결과 SVM은 88.5%, 인공신경망은 87.9%의 분류 정확도를 보여 주었다. 마지막으로, 본 연구에서 제안하는 meta-learning 알고리즘인 스태킹(stacking)을 적용한 결과로서, SVM과 MLP의 예측결과를 메타 분류기인 SVM의 입력변수로 사용하여 예측한 결과, 고지혈증 분류 정확도가 meta-learning 알고리즘 중에서는 가장 높은 것으로 나타났다.

실시간 영상 지오레퍼런싱을 위한 온라인 항공삼각측량 알고리즘의 비교 및 성능 검증 (Comparison and Performance Validation of On-line Aerial Triangulation Algorithms for Real-time Image Georeferencing)

  • 최경아;이임평
    • 대한원격탐사학회지
    • /
    • 제28권1호
    • /
    • pp.55-67
    • /
    • 2012
  • 멀티센서 시스템으로부터 취득된 영상을 이용하여 공간정보를 신속하게 생성하기 위해서 영상의 실시간 지오레퍼런싱이 요구된다. 위치/자세 센서의 성능을 보완하며 실시간 처리가 가능하려면 연속 추정 알고리즘을 활용한 온라인 항공삼각측량이 수행되어야 한다. 본 연구는 연속적으로 취득되는 영상의 실시간 지오레퍼런싱을 위한 효율적인 온라인 항공삼각측량 방법론을 도출하고자 한다. 기존의 기븐스 변환 갱신 알고리즘과 최근 개발된 관측값 분류에 기반한 정규행렬 역행렬 갱신 알고리즘을 활용하여 온라인 항공삼각 측량을 구현하였다. 정확도와 연산 속도 측면에서 두 알고리즘의 성능을 비교 검증하기 위하여 항공 멀티센서 시스템으로부터 취득된 센서 데이터를 모의 생성하고 이를 적용하였다. 적용 결과, 관측값 분류에 기반한 정규행렬 역행렬 갱신에 의한 온라인 항공삼각측량이 기븐스 변환에 의한 방법보다 추정된 지상점 좌표에 대하여 40 % 이상 높은 정확도를 보이고, 8배 이상의 빠른 처리 속도를 나타내었다. 따라서, 영상의 실시간 지오레퍼런싱을 위하여 정규행렬 역행렬 갱신에 의한 온라인 항공삼각측량이 더 적합한 것으로 판단되었다.

군집화와 유전 알고리즘을 이용한 거친-섬세한 분류기 앙상블 선택 (Coarse-to-fine Classifier Ensemble Selection using Clustering and Genetic Algorithms)

  • 김영원;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.857-868
    • /
    • 2007
  • 좋은 분류기 앙상블은 분류기간에 상호 보완성을 갖추어 높은 인식 성능을 보여야 하며, 크기가 작아 계산 효율이 좋아야 한다. 이 논문은 이러한 목적을 달성하기 위한 거친-섬세한 (coarse-to-fine)단계를 밟는 분류기 앙상블 선택 방법을 제안한다. 이 방법이 성공하기 위해서는 초기 분류기 풀 (pool)이 충분히 다양해야 한다. 이 논문에서는 여러 개의 서로 다른 분류 알고리즘과 아주 많은 수의 특징 부분집합을 결합하여 충분히 큰 분류기 풀을 생성한다. 거친 선택 단계에서는 분류기 풀의 크기를 적절하게 줄이는 것이 목적이다. 분류기 군집화 알고리즘을 사용하여 다양성을 최소로 희생하는 조건하에 분류기 풀의 크기를 줄인다. 섬세한 선택에서는 유전 알고리즘을 이용하여 최적의 앙상블을 찾는다. 또한 탐색 성능이 개선된 혼합 유전 알고리즘을 제안한다. 널리 사용되는 필기 숫자 데이타베이스를 이용하여 기존의 단일 단계 방법과 제안한 두 단계 방법의 성능을 비교한 결과 제안한 알고리즘이 우수함을 입증하였다.

일반화된 캐스케이드 코릴레이션 알고리즘과 일반화된 순환 캐스케이드 코릴레이션 알고리즘의 결합을 통한 학습 능력 향상 (Improvement of Learning Capability with Combination of the Generalized Cascade Correlation and Generalized Recurrent Cascade Correlation Algorithms)

  • 이상화;송해상
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.97-105
    • /
    • 2009
  • 본 논문에서는 일반화된 캐스케이드 코릴레이션 학습 알고리즘과 일반화된 순환 캐스케이드 코릴레이션 학습 알고리즘의 결합을 통한 새로운 알고리즘을 소개한다. 이 새로운 알고리즘은 패턴분류문제(pattern classification problem)의 신속한 해결을 위하여 비순환 뉴런이 유리한지 순환 뉴런이 유리한지 또는 수직성장이 유리한지 수평성장이 유리한지 고민할 필요 없이 후보뉴런의 학습 중에 네트워크의 구성을 스스로 결정한다. 이 알고리즘의 성능평가를 위하여 학습 알고리즘에서 중요한 기준 문제(benchmark problem) 중의 하나인 콘택트렌즈 문제(Contact lens problem)와 밸런스 스케일 문제 (Balance scale problem)에 대하여 실험하였고 기존의 캐스케이드 코릴레이션 알고리즘 및 순환 캐스케이드 코릴레이션 알고리즘과 성능을 비교 하였다. 이 실험에서 활성화 함수는 일반적으로 많이 사용하는 시그모이드 함수(sigmoidal function) 와 하이퍼볼릭탄젠트 함수(hyperbolic tangent function)를 사용하였다. 이 새로운 알고리즘은 학습을 통하여 기존의 알고리즘보다 적은 수의 은닉뉴런을 생성하여 보다 빠른 학습 속도를 보여주었다.

기계학습을 이용한 돈사 급수량 예측방안 개발 (Prediction of Water Usage in Pig Farm based on Machine Learning)

  • 이웅섭;류종열;반태원;김성환;최희철
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1560-1566
    • /
    • 2017
  • 최근 사물 인터넷 센서가 설치된 스마트 돈사의 보급을 통해 돈사 관련 빅데이터 축적이 가능해졌고, 다양한 기계 학습방안들이 수집된 데이터에 적용되어 축산농가의 생산성을 향상시키고 있다. 본 연구에서는 다양한 기계학습 방안을 이용하여 돈사관리에서 가장 중요한 요소 중 하나인 급수량을 예측하였다. 구체적으로 실제 돈사에서 수집된 데이터에 회귀 방안인 선형회귀, 회귀트리 및 아다부스트 회귀 방안과 분류 방안인 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 분류방안을 적용하여 돈사의 온도와 습도를 기반으로 급수량을 예측하였다. 성능 분석을 통해서 제안한 방안이 높은 정확도로 급수량을 예측하는 것을 확인할 수 있었다. 제안한 방안은 돈사의 급수시설 이상을 조기에 파악하는데 활용되어 가축을 폐사를 막고 돈사 생산성을 높이는데 활용될 수 있다.

퍼지로직과 유전 알고리즘을 이용한 영상 인식 (Image Recognition by Fuzzy Logic and Genetic Algorithms)

  • 류상진;나철훈
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.969-976
    • /
    • 2007
  • 유전자 알고리즘을 이용한 다양한 특징의 분석이 필요한 퍼지 분류기의 설계 방법을 제안한다. 본 논문에서 제안한 퍼지 분류기는 퍼지 논리를 이용한 분류 부분과 유전자 알고리즘을 이용한 규칙 생성 부분으로 구성된다. 유전자 알고리즘을 이용한 규칙 생성 부분에서는 최적의 퍼지 멤버쉽 함수를 결정하고, 각 특징이 규칙에 포함되는지 포함되지 않는지의 여부도 결정하게 된다. 또한, 특정 대상에 대한 인식률을 분석하여 큰 오인식률을 갖는 부분에 세부 특징을 추가하는 방법과 문자열과 population의 최소 크기, 인식률 개선을 위한 반복적 분석 방법을 사용한다. 제안된 퍼지 분류기의 적용 예로서, 아이리스 데이터와 갑상선 종양 세포의 식별을 든다. 본 논문에서 제안한 퍼지 분류기는 아이리스 데이터에 대해 98.67%의 인식률을, 갑상선 종양 세포에 대해서 98.25%의 인식률을 얻었다.

An intelligent method for pregnancy diagnosis in breeding sows according to ultrasonography algorithms

  • Jung-woo Chae;Yo-han Choi;Jeong-nam Lee;Hyun-ju Park;Yong-dae Jeong;Eun-seok Cho;Young-sin, Kim;Tae-kyeong Kim;Soo-jin Sa;Hyun-chong Cho
    • Journal of Animal Science and Technology
    • /
    • 제65권2호
    • /
    • pp.365-376
    • /
    • 2023
  • Pig breeding management directly contributes to the profitability of pig farms, and pregnancy diagnosis is an important factor in breeding management. Therefore, the need to diagnose pregnancy in sows is emphasized, and various studies have been conducted in this area. We propose a computer-aided diagnosis system to assist livestock farmers to diagnose sow pregnancy through ultrasound. Methods for diagnosing pregnancy in sows through ultrasound include the Doppler method, which measures the heart rate and pulse status, and the echo method, which diagnoses by amplitude depth technique. We propose a method that uses deep learning algorithms on ultrasonography, which is part of the echo method. As deep learning-based classification algorithms, Inception-v4, Xception, and EfficientNetV2 were used and compared to find the optimal algorithm for pregnancy diagnosis in sows. Gaussian and speckle noises were added to the ultrasound images according to the characteristics of the ultrasonography, which is easily affected by noise from the surrounding environments. Both the original and noise added ultrasound images of sows were tested together to determine the suitability of the proposed method on farms. The pregnancy diagnosis performance on the original ultrasound images achieved 0.99 in accuracy in the highest case and on the ultrasound images with noises, the performance achieved 0.98 in accuracy. The diagnosis performance achieved 0.96 in accuracy even when the intensity of noise was strong, proving its robustness against noise.