• Title/Summary/Keyword: Classification Algorithms

검색결과 1,182건 처리시간 0.026초

퍼지 클러스터링 알고리즘을 이용한 타이어 접지면 패턴의 분류 (Tire Tread Pattern Classification Using Fuzzy Clustering Algorithm)

  • 강윤관;정순원;배상욱;김진헌;박귀태
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.44-57
    • /
    • 1995
  • 본논문에서는 GFI(Generalized Fuzzy Isodata)와 FI(Fuzzy Isodata) 알고리즘에 관한 이론을 고찰하고 이를 타이어 접지면 패턴 분류에 적용해 보았다. GFI 알고리즘은 FI 알고리즘의 일반화된 형태로서 분할된 군집에 대해서도 퍼지 분할 행렬(fuzzy partition matrix)을 고려해 다시 군집화(clustering)를 가능하게 하는 알고리즘이다. GFI 알고리즘을 사용하여 이진 트리를 구성함에 있어서 각 노드에서의 분할 여부, 즉 군잡화의 타당성(clustering validity) 점검 및 최종적인 이진 트리의 완성은 FDH(Fuzzy Divisve Hierarchical) 군집화알고리즘을 통해 이루어진다. 타이어 접지면에 대한 표준 특징량을 선정하거나 패턴 분류를 수행함에 있어서 이들 알고리즘은모두 우수한 성능을 가짐을 알 수 있었다. 패턴의 특징량으로는 전처리된 타이어 접지면 영상에 나타나는 윤곽선(edge)의 각도 성분을 선정하였으며 이렇게 선정된 특징량은 패턴의 특징을 잘 표현해 주는 유용한 정보를 가진 것으로 생각된다.

  • PDF

유전자 알고리즘을 활용한 부실예측모형의 구축 (A GA-based Rule Extraction for Bankruptcy Prediction Modeling)

  • Shin, Kyung-shik
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.83-93
    • /
    • 2001
  • 기업부실예측은 과거로부터 많은 연구가 이루어진 분야로, 주로 통계기법에 의한 분류예측문제로 다루어져 왔다. 최근에는 인공신경망, 의사결정나무 등 비선형성을 반영할 수 있는 인공지능 기법을 적용한 연구가 많이 수행되고 있다. 본 연구에서는 최적화에 주로 활용하는 인공지능 기법인 유전자 알고리즘을 규칙추출을 통한 기업부실예측 모형의 개발에 적용하고, 활용가능성을 검증하였다.

  • PDF

분산 기반의 Gradient Based Fuzzy c-means 에 의한 MPEG VBR 비디오 데이터의 모델링과 분류 (Modeling and Classification of MPEG VBR Video Data using Gradient-based Fuzzy c_means with Divergence Measure)

  • 박동철;김봉주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.931-936
    • /
    • 2004
  • GPDF(Gaussian Probability Density Function)을 효율적으로 군집화할 수 있는 GBFCM(DM)(Gradient Based Fuzzy c_means with Divergence Measure) 알고리즘이 본 논문에서 제안되었다. 제안된 GBFCM(DM)은 데이터 사이의 거리 척도로 발산거리(Divergence measure)를 적용한 새로운 형태의 FCM으로, 기존의 GBFCM에 기반을 두는 알고리즘이다. 본 논문에서는 MPEG VBR 비디오 데이터를 GPDF형태의 다차원 데이터로 변형시켜 모델링 하고, 모델링 한 MPEG VBR 비디오 데이터를 영화 또는 스포츠 형태로 분류하는데 응용되었다. 본 논문의 실험에서 기존의 FCM, GBFCM과 새롭게 제안된 GBFCM(DM)을 사용하여 모델링 및 분류결과를 상호 비교하였다. 비교결과 GBFCM(DM)이 오분류율의 기준에서 기존의 다른 알고리즘들에 비해 약 5∼l5%의 향상된 성능을 보였다.

대용량 자료에서 핵심적인 소수의 변수들의 선별과 로지스틱 회귀 모형의 전개 (Screening Vital Few Variables and Development of Logistic Regression Model on a Large Data Set)

  • 임용빈;조재연;엄경아;이선아
    • 품질경영학회지
    • /
    • 제34권2호
    • /
    • pp.129-135
    • /
    • 2006
  • In the advance of computer technology, it is possible to keep all the related informations for monitoring equipments in control and huge amount of real time manufacturing data in a data base. Thus, the statistical analysis of large data sets with hundreds of thousands observations and hundred of independent variables whose some of values are missing at many observations is needed even though it is a formidable computational task. A tree structured approach to classification is capable of screening important independent variables and their interactions. In a Six Sigma project handling large amount of manufacturing data, one of the goals is to screen vital few variables among trivial many variables. In this paper we have reviewed and summarized CART, C4.5 and CHAID algorithms and proposed a simple method of screening vital few variables by selecting common variables screened by all the three algorithms. Also how to develop a logistics regression model on a large data set is discussed and illustrated through a large finance data set collected by a credit bureau for th purpose of predicting the bankruptcy of the company.

Nonlinear damage detection using linear ARMA models with classification algorithms

  • Chen, Liujie;Yu, Ling;Fu, Jiyang;Ng, Ching-Tai
    • Smart Structures and Systems
    • /
    • 제26권1호
    • /
    • pp.23-33
    • /
    • 2020
  • Majority of the damage in engineering structures is nonlinear. Damage sensitive features (DSFs) extracted by traditional methods from linear time series models cannot effectively handle nonlinearity induced by structural damage. A new DSF is proposed based on vector space cosine similarity (VSCS), which combines K-means cluster analysis and Bayesian discrimination to detect nonlinear structural damage. A reference autoregressive moving average (ARMA) model is built based on measured acceleration data. This study first considers an existing DSF, residual standard deviation (RSD). The DSF is further advanced using the VSCS, and then the advanced VSCS is classified using K-means cluster analysis and Bayes discriminant analysis, respectively. The performance of the proposed approach is then verified using experimental data from a three-story shear building structure, and compared with the results of existing RSD. It is demonstrated that combining the linear ARMA model and the advanced VSCS, with cluster analysis and Bayes discriminant analysis, respectively, is an effective approach for detection of nonlinear damage. This approach improves the reliability and accuracy of the nonlinear damage detection using the linear model and significantly reduces the computational cost. The results indicate that the proposed approach is potential to be a promising damage detection technique.

자기조직화 신경회로망의 학습능률 향상에 관한 연구 (On the enhancement of the learning efficiency of the self-organization neural networks)

  • 홍봉화;허윤석
    • 정보학연구
    • /
    • 제7권3호
    • /
    • pp.11-18
    • /
    • 2004
  • 신경회로망의 학습은 신경사이의 연결강도 갱신과정으로 이루어진다. 이때, 학습계수를 잘못 설정하였을 경우, 과도한 학습 횟수를 요하거나, 올바른 학습을 수행하지 못하게 된다. 패턴분류에 자주 이용되는 코호넨 신경회로망의 경우 고정된 학습계수를 사용하여 연결강도를 일률적으로 갱신하는 방식을 취함으로서 학습효율을 저하시키는 문제점이 발생한다. 본 논문에서는 코호넨 신경회로망의 학습효율을 향상시키기 위하여 학습계수를 입력벡터와 연결강도 벡터의 차에 따라 가변적으로 적응하는 자율학습 알고리즘을 제안하였다. 제안된 학습 알고리즘의 검증을 위하여 온라인 필기체의 표준 획 분류에 적용하였다. 그 결과 약 1.44~3.65% 정도의 학습 효율이 향상됨을 고찰하였다.

  • PDF

A Deep Learning Model for Extracting Consumer Sentiments using Recurrent Neural Network Techniques

  • Ranjan, Roop;Daniel, AK
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.238-246
    • /
    • 2021
  • The rapid rise of the Internet and social media has resulted in a large number of text-based reviews being placed on sites such as social media. In the age of social media, utilizing machine learning technologies to analyze the emotional context of comments aids in the understanding of QoS for any product or service. The classification and analysis of user reviews aids in the improvement of QoS. (Quality of Services). Machine Learning algorithms have evolved into a powerful tool for analyzing user sentiment. Unlike traditional categorization models, which are based on a set of rules. In sentiment categorization, Bidirectional Long Short-Term Memory (BiLSTM) has shown significant results, and Convolution Neural Network (CNN) has shown promising results. Using convolutions and pooling layers, CNN can successfully extract local information. BiLSTM uses dual LSTM orientations to increase the amount of background knowledge available to deep learning models. The suggested hybrid model combines the benefits of these two deep learning-based algorithms. The data source for analysis and classification was user reviews of Indian Railway Services on Twitter. The suggested hybrid model uses the Keras Embedding technique as an input source. The suggested model takes in data and generates lower-dimensional characteristics that result in a categorization result. The suggested hybrid model's performance was compared using Keras and Word2Vec, and the proposed model showed a significant improvement in response with an accuracy of 95.19 percent.

Design and Implementation of Intelligent Medical Service System Based on Classification Algorithm

  • Yu, Linjun;Kang, Yun-Jeong;Choi, Dong-Oun
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권3호
    • /
    • pp.92-103
    • /
    • 2021
  • With the continuous acceleration of economic and social development, people gradually pay attention to their health, improve their living environment, diet, strengthen exercise, and even conduct regular health examination, to ensure that they always understand the health status. Even so, people still face many health problems, and the number of chronic diseases is increasing. Recently, COVID-19 has also reminded people that public health problems are also facing severe challenges. With the development of artificial intelligence equipment and technology, medical diagnosis expert systems based on big data have become a topic of concern to many researchers. At present, there are many algorithms that can help computers initially diagnose diseases for patients, but they want to improve the accuracy of diagnosis. And taking into account the pathology that varies from person to person, the health diagnosis expert system urgently needs a new algorithm to improve accuracy. Through the understanding of classic algorithms, this paper has optimized it, and finally proved through experiments that the combined classification algorithm improved by latent factors can meet the needs of medical intelligent diagnosis.

Localization and size estimation for breaks in nuclear power plants

  • Lin, Ting-Han;Chen, Ching;Wu, Shun-Chi;Wang, Te-Chuan;Ferng, Yuh-Ming
    • Nuclear Engineering and Technology
    • /
    • 제54권1호
    • /
    • pp.193-206
    • /
    • 2022
  • Several algorithms for nuclear power plant (NPP) break event detection, isolation, localization, and size estimation are proposed. A break event can be promptly detected and isolated after its occurrence by simultaneously monitoring changes in the sensing readings and by employing an interquartile range-based isolation scheme. By considering the multi-sensor data block of a break to be rank-one, it can be located as the position whose lead field vector is most orthogonal to the noise subspace of that data block using the Multiple Signal Classification (MUSIC) algorithm. Owing to the flexibility of deep neural networks in selecting the best regression model for the available data, we can estimate the break size using multiple-sensor recordings of the break regardless of the sensor types. The efficacy of the proposed algorithms was evaluated using the data generated by Maanshan NPP simulator. The experimental results demonstrated that the MUSIC method could distinguish two near breaks. However, if the two breaks were close and of small sizes, the MUSIC method might wrongly locate them. The break sizes estimated by the proposed deep learning model were close to their actual values, but relative errors of more than 8% were seen while estimating small breaks' sizes.

특징 추출 알고리즘과 Adaboost를 이용한 이진분류기 (Binary classification by the combination of Adaboost and feature extraction methods)

  • 함승록;곽노준
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.42-53
    • /
    • 2012
  • 패턴 인식과 기계 학습 분야에서 분류는 가장 기본적으로 해결해야 하는 문제의 유형이다. Adaboost 알고리즘은 Boosting 알고리즘의 아이디어를 실제 데이터분석에 이용할 수 있도록 개량한 방법으로써, 단계를 반복하여 나온 여러 개의 약한 분류기와 가중치 값들의 조합으로 강한 분류기를 생성하는 두 개의 클래스를 분류하는 분류기이다. 주성분 분석법과 선형 판별 분석법은 높은 차원의 특징 벡터를 낮은 차원의 특징 벡터로 축소하는 특징 벡터의 차원 감소와 데이터의 특징 추출에도 유용하게 사용되는 방법들이다. 본 논문에서는, 주성분 분석법과 선형 판별 분석법을 이용하여 추출한 특징을 Adaboost 알고리즘의 약 분류기로 사용함으로써, 특징 추출과 분류를 동시에 하고, 인식률을 높이는 효율적인 Boosted-PCA와 Boosted-LDA 알고리즘을 제안한다. 마지막 장에서는, 제안하는 알고리즘으로 UCI Data-Set 중 2 Class-Data와 FRGC Data의 남자와 여자 영상에 대해서 분류 실험을 진행하였다. 실험의 결과로 제안한 Boosted-PCA와 Boosted-LDA 알고리즘이 기존의 특징 추출 알고리즘과 최근접 이웃 분류기, SVM을 이용한 분류기 방법과 비교하여 인식률이 향상됨을 보인다.