• 제목/요약/키워드: CLASSIFICATION ANALYSIS

검색결과 8,013건 처리시간 0.033초

A Comparison Study of Classification Algorithms in Data Mining

  • Lee, Seung-Joo;Jun, Sung-Rae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권1호
    • /
    • pp.1-5
    • /
    • 2008
  • Generally the analytical tools of data mining have two learning types which are supervised and unsupervised learning algorithms. Classification and prediction are main analysis tools for supervised learning. In this paper, we perform a comparison study of classification algorithms in data mining. We make comparative studies between popular classification algorithms which are LDA, QDA, kernel method, K-nearest neighbor, naive Bayesian, SVM, and CART. Also, we use almost all classification data sets of UCI machine learning repository for our experiments. According to our results, we are able to select proper algorithms for given classification data sets.

RECURRENT PATTERNS IN DST TIME SERIES

  • Kim, Hee-Jeong;Lee, Dae-Young;Choe, Won-Gyu
    • Journal of Astronomy and Space Sciences
    • /
    • 제20권2호
    • /
    • pp.101-108
    • /
    • 2003
  • This study reports one approach for the classification of magnetic storms into recurrent patterns. A storm event is defined as a local minimum of Dst index. The analysis of Dst index for the period of year 1957 through year 2000 has demonstrated that a large portion of the storm events can be classified into a set of recurrent patterns. In our approach, the classification is performed by seeking a categorization that minimizes thermodynamic free energy which is defined as the sum of classification errors and entropy. The error is calculated as the squared sum of the value differences between events. The classification depends on the noise parameter T that represents the strength of the intrinsic error in the observation and classification process. The classification results would be applicable in space weather forecasting.

전기화재 조사를 위한 분류체계 개발 (Development of a Classification System for an Electrical Fire Investigation)

  • 이종호;김두현
    • 한국안전학회지
    • /
    • 제20권3호
    • /
    • pp.53-57
    • /
    • 2005
  • This paper presents development of a classification system for an electrical fire investigation. In order to reduce an electrical fires and establish detailed prevention plans, the collection of an electrical fire causes and base data are very important. Based on this data, a new classification system for an electrical fire investigation was developed and the direction to the classification system was suggested by fundamental analysis. All of the collected information is analyzed by bottom-up method. Criteria items which based on base data were categorized to classify items. The classification of items were found out as follows : basic condition fire scene condition, fire sign, fire cause. Particularly, the fire cause category is classified. A new developed classification system for an electrical fire investigation will be used to analyse electrical fires easily and efficiently.

규칙 및 SVM 기반 알고리즘에 의한 심전도 신호의 리듬 분류 (Rhythm Classification of ECG Signal by Rule and SVM Based Algorithm)

  • 김성완;김대환
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.43-51
    • /
    • 2013
  • 신뢰성 있는 부정맥 진단을 위해서는 리듬 구간 및 심박 단위의 종합적인 분석을 통하여 심전도 신호에 대한 분류 결과가 제시되어야 한다. 본 논문에서는 심전도 신호의 특징점에 기반하여 규칙기반 분류를 이용한 일정 구간의 리듬 분석을 수행하고 SVM기반 분류를 이용한 심박 단위의 리듬분석을 첨가하였다. 규칙기반 분류에서는 리듬 구간의 특징에 대하여 임상 자료로부터 도출된 규칙 베이스를 이용하여 리듬 유형을 분류하도록 하며, SVM기반 분류에서는 심박 단위의 특징에 대하여 미리 학습된 다중 SVM 분류기를 이용하여 단조 리듬 및 주요 비정상 심박을 분류하도록 한다. MIT-BIH 부정맥 데이터베이스를 이용한 실험을 통하여 11가지 리듬 유형에 대하여 규칙기반 방법만을 적용하였을 경우 68.52%, 규칙기반과 SVM기반의 융합 방법을 적용하였을 경우 87.04%의 분류 성능을 각각 보였다. SVM기반 방법으로 단조 리듬과 배열 리듬에 대한 오분류 개선을 통하여 분류 성능에서 19% 정도가 향상됨을 확인하였다.

A Rule-based Urban Image Classification System for Time Series Landsat Data

  • Lee, Jin-A;Lee, Sung-Soon;Chi, Kwang-Hoon
    • 대한원격탐사학회지
    • /
    • 제27권6호
    • /
    • pp.637-651
    • /
    • 2011
  • This study presents a rule-based urban image classification method for time series analysis of changes in the vicinity of Asan-si and Cheonan-si in Chungcheongnam-do, using Landsat satellite images (1991-2006). The area has been highly developed through the relocation of industrial facilities, land development, construction of a high-speed railroad, and an extension of the subway. To determine the yearly changing pattern of the urban area, eleven classes were made depending on the trend of development. An algorithm was generalized for the rules to be applied as an unsupervised classification, without the need of training area. The analysis results show that the urban zone of the research area has increased by about 1.53 times, and each correlation graph confirmed the distribution of the Built Up Index (BUI) values for each class. To evaluate the rule-based classification, coverage and accuracy were assessed. When Optimal allowable factor=0.36, the coverage of the rule was 98.4%, and for the test using ground data from 1991 to 2006, overall accuracy was 99.49%. It was confirmed that the method suggested to determine the maximum allowable factor correlates to the accuracy test results using ground data. Among the multiple images, available data was used as best as possible and classification accuracy could be improved since optimal classification to suit objectives was possible. The rule-based urban image classification method is expected to be applied to time series image analyses such as thematic mapping for urban development, urban development, and monitoring of environmental changes.

감정 기반 블로그 문서 분류를 위한 부정어 처리 및 단어 가중치 적용 기법의 효과에 대한 연구 (A Study on Negation Handling and Term Weighting Schemes and Their Effects on Mood-based Text Classification)

  • 정유철;최윤정;맹성현
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.477-497
    • /
    • 2008
  • 일상생활에서 많이 쓰이는 블로그 문서를 분석하는 것은 다양한 웹 응용서비스를 연결할 수 있는 중요한 단초를 제시하므로, 블로그 문서에 담긴 감정을 파악하는 것을 매우 유용한 일이다. 본 논문에서는 블로그 문서에 존재하는 감정을 보다 정확하게 분류하기 위해 부정어 처리와 새로운 단어 가중치의 적용이 성능에 미치는 영향에 대해 탐구한다. 특히, 감정단서(clue)가 내재된 정규화된 부정어 n-gram을 통해 부정어 처리를 고도화하고 말뭉치기반 단어 가중치 계산법(Corpus-specific Term Weighting, CSTW)을 통해 감정 분류 성능향상을 살펴보기로 한다. 검증을 위해 블로그 문서들로 정답 말뭉치를 구축하고 감정 흐름 분석(Enhanced Mood Flow Analysis, EMFA)과 지지벡터기계기반 감정 분류(Support Vector Machine based Mood Classification, SVMMC)의 두 가지 분류기법에 대해 실험을 하였다. 정규화된 부정어 n-gram의 적용은 EMFA에서 점진적인 감정 분류 성능 향상을 보여주었으며, CSTW의 적용은 TF*IDF나 TF에 비해 보다 높은 감정 분류 성능을 나타내었다.

  • PDF

IKONOS 영상을 이용한 토지피복분류 기법 분석 (An Analysis of Land Cover Classification Methods Using IKONOS Satellite Image)

  • 강남이;박정기;조기성;유연
    • 대한공간정보학회지
    • /
    • 제20권3호
    • /
    • pp.65-71
    • /
    • 2012
  • 최근 고해상도 위성영상은 자연자원이나 환경 관리에 필요로 하는 토지 피복 및 이용 현황자료 등에 유용하게 사용되고 있는 실정이다. 이에 따라 고액의 투자가 필요로 하는 위성영상의 효율성을 높이기 위하여 영상자료의 분석과정이 중요해지고 있다. 따라서 본 연구에서는 전처리 과정 중 연구대상에 대한 통계값에 대한 계산 및 분석을 수행하였으며, 전통적인 분류 기법인 최대우도 분류 외에도 인공신경망 분류와 SVM 분류에 대하여 설명하고 고해상도 위성영상인 IKONOS영상에 각 분류기법을 적용하여 토지피복분류를 하였으며, 각각의 결과를 오차 행렬을 통해 정확도 분석을 수행하였다. 그 결과 다른 분류 기법에 비해 Support Vector Machines(SVM) 분류 기법이 전체 정확도가 약 86%정도로 가장 우위의 결과물을 도출하였다.

객체 기반 영상 분류에서 최적 가중치 선정과 정확도 분석 연구 (Study on Selection of Optimized Segmentation Parameters and Analysis of Classification Accuracy for Object-oriented Classification)

  • 이정빈;어양담;허준
    • 대한원격탐사학회지
    • /
    • 제23권6호
    • /
    • pp.521-528
    • /
    • 2007
  • 본 논문에서는 대상지역에 대한 영상을 다양한 가중치의 조합의 경우를 고려하여 객체 단위로 분할하게 되며 분할된 객체에 대하여 상호관계를 분석하여 수치적으로 표현하였다. 또한 최종적인 객체 기반영상분류에서 높은 정확도를 확보할 수 있는 가중치의 조합을 산정하였다. 연구에 사용된 영상은 Landsat-7/ETM 영상으로 대상 지역의 면적은 $11{\times}14$ Km이며 밴드 2, 3, 4의 조합을 사용하였다. 객체 간 계산은 Moran's I와 객체 내부 분산(Intrasegment Variance)을 이용하였다. 대상지역에 대하여 총 75개의 가중치 조합을 사용하여 75개의 객체 분할 영상을 생성하였다. 객체 분할 영상 중에 최종적인 영상 분류 시 높은 정확도가 예상되는 가중치 조합, 중간 정도 정확도가 예상되는 가중치 조합 그리고 낮은 정도 정확도가 예상되는 가중치 조합을 7개 선택하여 최종적인 객체기반 영상분류를 시행하고 그 정확도를 비교하였다. 정확도의 비교 결과, 가장 높은 정확도가 예상되는 가중치 조합의 객체 분할 영상의 경우 객체 기반 영상 분류 시 85% 이상의 정확도를 나타내었으며 반대로 낮은 경우는 분류 시 50% 정도의 분류 정확도를 나타내었다.

칼라 및 질감 속성 벡터를 이용한 위성영상의 분류 (Satellite Image Classification Based on Color and Texture Feature Vectors)

  • 곽장호;김준철;이준환
    • 대한원격탐사학회지
    • /
    • 제15권3호
    • /
    • pp.183-194
    • /
    • 1999
  • 위성에서 관측된 다중분광 위성영상 데이터를 이용목적에 따라 분석하고 활용하기 위해서는 영상 자체에 내포된 밝기, 칼라, 질감 등 다양한 특징들이 중요한 정보원으로 이용되고 있다. 특히 질감이나 칼라정보를 이용한 위성영상의 분석과정에서 가장 중요한 문제는 원 영상의 정보를 효율적으로 표현하는 속성을 추출하여 적절히 활용하는 것이다. 따라서 본 논문에서는 위성영상 분석에 유용하게 사용할 수 있는 6개의 속성 벡터들을 선정한 다음 SPOT 위성에서 관측된 영상을 이용하여 각각의 속성들에 대한 분별력을 평가하기 위하여 역전파 신경망(Back-propagation Neural Network)을 이용한 분류 네트워크를 구성하였고, 실험하고자 하는 지역에 대한 훈련집합 선택시 선정된 여섯 개이 속성 벡터들을 분류에 사용될 특징으로 선택하였다. 분류 실험을 수행한 결과 각각의 벡터 속성들은 개개의 특성에 따라 많은 장단을 내포하고 있었으며, 전반적으로는 비교적 정확한 분류결과를 나타내었다. 따라서 칼라 및 질감 속성 벡터들은 위성영상의 분류과정에 효과적으로 사용될 수 있음은 물론 다양한 영상분석 및 응용분야에서도 유용하게 이용될 수 있을 것으로 기대된다.

A Kernel Approach to Discriminant Analysis for Binary Classification

  • 신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권2호
    • /
    • pp.83-93
    • /
    • 2001
  • We investigate a kernel approach to discriminant analysis for binary classification as a machine learning point of view. Our view of the kernel approach follows support vector method which is one of the most promising techniques in the area of machine learning. As usual discriminant analysis, the kernel method can discriminate an object most likely belongs to. Moreover, it has some advantage over discriminant analysis such as data compression and computing time.

  • PDF