• 제목/요약/키워드: supervised and unsupervised classification

검색결과 100건 처리시간 0.022초

Supervised Classification Using Training Parameters and Prior Probability Generated from VITD - The Case of QuickBird Multispectral Imagery

  • Eo, Yang-Dam;Lee, Gyeong-Wook;Park, Doo-Youl;Park, Wang-Yong;Lee, Chang-No
    • 대한원격탐사학회지
    • /
    • 제24권5호
    • /
    • pp.517-524
    • /
    • 2008
  • In order to classify an satellite imagery into geospatial features of interest, the supervised classification needs to be trained to distinguish these features through training sampling. However, even though an imagery is classified, different results of classification could be generated according to operator's experience and expertise in training process. Users who practically exploit an classification result to their applications need the research accomplishment for the consistent result as well as the accuracy improvement. The experiment includes the classification results for training process used VITD polygons as a prior probability and training parameter, instead of manual sampling. As results, classification accuracy using VITD polygons as prior probabilities shows the highest results in several methods. The training using unsupervised classification with VITD have produced similar classification results as manual training and/or with prior probability.

Unsupervised feature learning for classification

  • Abdullaev, Mamur;Alikhanov, Jumabek;Ko, Seunghyun;Jo, Geun Sik
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.51-54
    • /
    • 2016
  • In computer vision especially in image processing, it has become popular to apply deep convolutional networks for supervised learning. Convolutional networks have shown a state of the art results in classification, object recognition, detection as well as semantic segmentation. However, supervised learning has two major disadvantages. One is it requires huge amount of labeled data to get high accuracy, the second one is to train so much data takes quite a bit long time. On the other hand, unsupervised learning can handle these problems more cheaper way. In this paper we show efficient way to learn features for classification in an unsupervised way. The network trained layer-wise, used backpropagation and our network learns features from unlabeled data. Our approach shows better results on Caltech-256 and STL-10 dataset.

  • PDF

Damage classification of concrete structures based on grey level co-occurrence matrix using Haar's discrete wavelet transform

  • Kabir, Shahid;Rivard, Patrice
    • Computers and Concrete
    • /
    • 제4권3호
    • /
    • pp.243-257
    • /
    • 2007
  • A novel method for recognition, characterization, and quantification of deterioration in bridge components and laboratory concrete samples is presented in this paper. The proposed scheme is based on grey level co-occurrence matrix texture analysis using Haar's discrete wavelet transform on concrete imagery. Each image is described by a subset of band-filtered images containing wavelet coefficients, and then reconstructed images are employed in characterizing the texture, using grey level co-occurrence matrices, of the different types and degrees of damage: map-cracking, spalling and steel corrosion. A comparative study was conducted to evaluate the efficiency of the supervised maximum likelihood and unsupervised K-means classification techniques, in order to classify and quantify the deterioration and its extent. Experimental results show both methods are relatively effective in characterizing and quantifying damage; however, the supervised technique produced more accurate results, with overall classification accuracies ranging from 76.8% to 79.1%.

비감독형 학습 기법을 사용한 심각도 기반 결함 예측 (Severity-based Fault Prediction using Unsupervised Learning)

  • 홍의석
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.151-157
    • /
    • 2018
  • 소프트웨어 결함 예측에 관한 기존의 연구들은 대부분 모델의 입력 모듈이 결함을 가지고 있는지 여부를 판단하는 이진 감독형 분류 모델들에 관한 것들이었다. 하지만 이진 분류 모델은 결함의 복잡한 특성들을 고려하지 않고 단순히 입력 모듈의 결함 유무만을 판단한다는 문제점이 있고, 감독형 모델은 대부분의 개발 집단이 보유하고 있지 않은 훈련 데이터 집합을 필요로 한다는 한계점이 있다. 본 논문은 이러한 두 가지 문제점을 해결하기 위해 비감독형 알고리즘을 사용한 심각도 기반 삼진 분류 모델을 제안하였으며, 평가 실험 결과 제안 모델이 감독형 모델들에 필적하는 예측 성능을 보였다.

원격탐사 자료를 이용한 하와이 해안지역 식생 분류 (Vegetation Mapping of Hawaiian Coastal Lowland Using Remotely Sensed Data)

  • 박선엽
    • 한국지역지리학회지
    • /
    • 제12권4호
    • /
    • pp.496-507
    • /
    • 2006
  • 본 연구는 고해상도 자료와 하이퍼스펙트럴 자료를 혼용하여 하와이 화산 국립공원 내 해안 지역의 식생을 분류하고자 하였다. 연구지역에 주로 나타나는 식생은 3종의 초본(broomsedge, natal redtop, and pili)과 작은 관목 등으로 대표되는 비초본으로 구분된다. 분류 기법으로는 unsupervised classification과 supervised classification을 결합한 하이브리드법을 이용하여 전체적으로 3단계 분류과정을 적용하였다. 첫째로는, IKONOS 고해상 위성자료를 이용하여, 식생 및 비식생지역을 unsupervised classification법을 통해 분류하였다. 두 번째로는, minimum noise fraction(MNF) transformation을 이용하여 AVIRIS하이퍼스펙트럴 자료로부터 주성분을 추출하여 자료를 압축하는 과정을 거쳤다. 20미터 해상도를 가진 AVIRIS 픽셀들은 대부분 용암면과 식생면으로부터 반사된 복사신호가 혼합되어 있기때문에, 용암과 식생의 지표피복 비율에 따른 선형모형을 적용하여 용암면이 갖는 반사 신호를 각 픽셀로부터 제거하였다. 최종적으로, 각 픽셀에 대하여, 식생피복 비율에 비례하는 AVIRIS 하이퍼스펙트럴 자료의 식생성분을 토대로 maximum likelihood algorithm에 따라 supervised classification법을 적용하여 초지 및 관목으로 대표되는 지표식생을 분류하였다.

  • PDF

슬라이딩 윈도우 기반 다변량 스트림 데이타 분류 기법 (A Sliding Window-based Multivariate Stream Data Classification)

  • 서성보;강재우;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.163-174
    • /
    • 2006
  • 분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.

Landsat TM/+ETM 위성영상을 이용한 몽골 Tuv지역의 토지피복변화 및 광산지역확대 추이분석 (Temporal Analysis on the Transition of Land Cover Change and Growth of Mining Area Using Landsat TM/+ETM Satellite Imagery in Tuv, Mongolia)

  • 에르뎅솜베술드;조미수;조기성
    • 한국측량학회지
    • /
    • 제32권5호
    • /
    • pp.451-457
    • /
    • 2014
  • 최근 몽골 수도 울란바타르를 둘러싸고 있는 Tuv지역의 토지 황폐화가 급속도로 진행되고 있는데 이는 광산업의 발달과 인구 밀집으로 인하여 기존의 목초지가 파괴됨으로써 더욱 더 가속화 되고 있다. 따라서 본 연구에서는 Tuv지역의 도심지역과 광산지역을 대상으로 하여 토지피복의 변화 탐지와 토지황폐화에 대한 추이를 분석하기 위하여 2001년부터 2009년까지의 Landsat TM과 +ETM 위성영상을 활용하여, 정규식생지수와 무감독분류(Unsupervised Classification)의 K-Mean 알고리즘과 감독분류(Supervised Classification)의 MLC 등의 디지털 영상 분류기법을 적용하여 몽골 Tuv지역의 다중시기별 토지피복변화를 분석하였다. 그 결과 광산지역의 확장과 더불어 기후변화 및 인구밀집 등으로 인하여 토지가 황폐화되어 사막지역으로 변화되어가는 추이를 알 수 있었다.

A Comparison Study of Classification Algorithms in Data Mining

  • Lee, Seung-Joo;Jun, Sung-Rae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권1호
    • /
    • pp.1-5
    • /
    • 2008
  • Generally the analytical tools of data mining have two learning types which are supervised and unsupervised learning algorithms. Classification and prediction are main analysis tools for supervised learning. In this paper, we perform a comparison study of classification algorithms in data mining. We make comparative studies between popular classification algorithms which are LDA, QDA, kernel method, K-nearest neighbor, naive Bayesian, SVM, and CART. Also, we use almost all classification data sets of UCI machine learning repository for our experiments. According to our results, we are able to select proper algorithms for given classification data sets.

Statistical bioinformatics for gene expression data

  • Lee, Jae-K.
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보학 국제심포지엄
    • /
    • pp.103-127
    • /
    • 2001
  • Gene expression studies require statistical experimental designs and validation before laboratory confirmation. Various clustering approaches, such as hierarchical, Kmeans, SOM are commonly used for unsupervised learning in gene expression data. Several classification methods, such as gene voting, SVM, or discriminant analysis are used for supervised lerning, where well-defined response classification is possible. Estimating gene-condition interaction effects require advanced, computationally-intensive statistical approaches.

  • PDF

미분류 데이터의 초기예측을 통한 군집기반의 부분지도 학습방법 (A Clustering-based Semi-Supervised Learning through Initial Prediction of Unlabeled Data)

  • 김응구;전치혁
    • 한국경영과학회지
    • /
    • 제33권3호
    • /
    • pp.93-105
    • /
    • 2008
  • Semi-supervised learning uses a small amount of labeled data to predict labels of unlabeled data as well as to improve clustering performance, whereas unsupervised learning analyzes only unlabeled data for clustering purpose. We propose a new clustering-based semi-supervised learning method by reflecting the initial predicted labels of unlabeled data on the objective function. The initial prediction should be done in terms of a discrete probability distribution through a classification method using labeled data. As a result, clusters are formed and labels of unlabeled data are predicted according to the Information of labeled data in the same cluster. We evaluate and compare the performance of the proposed method in terms of classification errors through numerical experiments with blinded labeled data.