• Title/Summary/Keyword: 자료의 분류

Search Result 5,189, Processing Time 0.034 seconds

반복조사를 통한 범주형 자료의 오분류 탐색

  • 고봉성
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.1
    • /
    • pp.75-90
    • /
    • 1997
  • 본 연구는 범주형자료의 오분류에 관한 연구로, 2$\times$2분할표의 자료에 오분류가 있다고 생각되는 조사와 반복조사를 통해 정확하게 분류한 새로운 범주형자료를 시간이라는 새변수의 결합을 통해 오분류 여부를 탐색하는 방법에 대한 연구이다.

  • PDF

Improvement of Land Cover over Asian region via Comparison of the Land Cover Data Sets (지면피복 자료들의 비교연구를 통한 아시아지역 지면피복 자료 개선)

  • Kang, Jeon-Ho;Suh, Myoung-Seok;Kwak, Chong-Heum
    • Proceedings of the KSRS Conference
    • /
    • 2007.03a
    • /
    • pp.49-54
    • /
    • 2007
  • 고분해능복사계(AVHRR) 자료로부터 산출한 아시아지역 지면피복 분류자료들 (United States Geological Survey: USGS, International Geosphere Biosphere Programme: IGBP, University of Maryland: UMd)의 분류특성을 분석하였으며 이를 근거로 하여 이 지역에 대한 지면피복의 분류를 시도하였다. 서로 다른 지면피복 분류 자료들의 비교를 위하여 지도 투영법을 일치시켰으며 지면피복 정의가 유사한 유형들만 비교하였다. 세 지면피복 자료에서 분류가 모두 일치하는 비율은 33.57%이고 3 자료 중 두 자료에서 분류가 일치하는 비율은 49.69%로 나타났다. 전체적으로 나대지(사막), 도시 및 혼합림과 같이 식생의 생물리적 특성이 뚜렷한 유형들에서는 분류의 일치율이 높게 나타났다. 반면에 농지, 낙엽활엽수림, 및 낙엽침엽수렴과 같이 식생의 생물리적 특성이 유사한 유형에서는 일치율이 낮게 나타났다. 분류에 사용된 기본 입력자료수, 지면피복 유형수,분류기법 및 입력 자료의 전처리 수준 등이 지면피복 분류 결과에 차이를 유발한 것으로 판단된다. 지면피복 자료들의 비교결과와 각 유형별 식생지수의 평균 계절변동 특성을 이용하여 이 지역에 대한 지면피복 분류자료를 보완하였다.

  • PDF

Detection of Characteristics by Pattern Classification of Water Quality and Runoff Data in a River (하천의 수질 및 유량자료의 패턴분류에 의한 특성 파악)

  • Park, Sung-Chun;Jin, Young-Hoon;Roh, Kyong-Bum;Kim, Yong-Gu;Lee, Yong-Hui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1380-1384
    • /
    • 2010
  • 현재 환경부에서는 수질오염총량관리제를 위하여 각 단위유역의 말단지점에서 8일 간격으로 수질 및 유량을 측정하고 있으며, 이 자료들을 공개하고 있다. 이러한 양질의 자료의 활용성을 제고하기 위해서는 무엇보다도 자료의 분석을 위한 다양한 기법이 개발되고 제안되어야 한다. 따라서 본 연구에서는 수질 및 유량자료를 동시에 적용하여 두 자료 사이의 관계를 조사하고 특성을 파악하기 위하여 자기조직화 특성지도(Self-Organizing Feature Map: SOFM) 이론을 적용하였다. 시행착오법에 의해 적정한 SOFM 구조를 결정하였으며, 그 결과 $4{\times}4$ 구조의 육각형 배열을 갖는 구조를 이용하였다. SOFM에 의해 분류된 3개의 패턴 중 패턴-1은 유량자료의 크기에 의해 분류되었고, 패턴-2와 패턴-3은 BOD 농도의 크기에 따라 분류된 것으로 파악되었다. 따라서 SOFM의 적용에 의한 자료의 분류를 수행하고, 그 분류기준을 파악할 경우 SOFM의 자료 분석 도구로서의 활용성이 더욱 높아질 것으로 판단된다.

  • PDF

A Co-training Method based on Classification Using Unlabeled Data (비분류표시 데이타를 이용하는 분류 기반 Co-training 방법)

  • 윤혜성;이상호;박승수;용환승;김주한
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.8
    • /
    • pp.991-998
    • /
    • 2004
  • In many practical teaming problems including bioinformatics area, there is a small amount of labeled data along with a large pool of unlabeled data. Labeled examples are fairly expensive to obtain because they require human efforts. In contrast, unlabeled examples can be inexpensively gathered without an expert. A common method with unlabeled data for data classification and analysis is co-training. This method uses a small set of labeled examples to learn a classifier in two views. Then each classifier is applied to all unlabeled examples, and co-training detects the examples on which each classifier makes the most confident predictions. After some iterations, new classifiers are learned in training data and the number of labeled examples is increased. In this paper, we propose a new co-training strategy using unlabeled data. And we evaluate our method with two classifiers and two experimental data: WebKB and BIND XML data. Our experimentation shows that the proposed co-training technique effectively improves the classification accuracy when the number of labeled examples are very small.

다중 시기/편광 SAR 자료를 이용한 지표 피복 구분

  • Park, No-Uk;Ji, Gwang-Hun;Gwon, Byeong-Du
    • 한국지구과학회:학술대회논문집
    • /
    • 2005.09a
    • /
    • pp.79-84
    • /
    • 2005
  • 이 논문에서는 구름과 같은 기상 상태의 제약 없이 자료 획득이 가능한 SAR 자료를 이용하여 토지 피복 특성을 구분하고자 하였다. 기존 단일 주파수, 편광 상태의 자료만을 제공하는 SAR 자료를 이용한 분류에서의 낮은 분류 정확도를 향상시키고자 이 논문에서는 다중 시기 C 밴드 자료이면서 서로 다른 편광 상태의 자료를 제공하는 Radarsat-1(HH)와 ENVISAT(VV) 자료를 분류에 이용하였다. 분류 기법으로 Random Forests를 적용한 결과, 단일 편광 상태의 자료만을 이용하였을 때에 비해서 보다 향상된 분류 정확도를 얻을 수 있었다.

  • PDF

Empirical Bayesian Misclassification Analysis on Categorical Data (범주형 자료에서 경험적 베이지안 오분류 분석)

  • 임한승;홍종선;서문섭
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.39-57
    • /
    • 2001
  • Categorical data has sometimes misclassification errors. If this data will be analyzed, then estimated cell probabilities could be biased and the standard Pearson X2 tests may have inflated true type I error rates. On the other hand, if we regard wellclassified data with misclassified one, then we might spend lots of cost and time on adjustment of misclassification. It is a necessary and important step to ask whether categorical data is misclassified before analyzing data. In this paper, when data is misclassified at one of two variables for two-dimensional contingency table and marginal sums of a well-classified variable are fixed. We explore to partition marginal sums into each cells via the concepts of Bound and Collapse of Sebastiani and Ramoni (1997). The double sampling scheme (Tenenbein 1970) is used to obtain informations of misclassification. We propose test statistics in order to solve misclassification problems and examine behaviors of the statistics by simulation studies.

  • PDF

Classification of Multi-temporal SAR Data by Using Data Transform Based Features and Multiple Classifiers (자료변환 기반 특징과 다중 분류자를 이용한 다중시기 SAR자료의 분류)

  • Yoo, Hee Young;Park, No-Wook;Hong, Sukyoung;Lee, Kyungdo;Kim, Yeseul
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.3
    • /
    • pp.205-214
    • /
    • 2015
  • In this study, a novel land-cover classification framework for multi-temporal SAR data is presented that can combine multiple features extracted through data transforms and multiple classifiers. At first, data transforms using principle component analysis (PCA) and 3D wavelet transform are applied to multi-temporal SAR dataset for extracting new features which were different from original dataset. Then, three different classifiers including maximum likelihood classifier (MLC), neural network (NN) and support vector machine (SVM) are applied to three different dataset including data transform based features and original backscattering coefficients, and as a result, the diverse preliminary classification results are generated. These results are combined via a majority voting rule to generate a final classification result. From an experiment with a multi-temporal ENVISAT ASAR dataset, every preliminary classification result showed very different classification accuracy according to the used feature and classifier. The final classification result combining nine preliminary classification results showed the best classification accuracy because each preliminary classification result provided complementary information on land-covers. The improvement of classification accuracy in this study was mainly attributed to the diversity from combining not only different features based on data transforms, but also different classifiers. Therefore, the land-cover classification framework presented in this study would be effectively applied to the classification of multi-temporal SAR data and also be extended to multi-sensor remote sensing data fusion.

Development of Usability-related Gamsung Indexes for Web-based Databases (Web 기반 감성 데이터베이스 구축을 위한 사용성 관련 감성 지표 개발)

  • 박길환;임은영;박민용
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.338-342
    • /
    • 1999
  • 본 연구는 웹 기반 감성데이터베이스구축 및 보급을 위하여 국내의 감성 관련 주요 연구 결과 및 감성 자료를 수집하고 주요 감성 지표를 개발하였다. 개발된 감성 지표는 사용 적합성 지표로서 수집한 감성 자료들 중 사용 적합성에 관련된 감성 자료를 선별하여 이를 물리적/객관적 적합성 관련 지표와 주관적 적합성 관련 지표, 개발된 측정 시스템, 감성 정보물로 분류하였다. 물리적/객관적 지표는 다시 환경 지표, 생리 지표, 제품설계 지표, 평가척도 지표, 제품평가 기술 지표로 분류 등의 세부지표로 분류하고, 주관적 지표는 언어 지표, 묘사 지표, 심리 지표, 인지 지표로 다시 나누어 분류하였다. 개발된 제품, 측정 시스템, 또는 시뮬레이터 둥은 개발된 측정 시스템으로 분류하고 그 밖의 감성공학적으로 중요한 자료 및 정보는 감성공학 관련 정보물로 분류하였다. 분류한 지표는 전문가의 검증을 통해 타당성을 확인한 후 감성 데이터베이스로 구축될 예정이다. 이를 위하여 전반적인 감성 자료 관리 시스템을 통한 효과적인 감성 자료 관리체제 구축과 감성 자료의 공유가 뒤따라야 할 것이다.

  • PDF

Enhancing Classification Performance by Separating Spectral Signature of Training Data Set (교사 자료의 분광 특징 분리에 의한 감독 분류 성능 향상)

  • 김광은
    • Korean Journal of Remote Sensing
    • /
    • v.18 no.6
    • /
    • pp.369-376
    • /
    • 2002
  • This paper presents a method to enhance the performance of supervised classification by separating the spectral signature of the training data sets for each class. Using clustering technique, a training data set is divided into several subsets which show a pattern of the normal distribution with small value of spectral variances. Then a supervised classification is applied with the divided training data set as training data for the temporary subclasses of the original class. The proposed method is applied to a Landsat TM image of Busan area for the applicability test. The result shows that the proposed method produces better classified results than the conventional statistical classification methods. It is expected that the proposed method will reduce the effort and expense for selecting the training data set for each class in an area which has spectrally homogeneous signature.

Land-cover classification using multi-temporal Radarsat-1 and ENVISAT data (다중 시기 Radarsat-1 자료와 ENVISAT 자료를 이용한 토지 피복 분류)

  • Park No-Wook;Chi Kwang-Hoon
    • Proceedings of the KSRS Conference
    • /
    • 2006.03a
    • /
    • pp.303-306
    • /
    • 2006
  • 이 연구에서는 C 밴드 SAR 자료이면서 서로 다른 편광 상태의 자료를 제공할 수 있는 다중 시기 Radarsat-1 자료와 ENVISAT ASAR 자료를 이용한 토지 피복 분류를 수행하였다. 다중 시기/편광 자료로부터 평균 후방산란계수, 시간적 변이도, 긴밀도 등의 특징을 기본적으로 추출하였고, 이외에 상호 비교를 위해 주성분 분석을 이용한 특징 추출을 시도하였다. 특징들을 이용한 분류기법으로는 Random Forests를 적용하였다. 충남 예당평야 일대를 대상으로 사례연구를 수행한 결과, 주성분 분석을 통한 특징과 다편광 자료를 이용하였을 때 분류 정확도가 향상되는 것으로 나타났다.

  • PDF