• 제목/요약/키워드: 자료의 분류

검색결과 5,189건 처리시간 0.016초

반복조사를 통한 범주형 자료의 오분류 탐색

  • 고봉성
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.75-90
    • /
    • 1997
  • 본 연구는 범주형자료의 오분류에 관한 연구로, 2$\times$2분할표의 자료에 오분류가 있다고 생각되는 조사와 반복조사를 통해 정확하게 분류한 새로운 범주형자료를 시간이라는 새변수의 결합을 통해 오분류 여부를 탐색하는 방법에 대한 연구이다.

  • PDF

지면피복 자료들의 비교연구를 통한 아시아지역 지면피복 자료 개선 (Improvement of Land Cover over Asian region via Comparison of the Land Cover Data Sets)

  • 강전호;서명석;곽종흠
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 춘계학술대회 논문집
    • /
    • pp.49-54
    • /
    • 2007
  • 고분해능복사계(AVHRR) 자료로부터 산출한 아시아지역 지면피복 분류자료들 (United States Geological Survey: USGS, International Geosphere Biosphere Programme: IGBP, University of Maryland: UMd)의 분류특성을 분석하였으며 이를 근거로 하여 이 지역에 대한 지면피복의 분류를 시도하였다. 서로 다른 지면피복 분류 자료들의 비교를 위하여 지도 투영법을 일치시켰으며 지면피복 정의가 유사한 유형들만 비교하였다. 세 지면피복 자료에서 분류가 모두 일치하는 비율은 33.57%이고 3 자료 중 두 자료에서 분류가 일치하는 비율은 49.69%로 나타났다. 전체적으로 나대지(사막), 도시 및 혼합림과 같이 식생의 생물리적 특성이 뚜렷한 유형들에서는 분류의 일치율이 높게 나타났다. 반면에 농지, 낙엽활엽수림, 및 낙엽침엽수렴과 같이 식생의 생물리적 특성이 유사한 유형에서는 일치율이 낮게 나타났다. 분류에 사용된 기본 입력자료수, 지면피복 유형수,분류기법 및 입력 자료의 전처리 수준 등이 지면피복 분류 결과에 차이를 유발한 것으로 판단된다. 지면피복 자료들의 비교결과와 각 유형별 식생지수의 평균 계절변동 특성을 이용하여 이 지역에 대한 지면피복 분류자료를 보완하였다.

  • PDF

하천의 수질 및 유량자료의 패턴분류에 의한 특성 파악 (Detection of Characteristics by Pattern Classification of Water Quality and Runoff Data in a River)

  • 박성천;진영훈;노경범;김용구;이용희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1380-1384
    • /
    • 2010
  • 현재 환경부에서는 수질오염총량관리제를 위하여 각 단위유역의 말단지점에서 8일 간격으로 수질 및 유량을 측정하고 있으며, 이 자료들을 공개하고 있다. 이러한 양질의 자료의 활용성을 제고하기 위해서는 무엇보다도 자료의 분석을 위한 다양한 기법이 개발되고 제안되어야 한다. 따라서 본 연구에서는 수질 및 유량자료를 동시에 적용하여 두 자료 사이의 관계를 조사하고 특성을 파악하기 위하여 자기조직화 특성지도(Self-Organizing Feature Map: SOFM) 이론을 적용하였다. 시행착오법에 의해 적정한 SOFM 구조를 결정하였으며, 그 결과 $4{\times}4$ 구조의 육각형 배열을 갖는 구조를 이용하였다. SOFM에 의해 분류된 3개의 패턴 중 패턴-1은 유량자료의 크기에 의해 분류되었고, 패턴-2와 패턴-3은 BOD 농도의 크기에 따라 분류된 것으로 파악되었다. 따라서 SOFM의 적용에 의한 자료의 분류를 수행하고, 그 분류기준을 파악할 경우 SOFM의 자료 분석 도구로서의 활용성이 더욱 높아질 것으로 판단된다.

  • PDF

비분류표시 데이타를 이용하는 분류 기반 Co-training 방법 (A Co-training Method based on Classification Using Unlabeled Data)

  • 윤혜성;이상호;박승수;용환승;김주한
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.991-998
    • /
    • 2004
  • 생물 정보학 등 많은 응용 분야에서 데이타 분석을 할 때는 적은 수의 분류표시된 데이터 (labeled data)와 많은 수의 비분류표시된 데이타(unlabeled data)가 있을 수 있다 분류표시된 자료는 사람의 노력이 요구되기 때문에 얻기가 어렵고 비용이 많이 들지만, 비분류표시된 자료는 별 어려움 없이 쉽게 얻을 수 있다. 이때 비분류표시된 자료를 이용하여 자료를 분류하고 분석하는데 널리 이용되고 있는 방법이 co-training 알고리즘이다. 이 방법은 적은 수의 분류표시된 자료에서 두 가지 뷰(view)로 각 분류자를 학습한다. 그리고 각 분류자는 분석하고자 하는 모든 비분류표시된 자료에서 가장 만족할만한 예측자들을 만들어 나간다. 이렇게 훈련 데이타 셋에서 실험을 여러 번 반복적으로 하게 되면 각 뷰에서 새로운 분류자가 학습되어 분류표시된 자료의 수가 증가한다. 본 논문에서는 비분류표시된 데이타를 이용하여 새로운 co-training 방법을 제시한다. 이 방법은 두 가지 분류자와 WebKB 및 BIND XML의 2가지 실험 데이타를 가지고 평가하였다. 실험 결과로서, 이 논문에서 제안한 co-training 방법이 분류표시된 자료의 수가 매우 적을 때 분류정확성을 효과적으로 향상시킬 수 있음을 보였다.

다중 시기/편광 SAR 자료를 이용한 지표 피복 구분

  • 박노욱;지광훈;권병두
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2005년도 추계학술발표회 논문집
    • /
    • pp.79-84
    • /
    • 2005
  • 이 논문에서는 구름과 같은 기상 상태의 제약 없이 자료 획득이 가능한 SAR 자료를 이용하여 토지 피복 특성을 구분하고자 하였다. 기존 단일 주파수, 편광 상태의 자료만을 제공하는 SAR 자료를 이용한 분류에서의 낮은 분류 정확도를 향상시키고자 이 논문에서는 다중 시기 C 밴드 자료이면서 서로 다른 편광 상태의 자료를 제공하는 Radarsat-1(HH)와 ENVISAT(VV) 자료를 분류에 이용하였다. 분류 기법으로 Random Forests를 적용한 결과, 단일 편광 상태의 자료만을 이용하였을 때에 비해서 보다 향상된 분류 정확도를 얻을 수 있었다.

  • PDF

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

자료변환 기반 특징과 다중 분류자를 이용한 다중시기 SAR자료의 분류 (Classification of Multi-temporal SAR Data by Using Data Transform Based Features and Multiple Classifiers)

  • 유희영;박노욱;홍석영;이경도;김예슬
    • 대한원격탐사학회지
    • /
    • 제31권3호
    • /
    • pp.205-214
    • /
    • 2015
  • 이 연구에서는 자료변환기법을 이용해 추출된 여러 특징과 다양한 분류방법론을 결합하여 다중시기 SAR 자료를 위한 새로운 토지피복 분류기법을 제안하였다. 먼저, 다중시기 SAR 자료로부터 원본자료와는 다른 새로운 정보를 추출하기 위해 주성분분석과 3차원 웨이블렛 변환을 이용한 자료변환을 수행하였다. 그리고 나서 최대우도법 분류자, 신경망, support vector machine을 포함한 세 가지 다른 분류자를 변환된 특징자료들과 원본 후방산란계수 자료를 포함한 세가지 자료에 적용하여 다양한 초기 분류 결과를 얻도록 한다. 이후 다수결규칙을 통해 모든 초기결과를 결합하여 최종 분류 결과를 생성하게 된다. 다중시기 ENVISAT ASAR 자료를 이용한 사례연구에서 모든 초기 결과는 사용한 특징자료와 분류자의 종류에 따라 매우 다양한 분류정확도를 보였다. 이러한 9개의 초기 분류 결과를 결합한 최종 분류 결과는 가장 높은 분류 정확도를 보여주고 있는데, 이는 각 초기 분류 결과가 토지피복을 결정하기 위한 상호 보완적인 정보를 제공하기 때문이다. 이 연구에서의 분류정확도 향상은 주로 자료변환을 통해 얻어진 각기 다른 특징자료와 다른 분류자를 결합에 의한 다양성 확보에서 기인한다. 그러므로 이 연구에서 제안한 토지피복 분류방법론은 다중시기 SAR자료의 분류에 효과적으로 적용가능하며, 또한 다중센서 원격탐사 자료융합으로 확장이 가능하다.

Web 기반 감성 데이터베이스 구축을 위한 사용성 관련 감성 지표 개발 (Development of Usability-related Gamsung Indexes for Web-based Databases)

  • 박길환;임은영;박민용
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.338-342
    • /
    • 1999
  • 본 연구는 웹 기반 감성데이터베이스구축 및 보급을 위하여 국내의 감성 관련 주요 연구 결과 및 감성 자료를 수집하고 주요 감성 지표를 개발하였다. 개발된 감성 지표는 사용 적합성 지표로서 수집한 감성 자료들 중 사용 적합성에 관련된 감성 자료를 선별하여 이를 물리적/객관적 적합성 관련 지표와 주관적 적합성 관련 지표, 개발된 측정 시스템, 감성 정보물로 분류하였다. 물리적/객관적 지표는 다시 환경 지표, 생리 지표, 제품설계 지표, 평가척도 지표, 제품평가 기술 지표로 분류 등의 세부지표로 분류하고, 주관적 지표는 언어 지표, 묘사 지표, 심리 지표, 인지 지표로 다시 나누어 분류하였다. 개발된 제품, 측정 시스템, 또는 시뮬레이터 둥은 개발된 측정 시스템으로 분류하고 그 밖의 감성공학적으로 중요한 자료 및 정보는 감성공학 관련 정보물로 분류하였다. 분류한 지표는 전문가의 검증을 통해 타당성을 확인한 후 감성 데이터베이스로 구축될 예정이다. 이를 위하여 전반적인 감성 자료 관리 시스템을 통한 효과적인 감성 자료 관리체제 구축과 감성 자료의 공유가 뒤따라야 할 것이다.

  • PDF

교사 자료의 분광 특징 분리에 의한 감독 분류 성능 향상 (Enhancing Classification Performance by Separating Spectral Signature of Training Data Set)

  • 김광은
    • 대한원격탐사학회지
    • /
    • 제18권6호
    • /
    • pp.369-376
    • /
    • 2002
  • 본 연구에서는 공간 영상 자료의 감독 분류에 있어, 분석자에 의하여 선정된 분류 항목별 교사 자료를 분광 특징별로 다수의 군집으로 분리하고, 각각의 군집을 새로운 분류 항목의 교사 자료로서 설정함으로써 분류 성능을 향상시킬 수 있는 기법을 제안하고자 한다 특징 분리를 통하여 생성된 교사 자료는 비교적 작은 값의 밴드별 분산값을 가질 뿐 아니라 정규분포 형태의 자료 분포를 보이게 되어 통계적 감독 분류 기법의 적용에 적합한 교사 자료로서의 성격을 가지게 된다. 제안된 기법은 부산 지역에 대한 Landsat TM 영상 자료를 이용하여 그 적용성이 시험되었으며, 기존의 통계적 분류 기법들에 의한 결과와 그 성능이 정성적으로 비교되었다. 시험 적용 결과, 본 기법은 분석자가 선정한 교사 자료의 분광적인 분포 형태에 관계없이 우수한 분류 성능을 나타내는 것으로 판단되며, 따라서 분류 항목의 설정 및 항목별 교사 자료의 선정에 있어 교사 자료의 분광적 특징에 대한 동일성을 유지하기 위한 노력을 줄여줄 것으로 기대된다.

다중 시기 Radarsat-1 자료와 ENVISAT 자료를 이용한 토지 피복 분류 (Land-cover classification using multi-temporal Radarsat-1 and ENVISAT data)

  • 박노욱;지광훈
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.303-306
    • /
    • 2006
  • 이 연구에서는 C 밴드 SAR 자료이면서 서로 다른 편광 상태의 자료를 제공할 수 있는 다중 시기 Radarsat-1 자료와 ENVISAT ASAR 자료를 이용한 토지 피복 분류를 수행하였다. 다중 시기/편광 자료로부터 평균 후방산란계수, 시간적 변이도, 긴밀도 등의 특징을 기본적으로 추출하였고, 이외에 상호 비교를 위해 주성분 분석을 이용한 특징 추출을 시도하였다. 특징들을 이용한 분류기법으로는 Random Forests를 적용하였다. 충남 예당평야 일대를 대상으로 사례연구를 수행한 결과, 주성분 분석을 통한 특징과 다편광 자료를 이용하였을 때 분류 정확도가 향상되는 것으로 나타났다.

  • PDF