• Title/Summary/Keyword: 주성분 분석

검색결과 1,994건 처리시간 0.03초

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 춘계학술발표회 논문집
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

대용량 문서분류에서의 비선형 주성분 분석을 이용한 특징 추출 (Feature Selection with Non-linear PCA in Text Categorization)

  • 신형주;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.146-148
    • /
    • 1999
  • 문서분류의 문제점 중의 하나는 사용하는 데이터의 차원이 매우 크다는 것이다. 그러므로 문서에서 필요한 단어만을 자동적으로 추출하여 문서데이터의 차원을 축소하는 작업이 문서분류에서는 필수적이다. DF(Document Frequency)는 문서의 차원축소의 대표적인 통계적 방법 중 하나인데, 본 논문에서는 문서의 차원축소에 DF와 주성분 분석(PCA)을 비교하여 주성분 분석이 문서의 차원축소에 적합함을 실험적으로 보인다. 그리고 비선형 주성분 분석(nonlinear PCA) 방법 중 locally linear PCA와 kenel PCA를 적용하여 비선형 주성분 분석을 이용하여 문서의 차원을 줄이는 것이 선형 주성분 분석을 이용하는 것 보다 문서분류에 더 적합함을 실험적으로 보인다.

  • PDF

적응적 상관도를 이용한 주성분 분석에 관한 연구 (A Study on PCA using Adaptive Correlation)

  • 고명숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.13-14
    • /
    • 2020
  • 고차원의 데이터를 처리하기 위해서는 데이터의 성질을 유지하면서 특징을 잘 반영할 수 있는 특징 추출 방법이 필요하며 주성분분석 방법은 대표적인 특징 추출 방법이다. 본 연구에서는 데이터가 고차원인 경우 데이터 특징 추출을 위한 주성분 분석의 주성분 변수 선정시 적응적 상관도(Correlation)를 기반으로 한 주성분 분석 방법을 제안한다. 제안하는 방법은 입력 데이터간의 상관관계를 기반으로 상관도를 적응적으로 반영하여 데이터의 주성분을 분석함으로써 실제 데이터의 특징을 나타내는 세분화 변수 선정 시 데이터 편향성의 영향을 줄이기 위한 방법이다.

변동계수행렬을 이용한 주성분분석 (Principal Component Analysis with Coefficient of Variation Matrix)

  • 김지현
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.385-392
    • /
    • 2015
  • 주성분분석은 차원축소를 위한 대표적 기법이다. 주성분분석에서 변수들이 측정단위가 다르거나 분산의 불균형이 심할 경우 흔히 변수를 표준화한 다음 분석할 것이 권장된다. 표준화 변환은 표준편차를 나누어주는 변환인데, 측정단위에 무관하게 만들기 위해서라면 평균을 나누어주는 변환도 고려해볼 수 있다. 표준화 변환을 한 다음 주성분분석하는 것은 상관행렬로 주성분분석하는 것과 같은데, 평균을 나누어주는 변환을 한 후 주성분분석하는 것은 변동계수와 관련된 행렬로 주성분분석하는 것과 같음을 보이고, 그렇게 변환을 한 다음 주성분분석을 실시하는 것이 왜 필요한가를 설명하였다.

공간자료 주성분분석 (Principal component regression for spatial data)

  • 임예지
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.311-321
    • /
    • 2017
  • 주성분 분석은 통계학 뿐만 아니라 기상학에서 널리 사용되는 방법론이며, 고차원 자료에 대한 차원축소 역할 뿐만아니라 기상자료에서의 의미있는 패턴을 찾아내기 위해 사용되는 방법론이다. 또한 주성분분석에 기반을 둔 주성분 회귀분석 방법론은 기후예측이 가능하므로 미래 시점의 기후값 예측에 사용될 수 있다. 본 논문에서는 Wang과 Huang (2016) 논문에서 제안한 제한된 공간 주성분 분석을 기반으로 한 주성분 회귀분석 방법론을 개발하였다. 이를 시뮬레이션을 통하여 확인하였고, 실제 자료인 동아시아 지역 온도예측에 적용하여 기존의 주성분 회귀분석 예측 값에 비해 예측력이 높아짐을 확인하였다.

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

적응적 상관도를 이용한 주성분 변수 선정에 관한 연구 (A Study on Selecting Principle Component Variables Using Adaptive Correlation)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권3호
    • /
    • pp.79-84
    • /
    • 2021
  • 고차원의 데이터를 처리하기 위해서는 데이터의 성질을 유지하면서 특징을 잘 반영할 수 있는 특징 추출 방법이 필요하다. 주성분분석 방법은 고차원 데이터에 포함된 정보를 저차원의 데이터로 변환하여 원래 데이터의 변수 수보다 적은 수의 변수로 고차원 데이터를 표현 할 수 있는 방법으로서 데이터의 특징 추출을 위한 대표적인 방법이다. 본 연구에서는 데이터가 고차원인 경우 데이터 특징 추출을 위한 주성분 분석에 있어서 주성분 변수 선정 시 적응적 상관도를 기반으로 한 주성분 분석 방법을 제안한다. 제안하는 방법은 입력 데이터간의 상관 관계를 기반으로 상관도를 적응적으로 반영하여 데이터의 주성분을 분석함으로써 다른 여러 변수에 중복적으로 상관도가 높은 변수와 주성분을 유도하는데 연관성이 적은 변수를 주성분 변수 후보 대상에서 제외시키고자 한다. 고유벡터 계수 값에 의한 주성분 위계를 분석하고 위계가 낮은 주성분이 변수로 선정이 되는 것을 막고 또한 상관 분석을 통하여 데이터의 중복 발생이 데이터 편향을 유도하는 것을 최소화하 하고자 한다. 이를 통하여 주성분 변수 선정 시 데이터 편향성의 영향을 줄임으로써 실제 데이터의 특징을 잘 나타내는 주성분 변수를 선정하는 방법을 제안하고자 한다.

한국산 광의의 붉나무속(Rhus L. sensu lato)의 수리분류학적 연구 (Numerical taxonomy of Rhus sensu lato (Anacardiaceae) in Korea)

  • 도재화;김주환
    • 식물분류학회지
    • /
    • 제34권3호
    • /
    • pp.205-220
    • /
    • 2004
  • 한국산 광의의 붉나무속(Rhus) 6분류군간의 한계를 검토하기 위하여 28집단에 대한 67개의 외부형태학적 형질을 기초로 주성분분석과 군집분석의 수리분류학적 연구를 실시하였다. 47개의 정량형질을 기초로 한 주성분분석 결과에서는, 주성분 1, 2, 3이 전체분산값의 77.9%(주성분1 35.2%, 주성분2 22.5%, 주성분3 20.2%), 또한 20개의 정성형질을 기초로 한 분석결과에서는, 주성분 1, 2, 3은 전체분산에 대해 90.7%(주성분1 37.7%, 주성분2 33.0%. 주성분3 20.0%)를 설명 할 수 있는 것으로 나타났다. 주성분적재값을 기초로 하여 공간배열을 실시한 결과, 조사된 분류군들은 종집단 간에 뚜렷한 한계를 보이며 유집되었다. 또한, 단순유집계수에 의한 군집분석을 수행하여 UPGMA 표현도를 작성한 결과, 각각의 분류군 사이에는 뚜렷한 한계를 보였다. 군집분석 결과, 한국산 광의의 붉나무속 식물의 분류에는 정성적 형질이 유용한 것으로 나타났으며, 수리분류학적 연구는 한국산 광의의 붉나무속 6분류군의 분류학적 한계설정에 매우 유용한 것으로 나타났다.

주성분분석(PCA)을 이용한 출입인원관리에 대한 보안성 확보 방안 (A Way of Securing the Access By Using PCA)

  • 김민수;이동휘
    • 융합보안논문지
    • /
    • 제12권3호
    • /
    • pp.3-10
    • /
    • 2012
  • 본 연구는 주성분 분석을 통하여 출입인원에 대한 보안성을 확보방안을 제시하기 위함이다. 데이터를 수집하기 위해 K센터(IPS) 보안등급 A~E 출입구역 출입데이터를 바탕으로 BoxPlot와 주성분분석으로 통해 연구결과를 도출하였다. 주성분 분석을 수행하기 전에 공통성의 추출값에 대하여 다중공선성을 측정한 값인 분산팽창인수(VIF)가 2.902 이하이므로 주성분분석을 해석하는데 문제가 없음을 확인하였다. 이를 바탕으로 주성분 분석을 실시하여 제 1 주성분의 고유값 1.453, 제 2주성분의 고유값 1.283, 제 3 주성분의 고유값 1.142을 바탕으로 보안등급별 인원을 나누어 본 결과를 바탕으로 보안등급별 인원을 Green-list, Blue-list, Red-list, Black-list로 구분하였다.

주성분회귀분석에서 주성분선정을 위한 새로운 방법 (Procedure for the Selection of Principal Components in Principal Components Regression)

  • 김부용;신명희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.967-975
    • /
    • 2010
  • 데이터마이닝 분야에서의 회귀모형에는 연관성이 높은 설명변수들이 포함되어 다중공선성을 유발하는 경우가 많은데, 다중공선성이 야기하는 문제를 해결하기 위하여 주성분회귀분석을 적용할 수 있다. 이 분석에서는 적절한 주성분을 선정하는 과정이 핵심인데, 기존의 선정방법들은 다중공선성을 잘 해결하지 못하거나 모형의 적합성을 저하시킨다는 지적을 받고 있다. 따라서 본 논문에서는 다중공선성 문제와 적합성 저하 현상을 동시에 해결할 수 있는 새로운 선정방법을 제안하였다. 다중공선성에 의해 최소제곱추정량의 분산이 팽창되는 문제를 주성분회귀에 의해 해결할 수 있지만, 주성분의 일부를 선정함에 따라 발생하는 편의도 동시에 통제해야 한다. 따라서 주성분회귀추정량의 평균제곱오차를 최소가 되게 하는 상태지수를 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준 모형을 구축하였다. 선정기준의 상한과 하한을 설정하고, 상태지수가 상한을 초과하면 해당 주성분을 제외시키고, 하한에 미달하면 해당 주성분을 포함시킨다. 그리고 상한과 하한 사이의 상태지수에 대응하는 주성분들에 대해서는 일반화선형검정을 순차적으로 적용하여 주성분을 선정하는 방법이다.