• 제목/요약/키워드: 주성분 분석(PCA)

검색결과 654건 처리시간 0.029초

대용량 문서분류에서의 비선형 주성분 분석을 이용한 특징 추출 (Feature Selection with Non-linear PCA in Text Categorization)

  • 신형주;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.146-148
    • /
    • 1999
  • 문서분류의 문제점 중의 하나는 사용하는 데이터의 차원이 매우 크다는 것이다. 그러므로 문서에서 필요한 단어만을 자동적으로 추출하여 문서데이터의 차원을 축소하는 작업이 문서분류에서는 필수적이다. DF(Document Frequency)는 문서의 차원축소의 대표적인 통계적 방법 중 하나인데, 본 논문에서는 문서의 차원축소에 DF와 주성분 분석(PCA)을 비교하여 주성분 분석이 문서의 차원축소에 적합함을 실험적으로 보인다. 그리고 비선형 주성분 분석(nonlinear PCA) 방법 중 locally linear PCA와 kenel PCA를 적용하여 비선형 주성분 분석을 이용하여 문서의 차원을 줄이는 것이 선형 주성분 분석을 이용하는 것 보다 문서분류에 더 적합함을 실험적으로 보인다.

  • PDF

주파수공간에서의 주성분분석: 리뷰와 기상자료에의 적용 (Principal component analysis in the frequency domain: a review and their application to climate data)

  • 조유정;오희석;임예지
    • 응용통계연구
    • /
    • 제30권3호
    • /
    • pp.441-451
    • /
    • 2017
  • 본 논문에서는 주파수공간에서의 주성분 분석을 사용하여 기상자료를 분석하고자 한다. 주파수공간에서의 주성분분석은 차원축소를 위해서도 사용되지만, 주요한 패턴을 뽑아내는 데 사용되는 통계적 방법 중 하나이다. 일반적으로 주파수공간에서의 주성분 분석은 두 가지의 방법이 있는데, Hilbert PCA와 frequency domain PCA가 그것이다. 본 논문에서는 기존의 시간공간 주성분 분석과 함께 두 가지 주파수공간 주성분 분석 방법을 비교하였다. 시뮬레이션 자료를 통하여 주파수공간 주성분 분석 방법의 유용성을 보였으며, 열대 태평양 지역의 해수표층 온도값에 주성분 분석 방법들을 적용하여 기상자료 분석에 대한 유용성을 확인하였다.

주성분분석(PCA)을 이용한 출입인원관리에 대한 보안성 확보 방안 (A Way of Securing the Access By Using PCA)

  • 김민수;이동휘
    • 융합보안논문지
    • /
    • 제12권3호
    • /
    • pp.3-10
    • /
    • 2012
  • 본 연구는 주성분 분석을 통하여 출입인원에 대한 보안성을 확보방안을 제시하기 위함이다. 데이터를 수집하기 위해 K센터(IPS) 보안등급 A~E 출입구역 출입데이터를 바탕으로 BoxPlot와 주성분분석으로 통해 연구결과를 도출하였다. 주성분 분석을 수행하기 전에 공통성의 추출값에 대하여 다중공선성을 측정한 값인 분산팽창인수(VIF)가 2.902 이하이므로 주성분분석을 해석하는데 문제가 없음을 확인하였다. 이를 바탕으로 주성분 분석을 실시하여 제 1 주성분의 고유값 1.453, 제 2주성분의 고유값 1.283, 제 3 주성분의 고유값 1.142을 바탕으로 보안등급별 인원을 나누어 본 결과를 바탕으로 보안등급별 인원을 Green-list, Blue-list, Red-list, Black-list로 구분하였다.

변동계수행렬을 이용한 주성분분석 (Principal Component Analysis with Coefficient of Variation Matrix)

  • 김지현
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.385-392
    • /
    • 2015
  • 주성분분석은 차원축소를 위한 대표적 기법이다. 주성분분석에서 변수들이 측정단위가 다르거나 분산의 불균형이 심할 경우 흔히 변수를 표준화한 다음 분석할 것이 권장된다. 표준화 변환은 표준편차를 나누어주는 변환인데, 측정단위에 무관하게 만들기 위해서라면 평균을 나누어주는 변환도 고려해볼 수 있다. 표준화 변환을 한 다음 주성분분석하는 것은 상관행렬로 주성분분석하는 것과 같은데, 평균을 나누어주는 변환을 한 후 주성분분석하는 것은 변동계수와 관련된 행렬로 주성분분석하는 것과 같음을 보이고, 그렇게 변환을 한 다음 주성분분석을 실시하는 것이 왜 필요한가를 설명하였다.

잡음 민감성이 향상된 주성분 분석 기법의 비선형 변형 (A Non-linear Variant of Improved Robust Fuzzy PCA)

  • 허경용;서진석;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.15-22
    • /
    • 2011
  • 주성분 분석(PCA)은 데이터의 차원을 줄이면서 최대의 데이터 변이를 보존하는 기법으로 차원 축소나 특징 추출을 위해 널리 사용되고 있다. 하지만 PCA는 잡음에 민감하며 가우스 분포에 대하여만 유효하다는 단점이 있다. 잡음 민감성의 개선을 위해 다양한 방법이 제시되었고 그 중 퍼지 소속도를 이용한 반복적 최적화 기법인 RF-PCA2가 다른 방법에 비해 우수한 성능을 보였다. 하지만 RF-PCA2는 가우스 분포에만 사용할 수 있는 선형 알고리듬이라는 한계가 있다. 이 논문에서는 RF-PCA2와 커널 주성분 분석(kernel PCA, K-PCA)을 결합하여 가우스 분포 이외의 분포들도 다룰 수 있는 비선형 알고리듬인 improved robust kernel fuzzy PCA (RKF-PCA2)를 제안한다. RKF-PCA2는 RF-PCA2 알고리듬의 잡음 강건성과K-PCA의비선형성을 통해 기존알고리듬에 비해 잡음민감성이 적으며 가우스분포 한계를 효과적으로 극복할 수 있다. 이러한 사실은 실험 결과를 통해 확인할 수 있다.

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 춘계학술발표회 논문집
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

잡음 민감성이 개선된 퍼지 주성분 분석 (An Improved Robust Fuzzy Principal Component Analysis)

  • 허경용;우영운;김성훈
    • 한국정보통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.1093-1102
    • /
    • 2010
  • 주성분 분석(PCA)은 데이터의 차원을 줄이면서 최대의 데이터 변이를 보존하는 기법으로 차원 축소나 피처 추출을 위해 널리 사용되고 있다. 하지만 PCA는 잡음에 민감한 단점이 있으며, 이러한 잡음 민감성을 해결하기 위해 여러 가지 PCA 변형이 제안되었다. 그 중 robust fuzzy PCA(RF-PCA)는 퍼지 소속도를 사용하여 잡음의 영향을 효과적으로 줄일 수 있음이 입증되었다. 하지만 RF-PCA 역시 몇 가지 문제점이 있고, 수렴성이 그 중 하나이다. RF-PCA는 소속도와 주성분을 갱신할 때 서로 다른 목적 함수를 사용하므로 수렴 속도가 느리고 구해지는 해가 국부 최적 해임을 보장하지 않는다. 이 논문에서는 RF-PCA의 문제점을 해결하기 위해 하나의 목적 함수를 이용해 소속도와 주성분을 갱신할 수 있는 방법을 제안한다. 제안한 방법, RF-PCA2는 반복 최적화를 이용함으로써 국부 최적해에 수렴함을 보장하며, RF-PCA에 비해 빠른 수렴 속도를 가지고, 잡음 민감성이 줄어든다. 이러한 사실들은 실험 결과를 통해 확인할 수 있다.

오디오 업믹스를 위한 효율적인 주성분-주변성분 분리 알고리즘 (Efficient Primary-Ambient Decomposition Algorithm for Audio Upmix)

  • 백용현;전세운;이석필;박영철
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.924-932
    • /
    • 2012
  • 스테레오 업믹스(Upmix)에서 음원을 주성분(Primary)과 주변성분(Ambient)으로 분리하는 것은 주된 전처리 과정이며 주성분 분석법(Principal Component Analysis - PCA)을 이용한 연구가 진행되고 있다. 그러나 주성분 분석법은 분리 성능이 스테레오 음원이 가지는 주성분과 주변성분의 파워비(Primary Ambient Power Ratio - PAR Ratio) 및 주성분의 패닝 각도에 영향을 받는 다는 단점이 있다. 이전 연구에 따르면 PAR에 따른 단점을 극복하기 위한 변형된 주성분 분석법(Modified PCA) 방법이 제안되었으나 여전히 패닝 각도에 대한 단점은 극복하지 못하였다. 본 논문에서는 PAR 및 패닝 각도에 영향을 받지 않는 새로운 주성분 분석법 기반의 알고리즘을 제안하였다. 제안된 알고리즘은 스테레오 음원의 파워를 보존하는 기준을 두고 고유치의 비를 이용한 적절한 스케일 값을 통해 문제를 해결하였다. 제안된 알고리즘은 실험결과 PAR 및 주성분의 패닝 각도에 영향을 받지 않고 정확한 분리 성능을 보여줌을 확인하였다.

PCA-기반 고장 진단 시스템 설계에 관한 연구 (A study on the design of fault diagnostic system based on PCA)

  • 김성호;이영삼;한윤종
    • 한국지능시스템학회논문지
    • /
    • 제13권5호
    • /
    • pp.600-605
    • /
    • 2003
  • 주성분 분석은 공정의 모니터링과 고장진단을 위한 유용한 방법으로 알려져 있으며 일반적으로 잔차와 주성분의 해석을 통하여 고장의 원인을 분류하고 있다. 대규모 공정에서는 이러한 방법이 적용상의 한계를 가지고 있다. 본 논문에서는 보다 향상된 고장진단을 위해 주성분 분석에 FCM-기반 고장 진단 알고리즘을 결합하였고 Two-tank 시스템을 이용하여 주성분 분석을 이용한 FCM-기반 고장진단 알고리즘의 구현하여 적용하였다.

한국산 광의의 붉나무속(Rhus L. sensu lato)의 수리분류학적 연구 (Numerical taxonomy of Rhus sensu lato (Anacardiaceae) in Korea)

  • 도재화;김주환
    • 식물분류학회지
    • /
    • 제34권3호
    • /
    • pp.205-220
    • /
    • 2004
  • 한국산 광의의 붉나무속(Rhus) 6분류군간의 한계를 검토하기 위하여 28집단에 대한 67개의 외부형태학적 형질을 기초로 주성분분석과 군집분석의 수리분류학적 연구를 실시하였다. 47개의 정량형질을 기초로 한 주성분분석 결과에서는, 주성분 1, 2, 3이 전체분산값의 77.9%(주성분1 35.2%, 주성분2 22.5%, 주성분3 20.2%), 또한 20개의 정성형질을 기초로 한 분석결과에서는, 주성분 1, 2, 3은 전체분산에 대해 90.7%(주성분1 37.7%, 주성분2 33.0%. 주성분3 20.0%)를 설명 할 수 있는 것으로 나타났다. 주성분적재값을 기초로 하여 공간배열을 실시한 결과, 조사된 분류군들은 종집단 간에 뚜렷한 한계를 보이며 유집되었다. 또한, 단순유집계수에 의한 군집분석을 수행하여 UPGMA 표현도를 작성한 결과, 각각의 분류군 사이에는 뚜렷한 한계를 보였다. 군집분석 결과, 한국산 광의의 붉나무속 식물의 분류에는 정성적 형질이 유용한 것으로 나타났으며, 수리분류학적 연구는 한국산 광의의 붉나무속 6분류군의 분류학적 한계설정에 매우 유용한 것으로 나타났다.