• 제목/요약/키워드: 주성분 분석

검색결과 1,994건 처리시간 0.031초

계층적 벌점함수를 이용한 주성분분석 (Hierarchically penalized sparse principal component analysis)

  • 강종경;박재신;방성완
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.135-145
    • /
    • 2017
  • 주성분 분석(principal component analysis; PCA)은 서로 상관되어 있는 다변량 자료의 차원을 축소하는 대표적인 기법으로 많은 다변량 분석에서 활용되고 있다. 하지만 주성분은 모든 변수들의 선형결합으로 이루어지므로, 그 결과의 해석이 어렵다는 한계가 있다. sparse PCA(SPCA) 방법은 elastic net 형태의 벌점함수를 이용하여 보다 성긴(sparse) 적재를 가진 수정된 주성분을 만들어주지만, 변수들의 그룹구조를 이용하지 못한다는 한계가 있다. 이에 본 연구에서는 기존 SPCA를 개선하여, 자료가 그룹화되어 있는 경우에 유의한 그룹을 선택함과 동시에 그룹 내 불필요한 변수를 제거할 수 있는 새로운 주성분 분석 방법을 제시하고자 한다. 그룹과 그룹 내 변수 구조를 모형 적합에 이용하기 위하여, sparse 주성분 분석에서의 elastic net 벌점함수 대신에 계층적 벌점함수 형태를 고려하였다. 또한 실제 자료의 분석을 통해 제안 방법의 성능 및 유용성을 입증하였다.

주성분 분석의 안전한 다자간 계산 (Secure Multiparty Computation of Principal Component Analysis)

  • 김상필;이상훈;길명선;문양세;원희선
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.919-928
    • /
    • 2015
  • 최근 대용량 데이터 대상의 프라이버시 보호 데이터 마이닝(privacy-preserving data mining: PPDM)이 활발히 연구되고 있다. 본 논문에서는 민감한 데이터 집합의 상관관계를 파악하는데 널리 사용되는 주성분 분석 기반의 PPDM을 다룬다. 일반적으로 주성분 분석은 모든 데이터를 한 곳에 모아 처리해야 하므로 민감한 데이터가 서로에게 공개되고, 상당한 계산량을 요구하며, 또한 데이터를 모으는 과정에서 많은 통신 오버헤드가 발생한다. 이러한 문제를 해결하기 위하여 본 논문은 데이터를 한 곳에 모으지 않고도 주성분 분석을 안전하게 계산하는 효율적인 방법을 제안한다. 제안하는 방법은 노드들 간에 한정된 정보만을 공유하면서도 원래의 주성분 분석 결과와 동일한 결과를 얻을 수 있다. 또한 안전한 주성분 분석에 저차원 변환을 적용하여 안전한 유사 문서 검색에 사용한다. 마지막으로 다양한 실험을 통해 제안한 방법이 대용량의 다차원 데이터에서 효율적으로 동작함을 확인한다.

주성분 분석(PCA)을 이용한 물관리 탄력성 지수의 가중치 산정 (Estimation of Weights in Water Management Resilience Index Using Principal Component Analysis(PCA))

  • 박정은;임광섭;이을래
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.583-583
    • /
    • 2016
  • 다양한 평가지표가 반영된 복합 지수(Composite Index)는 물관리 정책의 우선순위 결정 및 정책성과의 모니터링에 유용한 도구로 사용되고 있다. 각 지표별 중요도를 나타내는 가중치는 최종 지수의 산정에 영향을 미칠 수 있으며, 그 결정방법도 Data Envelopment Analysis(DEA), Benefit of doubt Approach(BOD), Unobserved Component Model(UCM), Budget Allocation Process(BAP), Analytic Hierarchy Process(AHP), Conjoint Analysis(CA) 등 다양하다. 본 연구에서는 여러 가지 가중치 결정방법 중 통계적 방법인 주성분 분석(Principal Component Analysis, PCA)을 사용하여 Park et al.(2016)이 제시한 물관리 탄력성 지수(Water Management Resilience Index, WMRI)에 대한 가중치를 산정하여 동일 가중치를 적용한 기존 결과와 비교하였다. 물관리 탄력성 지수는 자연조건상 물관리 취약성(Vulnerability), 기존 수자원 인프라의 견고성(Robustness), 물위기 적응전략의 다양성(Redundancy)의 3가지 부지수(sub-index)는 각각 13개, 11개, 7개의 지표(Indicator)로 구성되어 있으며, 117개 중권역을 다목적댐 하류 본류유역(범주 1), 용수공급 및 유량조절이 불가능한 지류(범주 2)와 가능한 지류(범주 3)로 분류하여 적용되었다. 각 부지수별로 추출된 3개, 5개, 3개의 주성분이 전체 자료의 76.4%, 71.2%, 63.2%를 설명하는 것으로 분석되었으며 부지수별 주성분의 고유벡터(Eigenvector)와 고유값(Eigenvalue)를 계산하고 각 지표의 가중치를 산정하였다. 주성분 분석에 의한 가중치와 동일 가중치를 적용하였을 경우와 비교해보면 취약성 부지수 1.9%, 견고성 부지수 1.9%, 다양성 부지수 2.1%의 차이가 나타나며 물관리 탄력성 지수는 0.4%의 차이를 보임에 따라 Park et al.이 제시한 연구결과의 적정성을 확인할 수 있었다. 주성분 분석은 객관적인 가중치 설정을 위한 통계적 접근방법의 하나로써 다양한 물관리 정책지수 산정시 활용될 수 있을 것이며, 향후 다른 가중치 산정방법을 적용함으로써 각 방법에 따른 지수 결과의 민감도 및 장단점을 분석할 수 있을 것으로 판단된다.

  • PDF

다변량 분석에 의한 둥굴레속 식물의 분류 (Classification of Polygonatum spp. Collections Based on Multivariate Analysis)

  • 윤종선;손석용;김익환;홍의연;윤태;;정승근;박상일
    • 한국약용작물학회지
    • /
    • 제10권5호
    • /
    • pp.333-339
    • /
    • 2002
  • 둥굴레속 식물의 활용도를 높이기 위한 기초 자료를 얻고자 변종 포함 10종(種) 20영양계(營養系)를 재배한 후 특성을 조사하고 주성분 분석과 군집 분석을 통하여 분류하였다. 주성분 분석 결과 제 1주성분은 전체 분산의 54.10%, 제 2주성분은 18,95% 그리고 제 3주성분은 11.62%를 차지하였으며, 상위 제 3주성분까지의 누적 기여율이 84.68%였다. 제 1주성분은 식물체의 형태와 크기, 동화기관, 저장기관 및 생식기관과 관련된 주성분이었고, 제 2주성분은 식물체의 생육 및 저장기관과 관련된 주성분이었으며, 제 3주성분은 식물체의 생육과 관련된 주성분이었다. 군집 분석 결과 군집간 평균거리가 약 0.7일 때 20개 영양계가 4개 군으로 분류되었으며, 제 I군에는 층층갈고리둥굴레, 제 II군에는 둥굴레, 무늬둥굴레, 산둥굴레 및 큰둥굴레, 제 III군에는 용둥굴레, 안면용둥굴레 및 각시둥굴레 그리고 제 IV군에는 죽대 및 통둥굴레가 속하였다.

주성분 분석을 사용한 포토모자이크 (Photomosaics Using Principal Component Analysis)

  • 전영재;오경수;조성현
    • 한국게임학회 논문지
    • /
    • 제11권1호
    • /
    • pp.139-146
    • /
    • 2011
  • 본 논문에서는 주성분 분석을 사용한 포토모자이크 생성 기법을 제안한다. 후보 이미지 집합의 주성분 분석 결과인 주성분과 계수를 사용하여 후보 이미지 검색을 보다 빠르고 정확하게 포토모자이크를 생성한다. 두 이미지를 하나의 주성분으로 투영해서 계산된 두 계수가 유사하면 두 이미지의 본래 정보 역시 유사하기 때문에, 본 논문에서 제안하는 주성분 분석을 사용하는 계수 비교 방법은 이미지의 색상 정보와 위치 정보를 동시에 비교할 수 있다. 계수 비교 방법은 모든 색상 비교 방법보다 빠르고, 평균 색상 비교 방법보다 정확하게 포토모자이크를 생성한다. 본 논문에서 제안하는 포토모자이크 알고리즘은 그래픽스 하드웨어의 가속을 받아 수행되므로 실시간에 입력 영상을 처리할 수 있다.

주성분분석을 이용한 수도의 생장해석 (Principal Component Analysis for the Growth Data of Rice)

  • 한원식;채영암
    • 한국작물학회지
    • /
    • 제31권2호
    • /
    • pp.173-178
    • /
    • 1986
  • 1979년에 조신력, 팔달, 진흥, 통일, 밀양2003등 5품종을 공시하여 질소수준을 0kg, 12kg, 18kg/10a에서 재배하여 15회에 걸쳐 조사한 엽후, 엽면적지수, 주당건물중과 수양 및 수양구성요소와의 관계를 주성분분석을 이용하여 분석한 결과는 다음과 같다. 1. 엽후, 엽면적지수, 주당건물중의 시계열데이타의 주성분분석에서 제 1주성분은 전기간의 평균적 크기의 대소를 표시하는 특성으로, 제 2주성분은 엽후, 엽면적지수에서는 변대의 위치, 주당건물중에서는 생육초기의 특성을 표시하는 종합특성치로 도출할 수 있었다. 2. 생장특성을 표시하는 종합특성치(주성분스코아)의 엽후는 품종간 차리가 엽면적지수 및 주당건물중은 질소수준간 차이가 인정되있다. 3. 수양 및 수량구성요소와의 관계에서 임실비율과 주당 수수가 엽면적 및 주당건물중의 스코아와 관계가 있었고 엽후와는 거의 관계가 없었으며 수양에 미치는 영향도 임실비율과 주당수수를 통해서라는 것을 알 수 있었다.

  • PDF

근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교 (Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data)

  • 백승현
    • 대한안전경영과학회지
    • /
    • 제15권4호
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

주성분 분석 방법을 이용한 유방암의 임상적 특징과 관련된 유전자 분석 (Molecular Profiling of Clinical Features in Breast Cancer Using Principal Component Analysis)

  • Han, Mi-Ryung;Lee, Seok-Ho;Han, Won-Shik;Kim, Mi-Hyeon;Noh, Dong-Young;Kim, Ju-Han
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.29-35
    • /
    • 2004
  • 유방암 환자의 임상정보(clinical features)와 cDNA microarray 기술을 이용하여 얻은 유전자 발현 프로파일은 유방암 예후 인자를 찾는 데에 매우 중요하다. 본 논문에서는 임상정보와 유전자 발현 정보를 접목해서 분석하는 방법으로써 주성분 분석(Principal Component Analysis)을 이용하였다. 이 방법은 다변량 자료의 차원을 줄이는 방법으로써, 대용량 실험 데이터로 인해 발생하는 문제점을 해결하기 위하여 많이 쓰이고 있다. 본 연구에서는 주성분 분석을 이용하여 먼저 한국인 유방암 환자 73명의 cDNA microarray 데이터 차원을 줄이고, 이를 통해 얻어진 주성분(Principal Components)과 임상정보 데이터와의 상관관계를 보았다. One-way ANOVA를 이용한 상관관계 분석 결과의 P-value는 permutation test를 통해 검증하였다. 동일한 방법을 estrogen receptor(ER)(+) 환자 20명과 ER(-) 환자 31명에 적용해본 결과, ER(-) 환자 중에서 재발과 관련된 유전자를 찾을 수 있었다. 주성분 분석을 molecular phenotypic profiles of clinical features에 이용한 결과 발견된 유전자는 유방암의 재발과 관련된 예후 인자로서 의미가 있다.

  • PDF

주성분 분석과 비정칙치 분해를 이용한 문서 요약 (Text Summarization using PCA and SVD)

  • 이창범;김민수;백장선;박혁로
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.725-734
    • /
    • 2003
  • 본 논문에서는 통계적 분석 기법인 주성분 분석과 비정칙치 분해를 이용한 문서 방법을 제안한다. 제안한 방법은 문서내의 주제어를 추출한 후, 추출된 주제어와 문장간의 거리가 가장 짧은 문장들을 중요 문장으로 추출하여 요약으로 제시한다. 주제어를 추출하기 위해서는 주성분 분석을 이용하였으며, 이는 문서 자체내의 빈도 정보와 단어간의 연관 정보를 이용한 것이다. 그리고, 중요 문장을 추출하기 위해 비정칙치 분해를 시행하여 문장 벡터와 주제어 벡터론 획득한 후, 두 벡터간의 유클리디언 거리를 계산하였다. 신문 기사를 대상으로 실험한 결과, 제안한 방법이 출현 빈도만을 이용한 방법과 주성분 분석만을 이용한 방법보다 성능이 우수함을 알 수 있었다.