• 제목/요약/키워드: generalized canonical correlation analysis

검색결과 13건 처리시간 0.021초

Higher-order solutions for generalized canonical correlation analysis

  • Kang, Hyuncheol
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.305-313
    • /
    • 2019
  • Generalized canonical correlation analysis (GCCA) extends the canonical correlation analysis (CCA) to the case of more than two sets of variables and there have been many studies on how two-set canonical solutions can be generalized. In this paper, we derive certain stationary equations which can lead the higher-order solutions of several GCCA methods and suggest a type of iterative procedure to obtain the canonical coefficients. In addition, with some numerical examples we present the methods for graphical display, which are useful to interpret the GCCA results obtained.

일반화 정준상관 행렬도와 프로크러스티즈 분석을 응용한 대한테니스협회 등록 선수의 체격요인, 체력요인 및 기초기술요인에 대한 분석연구 (A Study on the Relationship between Physique, Physical Fitness and Basic Skill Factors of Tennis Players in the Korea Tennis Association Using the Generalized Canonical Correlation Biplot and Procrustes Analysis)

  • 최태훈;최용석
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.917-925
    • /
    • 2010
  • 일반적으로 정준상관 행렬도(canonical correlation biplot)는 정준상관분석에서 두 변수집단에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 이를 활용하여 최태훈과 최용석 (2008)은 2006년도 한국여자골프협회(KLPGA) 선수에 대한 기술요인 변수군과 경기성적요인 변수군간의 관련성을 살펴보았고 최태훈 등 (2009)은 테니스 그랜드 슬램대회 선수특성요인과 경기요인에 대한 분석을 하였다. 더군다나 세 변수군 이상의 정준상관분석을 일반화 정준상관분석(generalized canonical correlation analysis)이라 하며 이와 관련하여 허명회 (1999, 6장)는 수량화 플롯을 제안하고있다. 이를 행렬도의 의미에서 일반화 정준상관 행렬도(generalized canonical correlation biplot)라하자. 본 연구에서는 대한 테니스협회(KTA)에 등록된 남자선수들 중 상위50명의 체격요인, 체력요인 및 기초기술요인에 대한 분석을 일반화 정준상관 행렬도를 적용하여 살펴보고 프로크러스티즈 분석을 통하여 전체선수, 상위랭킹과 하위랭킹 선수간의 행렬도 형상비교를 시도 하였다.

UNIFYING STATIONARY EQUATIONS FOR GENERALIZED CANONICAL CORRELATION ANALYSIS

  • Kang Hyun-Cheol;Kim Kee-Young
    • Journal of the Korean Statistical Society
    • /
    • 제35권2호
    • /
    • pp.143-156
    • /
    • 2006
  • In the present paper, various solutions for generalized canonical correlation analysis (GCCA) are considered depending on the criteria and constraints. For the comparisons of some characteristics of the solutions, we provide with certain unifying stationary equations which might to also useful to obtain various generalized canonical correlation analysis solutions. In addition, we suggest an approach for the generalized canonical correlation analysis by exploiting the concept of maximum eccentricity originally de-signed to test the internal independence structure. The solutions, including new one, are compared through unifying stationary equations and by using some numerical illustrations. A type of iterative procedure for the GCCA solutions is suggested and some numerical examples are provided to illustrate several GCCA methods.

Minimax Eccentricity Estimation for Multiple Set Factor Analysis

  • Hyuncheol Kang;Kim, Keeyoung
    • Journal of the Korean Statistical Society
    • /
    • 제31권2호
    • /
    • pp.163-175
    • /
    • 2002
  • An extended version of the minimax eccentricity factor estimation for multiple set case is proposed. In addition, two more simple methods for multiple set factor analysis exploiting the concept of generalized canonical correlation analysis is suggested. Finally, a certain connection between the generalized canonical correlation analysis and the multiple set factor analysis is derived which helps us clarify the relationship.

편정준상관 행렬도 (Partial Canonical Correlation Biplot)

  • 염아림;최용석
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.559-566
    • /
    • 2011
  • 행렬도는 이원표 자료행렬의 행과 열을 탐색하기에 유용한 그래프적 방법이다. 특히, 정준상관 행렬도는 정준상관분석의 결과를 이용하여 두 변수군과 개체간의 관계를 기하적으로 살펴볼 수 있다. 그 반면에 자료의 성격에 따라 세개 이상의 변수군이 존재하는 경우에는 정준상관분석의 개념에서 확장한 일반화 정준상관분석을 이용하여 일반화 정준상관 행렬도를 고려할 수 있다. 그러나 자료의 성격에 따라 두 변수군 외에 이들 두 변수군에 선형적 영향을 미치는 공변량변수로 이루어진 다른 한 변수군이 존재하는 경우에, 일반화 정준상관 행렬도를 적용한다면 공변량변수군의 영향력 때문에 주 관심인 두 변수군에 대하여 잘못 해석할 수 있다. 따라서 본 연구에서는 Rao (1969)의 공변량 변수군의 영향력을 제거한 편정준상관분석을 살펴보고, 이를 기하적으로 해석하기 위한 편정준상관 행렬도를 제안한다.

Multi-block Analysis of Genomic Data Using Generalized Canonical Correlation Analysis

  • Jun, Inyoung;Choi, Wooree;Park, Mira
    • Genomics & Informatics
    • /
    • 제16권4호
    • /
    • pp.33.1-33.9
    • /
    • 2018
  • Recently, there have been many studies in medicine related to genetic analysis. Many genetic studies have been performed to find genes associated with complex diseases. To find out how genes are related to disease, we need to understand not only the simple relationship of genotypes but also the way they are related to phenotype. Multi-block data, which is a summation form of variable sets, is used for enhancing the analysis of the relationships of different blocks. By identifying relationships through a multi-block data form, we can understand the association between the blocks in comprehending the correlation between them. Several statistical analysis methods have been developed to understand the relationship between multi-block data. In this paper, we will use generalized canonical correlation methodology to analyze multi-block data from the Korean Association Resource project, which has a combination of single nucleotide polymorphism blocks, phenotype blocks, and disease blocks.

공변량요인 효과를 제거한 편정준상관 행렬도와 프로크러스티즈 분석을 응용한 남자 테니스선수의 체력요인 및 기초기술요인에 대한 분석연구 (Relationship between Physical Fitness and Basic Skill Factors for KTA Players Using the Partial Cannonical Correlation Biplot Removing the Linear Effect of the Set of Covariate Variables and Procrustes Analysis)

  • 최태훈;최용석
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.97-105
    • /
    • 2012
  • 일반화 정준상관 행렬도(generalized canonical correlation biplot)는 정준상관분석에서 세 변수군 이상에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 최근에 이를 활용하여 최태훈과 최용석 (2010)은 2004년 대한테니스협회(KTA)에 등록된 남자선수들 중 상위 50명을 대상으로 세 변수군인 체격요인변수군, 체력요인변수군 그리고 기초기술요인변수군의 상호 연관성을 살펴보았다. 그러나 이들 분석에서 체격요인변수군이 나머지 두 변수군과 독립적이지 못하고 선형적 영향을 미치는 것으로 판단되어 이를 공변량변수군으로 고려하였다. 이와같이 세 변수군에서 한 변수군이 공변량(covariate)으로 영향을 주는 경우 이를 제거한 정준상관분석을 편(partial)정준상관분석이라 하며 이와 관련된 편정준상관 행렬도를 염아림과 최용석 (2011)은 제안하였다. 본 연구에서는 최태훈과 최용석(2010)의 분석에서 체격요인변수군의 영향을 제거하고 체력요인변수군과 기초기술요인변수군의 관계를 살펴보는 편정준상관 행렬도의 활용의 예를 보이고 기존 연구의 일반화 정준상관 행렬도, 편정준상관 행렬도, 정준상관 행렬도의 결과를 서로 비교하고자 한다. 덧붙여 이들 행렬도간의 형상변동 차이를 프로크러스티즈 분석을 활용하여 비교하고자 한다.

Quantification Plots for Several Sets of Variables

  • Park, Mira;Huh, Myung-Hoe
    • Journal of the Korean Statistical Society
    • /
    • 제25권4호
    • /
    • pp.589-601
    • /
    • 1996
  • Geometric approach to extend the classical two-set theory of canonical correlation analysis to three or more sets is considered. It provides statistical graphs to represent the data in a low dimensional space. Procedures are developed for computing the canonical variables and the corresponding properties are investigated. The solution is equivalent to that of the usual problem in the case of two sets. Goodness-of-fit of the proposed plots is studied and a numerical example is included.

  • PDF

로그-합 규준화와 정준형 상관 분석을 이용한 시간 지연 추정에 관한 연구 (A time delay estimation method using canonical correlation analysis and log-sum regularization)

  • 임준석;편용국;이석진;정명준
    • 한국음향학회지
    • /
    • 제36권4호
    • /
    • pp.279-284
    • /
    • 2017
  • 음원 위치 추정은 여러 방면에서 쓰임이 있는 응용 기술이다. 음원의 위치를 추정하기 위한 기본 기법 중에는 시간 지연 추정 기법이 있다. 이 기법에선 음원의 위치를 추정하기 위해서 두 개 또는 그 이상의 수신기에 들어오는 신호간의 상대적 시간 지연을 알아내야 한다. 시간 지연 추정 기법에는 일반화 된 상호 상관(Generalized Cross-Correlation, GCC) 대표적이지만, 정준형 상관 분석(Canonical Correlation Analysis, CCA)을 이용한 방법도 있다. 본 논문에서는 시간 지연 추정용 정준형 상관 분석의 고유벡터의 희소성을 이용하기 위해 새로운 알고리즘을 제안한다. 이를 위해서 로그-합(log-sum) 정규화를 이용한다. 본 논문에서는 서로 다른 여러 신호 대 잡음비 환경 하에서 비교 모의실험을 하였고, 이 비교 실험을 통하여 얻는 데이터를 통해서 제안한 새 정준형 상관 분석 기반 알고리즘이 이전의 정준형 상관분석 기반 알고리즘이나 기존 GCC보다 더 우수하다는 것을 보인다.

중복분석의 확장과 이를 이용한 일반화 정준상관분석 (A Note on Generalized Canonical Correlation Analysis Via an Extended Redundancy Analysis)

  • 강현철;김기영
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.105-113
    • /
    • 2000
  • Wollenberg(1977)의 중복분석(redundancy analysis)을 두 개 이상의 변수집단이 주어져 있는 경우로 확장하고, 확장된 중복분석과 일반화 정준상관분석의 관계를 논의하며, 이 관계를 이용하여 새로운 형태의 일반화 정준상관분석을 제안한다.

  • PDF