• 제목/요약/키워드: covariance thresholding

검색결과 4건 처리시간 0.023초

Comparison of covariance thresholding methods in gene set analysis

  • Park, Sora;Kim, Kipoong;Sun, Hokeun
    • Communications for Statistical Applications and Methods
    • /
    • 제29권5호
    • /
    • pp.591-601
    • /
    • 2022
  • In gene set analysis with microarray expression data, a group of genes such as a gene regulatory pathway and a signaling pathway is often tested if there exists either differentially expressed (DE) or differentially co-expressed (DC) genes between two biological conditions. Recently, a statistical test based on covariance estimation have been proposed in order to identify DC genes. In particular, covariance regularization by hard thresholding indeed improved the power of the test when the proportion of DC genes within a biological pathway is relatively small. In this article, we compare covariance thresholding methods using four different regularization penalties such as lasso, hard, smoothly clipped absolute deviation (SCAD), and minimax concave plus (MCP) penalties. In our extensive simulation studies, we found that both SCAD and MCP thresholding methods can outperform the hard thresholding method when the proportion of DC genes is extremely small and the number of genes in a biological pathway is much greater than a sample size. We also applied four thresholding methods to 3 different microarray gene expression data sets related with mutant p53 transcriptional activity, and epithelium and stroma breast cancer to compare genetic pathways identified by each method.

고차원 데이터에서 공분산행렬의 추정에 대한 비교연구 (A Comparative Study of Covariance Matrix Estimators in High-Dimensional Data)

  • 이동혁;이재원
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.747-758
    • /
    • 2013
  • 공분산 행렬은 다변량 통계분석에서 중요한 역할을 하고 있으며 전통적인 다변량 분석의 경우 표본 공분산 행렬이 참공분산 행렬의 추정량으로 주로 사용되었다. 하지만 변수의 수가 표본의 크기보다 훨씬 큰 고차원 데이터와 같은 경우에는 표본 공분산 행렬은 비정칙행렬이 되어 기존의 다변량 기법을 사용하는 데 적절하지 않을 수가 있다. 최근 이러한 문제점을 해결하기 위해 축소추정, 경계추정, 수정 콜레스키 분해 추정 등의 새로운 공분산 행렬의 추정량들이 제안되었다. 본 논문에서는 추정량들의 성능에 영향을 미칠 수 있는 여러 현실적인 상황들을 가정하여 모의실험을 통해 참공분산 행렬의 추정량들의 성능을 비교하였다.

3차원 유동 시뮬레이션을 위한 Supercompact 다중 웨이블릿 (Supercompact Multiwavelets for Three Dimensional Flow Field Simulation)

  • 양승철;이도형
    • 한국항공우주학회지
    • /
    • 제33권12호
    • /
    • pp.18-25
    • /
    • 2005
  • 본 논문에서는 supercompact 다중 웨이블릿 기법과 이 기법의 유동 시뮬레이션 데이터에의 적용을 발표한다. Supercompact 웨이블릿 방법은 간결한 지원(support)을 제공할 수 있고 또 속성이 다른 떨어져 있는 데이터와(예: 충격파의 불연속구간 또는 와동을 가로지르는 부분) 불필요한 상호작용을 피할 수 있는 점에서 유동 시뮬레이션 데이터를 위한 적합한 웨이블릿 방법이라 할 수 있다. 데이터 압축을 위한 임계처리법(thresholding)은 다중 웨이블릿의 공분산 벡터 구조 기반 하에 적용된다. 본 논문은 3차원으로의 기법 확장이 설명 분석되었다. 수치실험은 본 방법이 여러 이론적인 이점을 제공할 수 있고 실제 결과에 있어서 큰 데이터 압축 비율을 산출 할 수 있음을 보여준다.

온-오프 형태의 DNA 마이크로어레이 영상 분석을 위한 비선형 정합도 (Nonlinear matching measure for the analysis of on-off type microarray image)

  • 류문호;김종대
    • 한국통신학회논문지
    • /
    • 제30권3C호
    • /
    • pp.112-118
    • /
    • 2005
  • 본 논문에서는 교잡반응된 스팟을 템플릿 정합법으로 감지하는 온-오프 형태의 DNA 마이크로어레이 영상의 자동분석을 위한 새로운 비선형 정합도를 제안한다. HPV DNA 칩의 목표 스팟은 인유두종 바이러스(HPV)의 종을 알아내기 위해서 설계된다. 제안하는 척도는 전체 템플릿 영역을 이진 문턱값으로 양극화하여 스팟 영역 내의 밝은 화소의 개수를 취해서 얻는다. 이 척도를 추정된 마커 위치의 정확도 관점에서 평가하여 정규화된 상관도보다 우수함을 보인다.