• 제목/요약/키워드: Dimensionality Reduction

검색결과 202건 처리시간 0.03초

Multifactor Dimensionality Reduction (MDR) Analysis to Detect Single Nucleotide Polymorphisms Associated with a Carcass Trait in a Hanwoo Population

  • Lee, Jea-Young;Kwon, Jae-Chul;Kim, Jong-Joo
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제21권6호
    • /
    • pp.784-788
    • /
    • 2008
  • Studies to detect genes responsible for economic traits in farm animals have been performed using parametric linear models. A non-parametric, model-free approach using the 'expanded multifactor-dimensionality reduction (MDR) method' considering high dimensionalities of interaction effects between multiple single nucleotide polymorphisms (SNPs), was applied to identify interaction effects of SNPs responsible for carcass traits in a Hanwoo beef cattle population. Data were obtained from the Hanwoo Improvement Center, National Agricultural Cooperation Federation, Korea, and comprised 299 steers from 16 paternal half-sib proven sires that were delivered in Namwon or Daegwanryong livestock testing stations between spring of 2002 and fall of 2003. For each steer at approximately 722 days of age, the Longssimus dorsi muscle area (LMA) was measured after slaughter. Three functional SNPs (19_1, 18_4, 28_2) near the microsatellite marker ILSTS035 on BTA6, around which the QTL for meat quality were previously detected, were assessed. Application of the expanded MDR method revealed the best model with an interaction effect between the SNPs 19_1 and 28_2, while only one main effect of SNP19_1 was statistically significant for LMA (p<0.01) under a general linear mixed model. Our results suggest that the expanded MDR method better identifies interaction effects between multiple genes that are related to polygenic traits, and that the method is an alternative to the current model choices to find associations of multiple functional SNPs and/or their interaction effects with economic traits in livestock populations.

Identification of Stearoyl-CoA Desaturase (SCD) Gene Interactions in Korean Native Cattle Based on the Multifactor-dimensionality Reduction Method

  • Oh, Dong-Yep;Jin, Me-Hyun;Lee, Yoon-Seok;Ha, Jae-Jung;Kim, Byung-Ki;Yeo, Jung-Sou;Lee, Jea-Young
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제26권9호
    • /
    • pp.1218-1228
    • /
    • 2013
  • Fat quality is determined by the composition of fatty acids. Genetic relationships between this composition and single nucleotide polymorphisms (SNPs) in the stearoyl-CoA desaturase1 (SCD1) gene were examined using 513 Korean native cattle. Single and epistatic effects of 7 SNP genetic variations were investigated, and the multifactor dimensionality reduction (MDR) method was used to investigate gene interactions in terms of oleic acid (C18:1), mono-unsaturated fatty acids (MUFAs) and marbling score (MS). The g.6850+77 A>G and g.14047 C>T SNP interactions were identified as the statistically optimal combination (C18:1, MUFAs and MS permutation p-values were 0.000, 0.000 and 0.001 respectively) of two-way gene interactions. The interaction effects of g.6850+77 A>G, g.10213 T>C and g.14047 C>T reflected the highest training-balanced accuracy (63.76%, 64.70% and 61.85% respectively) and was better than the individual effects for C18:1, MUFAs and MS. In addition, the superior genotype groups were AATTCC, AGTTCC, GGTCCC, AGTCCT, GGCCCT and AGCCTT. These results suggest that the selected SNP combination of the SCD1 gene and superior genotype groups can provide useful inferences for the improvement of the fatty acid composition in Korean native cattle.

고품질 한우를 위한 여러 경제형질에서의 주요 SNP 규명 (Important SNPs Identification from the Economic Traits for the High Quality Korean Cattle)

  • 이제영;김동철
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2009
  • 고품질 한우를 만들기 위해 여러 경제형질에 영향을 주는 유전자 즉 single nucleotide polymorphisms(SNPs)를 규명하려고 한다. 이미 Lee 등 (2008a)에 의해 SNP(19_1)$^*$SNP(28_2)가 등심단면적 (LMA: longissimus muscle dorsi area)에 주요한 유전자로 규명되었다. 여기에 추가로 도체중 (CWT: carcass cold weight)과 일당증체량 (ADG: average daily gain)을 선형 모형에 적용하였으며 또한 상호작용에 더 유리하고 연속형 데이터에도 사용할 수 있는 expanded multifactor dimensionality reduction (expanded MDR)을 이용하여 주요한 SNP를 파악하였다. Expanded MDR 적용결과 등심단면적과 같은 결과인 SNP(19_1)과 SNP(19_1)$^*$SNP(28_2)의 상호작용 형태가 가장 좋은 SNP로 선정되었으며, 최종적으로 SNP(19_1)*SNP(28_2) 마커가 한우의 여러 경제형질에 우수 유전자임을 규명하였다.

다중인자 차원 축소 방법에 의한 대사증후군의 위험도 분석과 오즈비 (The study on risk factors for diagnosis of metabolic syndrome and odds ratio using multifactor dimensionality reduction method)

  • 진미현;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.867-876
    • /
    • 2013
  • 대사증후군은 심혈관질환의 발생을 증가시키는 주요 요인으로 알려져 왔다. 특히 만성적인 대사장애로 여러 질병이 한 개인에게서 복합되어 나타나는 대사증후군의 경우 우리나라에서도 유병률이 점차 증가하는 추세이다. 이에 본 연구는 다중인자 차원 축소 방법을 이용하여 대사증후군의 위험도를 확인하고 여러 대사증후군 진단 조합 중에서 가장 위험한 조합을 제시하는 데 목적을 둔다. 자료는 질병관리본부에서 실시한 제 5기 국민건강영양조사 1차년도 (2010년)자료를 이용하여 성인 중에서 분석방법에 적용이 가능한 3,990명을 대상자로 결정하였다. 다중인자 차원 축소 방법을 적용시킨 결과 대사증후군에 가장 위험한 단일 요인은 복부비만이었고, 복부비만을 포함한 대사증후군 진단 조합은 복부비만과 고지혈증, 고혈압이 가장 위험한 것으로 나타났다. 이것은 대사증후군의 새로운 진단 결과이다. 특히, 남성의 경우는 복부비만, 저 HDL-콜레스테롤혈증, 고혈압이 가장 위험한 조합으로 확인되었고 체질량 지수가 $25kg/m^2$이상인 사람에게서는 복부비만, 고지혈증, 고혈당의 조합이 가장 위험한 대사증후군 조합이었다.

A Novel Approach of Feature Extraction for Analog Circuit Fault Diagnosis Based on WPD-LLE-CSA

  • Wang, Yuehai;Ma, Yuying;Cui, Shiming;Yan, Yongzheng
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권6호
    • /
    • pp.2485-2492
    • /
    • 2018
  • The rapid development of large-scale integrated circuits has brought great challenges to the circuit testing and diagnosis, and due to the lack of exact fault models, inaccurate analog components tolerance, and some nonlinear factors, the analog circuit fault diagnosis is still regarded as an extremely difficult problem. To cope with the problem that it's difficult to extract fault features effectively from masses of original data of the nonlinear continuous analog circuit output signal, a novel approach of feature extraction and dimension reduction for analog circuit fault diagnosis based on wavelet packet decomposition, local linear embedding algorithm, and clone selection algorithm (WPD-LLE-CSA) is proposed. The proposed method can identify faulty components in complicated analog circuits with a high accuracy above 99%. Compared with the existing feature extraction methods, the proposed method can significantly reduce the quantity of features with less time spent under the premise of maintaining a high level of diagnosing rate, and also the ratio of dimensionality reduction was discussed. Several groups of experiments are conducted to demonstrate the efficiency of the proposed method.

환경적인 요인을 보정한 한우의 우수 유전자 조합 선별 (Major gene interaction identification in Hanwoo by adjusted environmental effects)

  • 이제영;진미현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.467-474
    • /
    • 2012
  • 인간의 질병과 가축의 경제적인 특성은 하나의 유전자가 아닌 여러 유전자의 상호작용의 영향을 더 많이 받는다고 알려져 있다. 본 논문에서는 유전적인 효과만을 밝혀내기 위해 선형회귀모형을 활용하여 환경적인 요인을 보정하고, 최근 한우의 맛과 육질에 영향을 준다고 밝혀진 단일염기다형성 5개 (Oh 등, 2011)를 이용해 한우의 경제형질에 영향을 주는 우수 유전자 조합을 선별하고 우수 유전자형을 밝힌다. 이때, 많은 유전자들 중에서 우수한 유전자를 찾기 위한 비모수적인 방법인 다중인자 차원 축소 방법을 이용하여 단일 유전자의 효과보다 상호작용의 효과가 한우의 경제형질에 더 많은 영향을 준다는 사실을 확인하였다.

On Combining Genetic Algorithm (GA) and Wavelet for High Dimensional Data Reduction

  • Liu, Zhengjun;Wang, Changyao;Zhang, Jixian;Yan, Qin
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.1272-1274
    • /
    • 2003
  • In this paper, we present a new algorithm for high dimensional data reduction based on wavelet decomposition and Genetic Algorithm (GA). Comparative results show the superiority of our algorithm for dimensionality reduction and accuracy improvement.

  • PDF

비부정 행렬 인수분해 차원 감소를 이용한 최근 인접 협력적 여과 (Nearest-Neighbor Collaborative Filtering Using Dimensionality Reduction by Non-negative Matrix Factorization)

  • 고수정
    • 정보처리학회논문지B
    • /
    • 제13B권6호
    • /
    • pp.625-632
    • /
    • 2006
  • 협력적 여과는 사용자 선호도를 예측하기 위해 그 사용자의 유형을 학습하는 데 목적을 둔 기술이다. 협력적 여과 시스템이 전자상거래에서 성공적인 기술일지라도 그들은 데이터의 고차원성과 희박성이라는 문제점을 갖는다. 본 논문에서는 이와 같은 문제점을 해결하기 위하여 비부정 행렬 인수분해(NNMF, Non-negative Matrix Factorization) 방법을 이용한 최근 인접 협력적 여과 방법을 제안한다. 행렬을 분해하기 위한 전처리로서 사용자 변동 계수를 이용하여 사용자-아이템 행렬의 결측치를 채우고, 이를 대상으로 비부정 분해 방식을 적용하여 행렬을 인수분해 한다. 비부정 분해 방식을 적용한 긍정 분해는 사용자들을 의미를 갖는 벡터로써 표현함으로써 사용자들을 의미 관계를 갖는 그룹으로 표현한다. 이와 같이 벡터로 표현된 사용자들은 벡터 유사도에 의해 그들간의 유사도를 계산한다. 계산된 유사도의 정도에 의해 이웃을 결정하고, 이웃들이 평가한 아이템에 대한 흥미도를 기반으로 새로운 사용자가 평가하지 않은 아이템에 대한 결측치를 예측한다.

비유사도-기반 분류를 위한 차원 축소방법의 비교 실험 (A Comparative Experiment on Dimensional Reduction Methods Applicable for Dissimilarity-Based Classifications)

  • 김상운
    • 전자공학회논문지
    • /
    • 제53권3호
    • /
    • pp.59-66
    • /
    • 2016
  • 이 논문에서는 비유사도-기반 분류(dissimilarity-based classifications: DBC)를 효율적으로 수행할 수 있는 차원 축소 방법들을 비교 평가한 실험 결과를 보고한다. DBC에선 분류를 위해 대상 물체를 측정한 결과 값들(특징 요소들의 집합)을 이용하는 대신에 각 대상 물체들 사이의 비유사도를 측정하여 분류한다. 현재 DBC와 관련된 이슈들 중의 하나는 대규모 데이터를 취급할 경우에 비유사도 공간의 차원이 고차원으로 되는 문제가 있다. 이 문제를 해결하기 위하여 현재 프로토타입 선택(prototype selection: PS)방법이나 차원 축소(dimension reduction: DR)방법을 이용하고 있다. PS는 전체 학습 데이터에서 프로토타입을 추출하여 비유사도 공간을 구성하는 방법이고, DR은 전체 학습 데이터로 먼저 비유사도 공간을 구성한 다음 이 공간의 차원을 축소하는 방법이다. 이 논문에서는 PS이나 DR 대신에, 학습 데이터에 대한 주성분 분석으로 적절한 차원의 고유 공간 (Eigen space: ES)을 구성한 다음, 이 고유 공간으로 매핑 된 벡터들 사이의 $l_p$-놈(norm) 거리를 비유사도 거리로 측정하여 이용하는 DBC를 제안한다. 인터넷에 공개된 인공 및 실세계 데이터를 이용하여 최 근방 이웃 분류규칙으로 ES에서 수행한 DBC의 분류 성능을 측정한 결과, 고유공간의 차원을 적절하게 선정하였을 경우 PS와 DR를 이용한 DBC보다 분류 성능이 더 향상되었음을 확인하였다.