• 제목/요약/키워드: Covariance matrix pattern

검색결과 20건 처리시간 0.021초

Deletion diagnostics in fitting a given regression model to a new observation

  • Kim, Myung Geun
    • Communications for Statistical Applications and Methods
    • /
    • 제23권3호
    • /
    • pp.231-239
    • /
    • 2016
  • A graphical diagnostic method based on multiple case deletions in a regression context is introduced by using the sampling distribution of the difference between two least squares estimators with and without multiple cases. Principal components analysis plays a key role in deriving this diagnostic method. Multiple case deletions of test statistic are also considered when a new observation is fitted to a given regression model. The result is useful for detecting influential observations in econometric data analysis, for example in checking whether the consumption pattern at a later time is the same as the one found before or not, as well as for investigating the influence of cases in the usual regression model. An illustrative example is given.

화자식별을 위한 강인한 주성분 분석 가우시안 혼합 모델 (RPCA-GMM for Speaker Identification)

  • 이윤정;서창우;강상기;이기용
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.519-527
    • /
    • 2003
  • 음성신호는 주변 잡음과 화자의 발성 패턴 변화, 음성 검출 오류에서 생기는 이상치(outlier)에 많은 영향을 받고 있다. 이러한 음성 신호를 이용하여 화자인식에 이용할 경우 인식률이 저하된다. 본 논문에서는 화자식별 (speaker identification)에서 학습 특징 벡터의 이상치와 고차원 문제를 해결하기 위하여 M-추정을 이용한 강인한 주성분 분석 가우시안 혼합모델 (Robust Principal Component Analysis-Gaussian Mixture Model)방법을 제안하였다. 제안된 방법은 먼저, 특징 벡터에 이상치가 존재할 경우 M-추정에 의하여 강인한 공분산 행렬을 재추정하여 얻어진 고유벡터로부터 변환 행렬을 구하여 감소된 차원을 갖는 새로운 특징벡터를 구한다. 여기에서 얻은 선형변환된 특징벡터로부터 화자의 가우시안 혼합 모델을 구한다. 제안된 방법의 성능을 검증하기 위하여 화자식별 실험을 하였다. 실험은 전형적인 가우시안 혼합 모델 방법과 주성분 분석법, 제안된 방법을 비교 분석하였다. 이상치가 2%씩 증가할 때마다 가우시안 혼합모델 방법과 주성분 분석법은 각각 0.65%, 0.55%씩 화자식별 성능이 저하되었지만, 제안된 방법은 0.03%정도 감소하였으므로 이상치에 더욱 강인함을 알 수 있다.

주성분분석을 이용한 기종점 데이터의 압축 및 주요 패턴 도출에 관한 연구 (A Study on the Compression and Major Pattern Extraction Method of Origin-Destination Data with Principal Component Analysis)

  • 김정윤;탁세현;윤진원;여화수
    • 한국ITS학회 논문지
    • /
    • 제19권4호
    • /
    • pp.81-99
    • /
    • 2020
  • 기종점 데이터는 수요 분석 및 서비스 설계를 위해서 대중교통, 도로운영 등 다양한 분야에서 저장 및 활용되고 있다. 최근 빅데이터의 활용성이 증대되면서 기종점 데이터의 분석 및 활용에 대한 수요도 함께 증가하고 있다. 기존의 일반적인 교통 정보 데이터가 수집장비 수(n)에 비례하여 데이터양이 증가(α·n)하는 것과는 다르게, 기종점 데이터는 수집지점 수(n)의 증가에 따라 수집 데이터의 양이 기하급수적으로 증가(α·n2)하는 경향이 있다. 이로 인하여 기종점 데이터를 원시 데이터의 형태로 장기간 저장하고 빅데이터 분석에 활용하는 것은 대용량의 저장 공간이 필요하다는 것을 고려할 때 실용적 대안으로 여겨지지 않고 있다. 이와 함께 기종점 데이터는 0~10 사이의 작은 수요 부분에 패턴화된 형태와 무작위 적인 형태의 데이터가 섞여있어 작은 수요가 그룹화되어 발생하는 주요 패턴을 추출하기에 어려움이 있다. 이러한 기종점 데이터의 저장용량의 한계와 패턴화 분석의 한계를 극복하고자 본 연구에서는 주성분 분석을 활용한 대중교통 기종점 데이터의 압축 및 분석 방법을 제안하였다. 본 연구에서는 서울시와 세종시의 대중교통 이용 데이터를 활용하여 모빌리티 데이터를 분석하고, 모빌리티 기종점 데이터에 포함된 무작위 성향이 높은 데이터를 제거하기 위해 주성분분석 기반의 데이터 압축 및 복원에 관한 연구를 수행하였다. 주성분분석으로 분해된 기종점 데이터와 원데이터를 비교하여 주요한 수요 패턴을 찾고 이를 통해 압축률과 복원율을 높일 수 있는 주성분 범위를 제안하였다. 본 연구에서 분석한 결과, 서울시 기준 1~80, 세종시 기준 1~60까지의 주성분을 사용할 경우 주요 이동 데이터의 손실 없이 기종점 데이터에 포함되어있는 노이즈를 제거하고 데이터를 압축 및 복원이 가능하였다.

다변량 프로빗 모형을 이용한 가전제품 구매의 상관관계 분석 (Correlation among Ownership of Home Appliances Using Multivariate Probit Model)

  • 김창섭;신정우;이미숙;이종수
    • 마케팅과학연구
    • /
    • 제19권2호
    • /
    • pp.17-26
    • /
    • 2009
  • As the lifestyle of consumers changes and the need for various products increases, new products are being developed in the market. Each household owns various home appliances which are purchased through the choice of a decision maker. These appliances include not only large-sized products such as TV, refrigerator, and washing machine, but also small-sized products such as microwave oven and air cleaner. There exists latent correlation among possession of home appliances, even though they are purchased independently. The purpose of this research is to analyze the effect of demographic factors on the purchase and possession of each home appliances, and to derive some relationships among various appliances. To achieve this purpose, the present status on the possession of each home appliances are investigated through consumer survey data on the electric and energy product. And a multivariate probit(MVP) model is applied for the empirical analysis. From the estimation results, some appliances show a substitutive or complementary pattern as expected, while others which look apparently unrelated have correlation by co-incidence. This research has several advantages compared to previous literatures on home appliances. First, this research focuses on the various products which are purchased by each household, while previous researches such as Matsukawa and Ito(1998) and Yoon(2007) focus just on a particular product. Second, the methodology of this research can consider a choice process of each product and correlation among products simultaneously. Lastly, this research can analyze not only a substitutive or complementary relationship in the same category, but also the correlation among products in the different categories. As the data on the possession of home appliances in each household has a characteristic of multiple choice, not a single choice, a MVP model are used for the empirical analysis. A MVP model is derived from a random utility model, and has an advantage compared to a multinomial logit model in that correlation among error terms can be derive(Manchanda et al., 1999; Edwards and Allenby, 2003). It is assumed that the error term has a normal distribution with zero mean and variance-covariance matrix ${\Omega}$. Hence, the sign and value of correlation coefficients means the relationship between two alternatives(Manchanda et al., 1999). This research uses the data of 'TEMEP Household ICT/Energy Survey (THIES) 2008' which is conducted by Technology Management, Economics and Policy Program in Seoul National University. The empirical analysis of this research is accomplished in two steps. First, a MVP model with demographic variables is estimated to analyze the effect of the characteristics of household on the purchase of each home appliances. In this research, some variables such as education level, region, size of family, average income, type of house are considered. Second, a MVP model excluding demographic variables is estimated to analyze the correlation among each home appliances. According to the estimation results of variance-covariance matrix, each households tend to own some appliances such as washing machine-refrigerator-cleaner-microwave oven, and air conditioner-dish washer-washing machine and so on. On the other hand, several products such as analog braun tube TV-digital braun tube TV and desktop PC-portable PC show a substitutive pattern. Lastly, the correlation map of home appliances are derived using multi-dimensional scaling(MDS) method based on the result of variance-covariance matrix. This research can provide significant implications for the firm's marketing strategies such as bundling, pricing, display and so on. In addition, this research can provide significant information for the development of convergence products and related technologies. A convergence product can decrease its market uncertainty, if two products which consumers tend to purchase together are integrated into it. The results of this research are more meaningful because it is based on the possession status of each household through the survey data.

  • PDF

Bearing fault detection through multiscale wavelet scalogram-based SPC

  • Jung, Uk;Koh, Bong-Hwan
    • Smart Structures and Systems
    • /
    • 제14권3호
    • /
    • pp.377-395
    • /
    • 2014
  • Vibration-based fault detection and condition monitoring of rotating machinery, using statistical process control (SPC) combined with statistical pattern recognition methodology, has been widely investigated by many researchers. In particular, the discrete wavelet transform (DWT) is considered as a powerful tool for feature extraction in detecting fault on rotating machinery. Although DWT significantly reduces the dimensionality of the data, the number of retained wavelet features can still be significantly large. Then, the use of standard multivariate SPC techniques is not advised, because the sample covariance matrix is likely to be singular, so that the common multivariate statistics cannot be calculated. Even though many feature-based SPC methods have been introduced to tackle this deficiency, most methods require a parametric distributional assumption that restricts their feasibility to specific problems of process control, and thus limit their application. This study proposes a nonparametric multivariate control chart method, based on multiscale wavelet scalogram (MWS) features, that overcomes the limitation posed by the parametric assumption in existing SPC methods. The presented approach takes advantage of multi-resolution analysis using DWT, and obtains MWS features with significantly low dimensionality. We calculate Hotelling's $T^2$-type monitoring statistic using MWS, which has enough damage-discrimination ability. A bootstrap approach is used to determine the upper control limit of the monitoring statistic, without any distributional assumption. Numerical simulations demonstrate the performance of the proposed control charting method, under various damage-level scenarios for a bearing system.

고유값 분석을 이용한 효과적인 후판 인식 (An Effective Steel Plate Detection Using Eigenvalue Analysis)

  • 박상현
    • 한국전자통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.1033-1039
    • /
    • 2012
  • 본 논문에서는 여러 장의 후판이 포함된 영상에서 고유값을 이용하여 직선 패턴을 검출하고 이를 바탕으로 각각의 후판을 인식하는 간단하면서도 정확한 알고리즘을 제안한다. 후판 영상으로부터 후판에 관련된 정보를 분석 및 인식하기 위해서 먼저 후판의 직선 에지를 검출한다. 후판 영상의 직선 에지 검출을 위해 제안하는 알고리즘에서는 마스크를 이용하여 전체 영상을 탐색하면서 에지 영상을 분석한다. 먼저 마스크에 위치한 에지 패턴의 픽셀들에 대한 공분산 행렬을 계산하고 공분산 행렬의 고유값과 에지 패턴의 통계적 특성과 기하학적인 특성 사이의 관계를 분석하여 직선 에지를 검출한다. 다음으로 직선 에지의 방향 정보와 원점에서의 거리 정보를 분석하여 전체 영상에서 각각의 후판을 검출한다. 다양한 후판 영상에 대해서 실험을 수행한 결과는 제안하는 알고리즘이 전체 영상에서 각각의 후판을 효과적으로 검출함을 보여준다.

고유값 분석을 이용한 효과적인 후판의 직선 검출 (Effective Line Detection of Steel Plates Using Eigenvalue Analysis)

  • 박상현;김종호;강의성
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1479-1486
    • /
    • 2011
  • 본 논문에서는 후판 영상에서 직선 패턴을 검출하는 간단하면서도 정확한 알고리즘을 제안한다. 후판의 직선 검출은 후판 영상으로부터 후판에 관련된 정보를 분석하거나 인식할 때 기본적으로 사용되는 핵심적인 알고리즘이다. 제안하는 알고리즘에서는 마스크를 이용하여 전체 영상을 탐색하면서 에지 영상을 분석한다. 먼저 마스크에 위치한 에지 패턴의 픽셀들에 대한 공분산 행렬을 계산하고 공분산 행렬의 고유값과 에지 패턴의 통계적 기하학적인 특성 사이의 관계를 분석하여 직선 에지를 검출한다. 직선 패턴이 중복된 에지 영상에 대해서는 모든 직선을 정확하게 검출하기 위하여 먼저 각 직선 패턴을 전체 영상에서 분리한 후 고유값을 계산한다. 또한 에지를 구성하는 픽셀의 수와 에지의 방향 정보를 이용하여 불필요한 직선 에지들을 제거함으로써 후판의 직선 에지를 정확하게 검출하도록 한다. 다양한 후판 영상에 대해서 실험을 수행한 결과는 제안하는 알고리즘이 고유값을 이용한 기존 알고리즘 보다 우수함을 보여준다.

자동차 차체 조립공장에서 주성분 분석의 응용 : 사례 연구 (Application of Principal Component Analysis in Automobile Body Assembly : Case Study)

  • 이명득;임익성;김은정
    • 산업경영시스템학회지
    • /
    • 제31권3호
    • /
    • pp.125-130
    • /
    • 2008
  • 이 논문은 자동차 차체 조립과정에서, 품질관리의 일환으로써, 비접촉 자동측정시스템을 이용하여 검사해야 하는 수많은 비독립적인 검사점을 다변량분산분석과 주성분분석을 이용하여 효율적으로 검사점을 감소시키는 방법을 설명하고 있다. 이 연구의 목적은 다변량분산분석, 주성분 분석의 개념과 이러한 기법들을 산업체 제조분야에서 응용하는 방법을 설명하여 독자의 사례 응용 이해를 돕는데 있으며, 또한 특히 주성분분석을 이용하여 수 많은 비독립적인 검사점을 어떻게 유효하게 줄여나가는지를 보여주고자 한다. 독자의 이해를 돕기 위하여 위와 같은 절차를 순서대로 설명하였으며, 실제 자동차 조립공장에서 발생하는 사례를 수치 예를 들어 설명하였다.

동작 상상 EEG 분류를 위한 필터 뱅크 기반 정규화 공통 공간 패턴 (Filter-Bank Based Regularized Common Spatial Pattern for Classification of Motor Imagery EEG)

  • 박상훈;김하영;이다빛;이상국
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.587-594
    • /
    • 2017
  • 최근, 동작 상상(Motor Imagery) Electroencephalogram(EEG)를 기반으로 한 Brain-Computer Interface(BCI) 시스템은 의학, 공학 등 다양한 분야에서 많은 관심을 받고 있다. Common Spatial Pattern(CSP) 알고리즘은 동작 상상 EEG의 특징을 추출하기 위한 가장 유용한 방법이다. 그러나 CSP 알고리즘은 공분산 행렬에 의존하기 때문에 Small-Sample Setting(SSS) 상황에서 성능에 한계가 있다. 또한 사용하는 주파수 대역에 따라 큰 성능 차이를 보인다. 이러한 문제를 동시에 해결하기 위해, 4-40Hz 대역 EEG 신호를 9개의 필터 뱅크를 이용하여 분할하고 각 밴드에 Regularized CSP(R-CSP)를 적용한다. 이후 Mutual Information-Based Individual Feature(MIBIF) 알고리즘은 R-CSP의 차별적인 특징을 선택하기 위해 사용된다. 본 연구에서는 대뇌 피질의 운동영역 부근 18개 채널을 사용하여 BCI CompetitionIII DatasetIVa의 피험자 다섯 명(aa, al, av, aw 및 ay)에 대해 각각 87.5%, 100%, 63.78%, 82.14% 및 86.11%의 정확도를 도출하였다. 제안된 방법은 CSP, R-CSP 및 FBCSP 방법보다 16.21%, 10.77% 및 3.32%의 평균 분류 정확도 향상이 있었다. 특히, 본 논문에서 제안한 방법은 SSS 상황에서 우수한 성능을 보였다.

한국과 중국의 현물시장과 주가지수선물시장간의 선-후행관계에 관한 연구 (The Intraday Lead-Lag Relationships between the Stock Index and the Stock Index Futures Market in Korea and China)

  • 서상구
    • 경영과정보연구
    • /
    • 제32권4호
    • /
    • pp.189-207
    • /
    • 2013
  • 고빈도 자료를 이용하여 한국과 중국에서 주가지수선물시장이 개설된 이후 현물 시장과의 동적관련성에 어떠한 특징적 차이점이 있는지에 대해 분석하였다. KOSPI 200의 경우 시차변수를 이용한 다중회귀분석에서 주가지수선물가격이 현물가격을 약 15분 정도 선행하는 것으로 나타나 주가지수선물시장이 현물시장에 대해 가격발견기능을 수행하는 것으로 나타났다. EGARCH 모형을 이용한 수익률 변동성의 선-후행관계 분석의 경우 강하지는 않지만 주가지수선물가격의 변동성이 현물가격의 변동성에 선행하는 것으로 나타났다. 한국의 경우 주가지수선물시장이 개설된 초기단계에서부터 다른 선진국의 경우와 비슷하게 선물시장과 현물시장 간에는 가격 및 가격변동성의 동적관련성이 존재하는 것으로 나타났다. CSI 300의 경우 한국과는 다른 특징적 차이를 보여주고 있다. 우선 현물시장의 가격이 주가지수선물시장의 가격에 선행하는 것으로 나타났다. 그 이유는 국내의 개인투자자와 외국인 투자자들이 주가지수선물거래에 참여하는 것이 엄격히 제한됨으로써 선물시장으로 유입되는 정보가 상대적으로 늦게 가격에 반영되어 선물시장의 가격발견기능을 약화시킨 결과로 판단된다. 변동성의 경우 현물시장과 주가지수선물시장 간에는 양방향의 상호의존성이 나타나고 있어 어느 한 시장의 일방적인 선행효과는 발생하지 않는 것으로 나타났다. 정리하면, 중국의 주가지수선물시장은 투자자들의 시장참여에 대한 여러 가지 제약으로 인해 충분한 정보전달 기능을 수행하지 못하는 것으로 나타났다.

  • PDF