• Title/Summary/Keyword: 다변량통계기법

Search Result 132, Processing Time 0.03 seconds

LC/MS-based metabolomics approach for selection of chemical markers by domestic production region of Schisandra chinensis (오미자(Schisandra chinensis)의 국내 산지별 화학적마커 선정을 위한 LC/MS 기반의 대사체학 접근법)

  • In Seon Kim;Seon Min Oh;Ha Eun Song;Doo-Young Kim;Dahye Yoon;Dae Young Lee;Hyung Won Ryu
    • Journal of Applied Biological Chemistry
    • /
    • v.66
    • /
    • pp.467-476
    • /
    • 2023
  • Schisandra chinensis (S. chinensis) is a deciduous broad-leaved cave plant belonging to the Schisandraceae family and is widely distributed in East Asia including Korea, Japan, China, and Taiwan. It has been reported that the main components contained in S. chinensis include lignan compounds and triterpenoid compounds. To distinguish the characteristics of S. chinensis by production region of Korea, a discriminant was established by performing metabolite profiling and principal component analysis, a multivariate statistical analysis technique. As a result, 16 types of triterpenoids, 9 types of lignan, and 1 type each of flavonoid, phenylpropanoid, and fatty acid were identified. In addition, through multivariate statistical analysis, it was confirmed that the four groups in Danyang, Moongyeong, Geochang, and Pyeongchang were divided, by applying the s-plot model of orthogonal partial least squares discriminant analysis. Biomarkers were identified: lanostane, cycloartane, schiartane triterpenoid, and dibenzocyclo-octadiene lignan were identified as chemical markers, respectively.

Study on Vacuum Pump Monitoring Using MPCA Statistical Method (MPCA 기반의 통계기법을 이용한 진공펌프 상태진단에 관한 연구)

  • Sung D.;Kim J.;Jung W.;Lee S.;Cheung W.;Lim J.;Chung K.
    • Journal of the Korean Vacuum Society
    • /
    • v.15 no.4
    • /
    • pp.338-346
    • /
    • 2006
  • In semiconductor process, it is so hard to predict an exact failure point of the vacuum pump due to its harsh operation conditions and nonlinear properties, which may causes many problems, such as production of inferior goods or waste of unnecessary materials. Therefore it is very urgent and serious problem to develop diagnostic models which can monitor the operation conditions appropriately and recognize the failure point exactly, indicating when to replace the vacuum pump. In this study, many influencing factors are totally considered and eventually the monitoring model using multivariate statistical methods is suggested. The pivotal algorithms are Multiway Principal Component Analysis(MPCA), Dynamic Time Warping Algorithm(DTW Algorithm), etc.

Applications of Cluster Analysis in Biplots (행렬도에서 군집분석의 활용)

  • Choi, Yong-Seok;Kim, Hyoung-Young
    • Communications for Statistical Applications and Methods
    • /
    • v.15 no.1
    • /
    • pp.65-76
    • /
    • 2008
  • Biplots are the multivariate analogue of scatter plots. They approximate the multivariate distribution of a sample in a few dimensions, typically two, and they superimpose on this display representations of the variables on which the samples are measured(Gower and Hand, 1996, Chapter 1). And the relationships between the observations and variables can be easily seen. Thus, biplots are useful for giving a graphical description of the data. However, this method does not give some concise interpretations between variables and observations when the number of observations are large. Therefore, in this study, we will suggest to interpret the biplot analysis by applying the K-means clustering analysis. It shows that the relationships between the clusters and variables can be easily interpreted. So, this method is more useful for giving a graphical description of the data than using raw data.

Development and application of long-term reservoir operation rule for single operation (댐의 담독운영을 위한 장기 저수지운영률 도출 및 평가)

  • Kang, Shin-Uk;Lee, Sang-Ho;Kim, Hyeon-Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.233-233
    • /
    • 2011
  • 필요한 수자원을 추가확보하기 위한 댐 건설이 갈수록 어려워짐에 따라 이미 건설된 댐을 최대한 활용하는 과학적 저수지운영 방안이 필요하다. 또한 댐운영자가 쉽게 실무에 적용할 수 있는 방법이어야 한다. 본 연구의 목적은 댐관리자가 이해하기 쉽고 사용하기 쉬운 장기 저수지운영 방안을 개발하고자 하는 것이다. 수위구간별 저수지운영을 위한 운영률을 구성하고 이에 따른 순단위 저수지운영 모형을 구축하였다. 다변량 추계학적 모의발생기법을 사용하여 댐 유입량을 모의 발생하였다. 저수지운영의 수위구간을 결정하기 위한 최적화 방법으로 메타휴리스틱 방법으로 차원변화 탐색기법을 선정하였다. 안동댐의 단독운영을 위한 수위구간별 저수지운영률을 도출하여 저수지 모의운영을 수행하고 기존의 운영실적과 모의결과를 저수지운영 평가기준에 따라 비교하여 평가하였다. 안동댐의 단독운영 결과 모의된 저수위는 실적 저수위보다 전반적으로 높게 유지되었고, 모의 발전량이 실적 발전량보다 평균적으로 높음을 볼 수 있었다. 안동댐의 실적 발전량 평균값은 124.81 GWh이며, 모의결과의 발전량은 131.01 GWh이었다. 모의 발전량이 전반적으로 높은 이유는 방류량이 적은 상황에서 저수위를 높게 유지하여 발전효율을 높게 한 것이 주된 이유라고 사료된다. 안동댐의 실적과 모의 결과를 3 가지 저수지운영 평가기준으로 평가한 결과, 실패한 횟수는 실적이 554 회, 모의결과는 426 회이었다. 또한 2 순 연속하여 실패가 발생한 횟수는 각각 71회, 48 회이었고, 최대 연속 실패는 각각 52 순, 51 순이었다. 또한 총운영 기간에 대한 성공 횟수의 비율을 나타내는 신뢰도는 실적은 0.53, 모의된 결과는 0.64로 약 9 %의 차이를 보였다. 취약도는 실적이 $12.69\times10^6\;m^3$, 모의된 결과가 $5.14\times10^6\;m^3$$7.55\times10^6\;m^3$의 차이를 보였다. 회복도는 실적이 0.21, 모의 결과가 0.13으로 모의결과가 0.08 낮은 것으로 나타났다. 도출된 장기 저수지운영률을 안동댐의 단독운영에 적용한 결과 실적보다 본 연구에서 개발한 방법론에 의한 모의운영이 공급량, 발전량, 저수지 운영평가 통계량에서 나은 결과를 보였다.

  • PDF

Hierarchically penalized sparse principal component analysis (계층적 벌점함수를 이용한 주성분분석)

  • Kang, Jongkyeong;Park, Jaeshin;Bang, Sungwan
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.1
    • /
    • pp.135-145
    • /
    • 2017
  • Principal component analysis (PCA) describes the variation of multivariate data in terms of a set of uncorrelated variables. Since each principal component is a linear combination of all variables and the loadings are typically non-zero, it is difficult to interpret the derived principal components. Sparse principal component analysis (SPCA) is a specialized technique using the elastic net penalty function to produce sparse loadings in principal component analysis. When data are structured by groups of variables, it is desirable to select variables in a grouped manner. In this paper, we propose a new PCA method to improve variable selection performance when variables are grouped, which not only selects important groups but also removes unimportant variables within identified groups. To incorporate group information into model fitting, we consider a hierarchical lasso penalty instead of the elastic net penalty in SPCA. Real data analyses demonstrate the performance and usefulness of the proposed method.

한국의 기후학 반세기:회고와 전망

  • 이현영
    • Journal of the Korean Geographical Society
    • /
    • v.31 no.2
    • /
    • pp.128-137
    • /
    • 1996
  • 한국의 기후학 연구성과는 1958년 발표된 이후 약간의 기복은 있었으나 꾸준히 발 전하여 왔다. 연구성과를 하부 분야별로 보면 기후학 일반(43.5%)이 가장 많았고, 종관기후 학(34.7%), 기후변화(13.0%) 그리고 응용기후학(8.8%)으로 구성되어 있으나 근래에는 응용 기후학 분야에 대한 연구가 서서히 증가하고 있다. 1970년대 이전에는 주로 지상 기후요소 간의 기상자료를 사용하여 상관관계 출현빈도.시계열분석 등으로 전국 규모의 기후특성을 규명한 데 반하여 최근에는 시계열분석과 더불어 군집.주성분.인자분석 등 다변량 분석기 법 등의 통계기법이 많이 활용되고 있다. 초기에는 지상기상자료를 주로 연구에 사용하였는 데 점차 고층기상자료와 인공위성자료를 활용하면서 국지기후 연구와 더불어 기후예측 모델 의 구축단계까지 발달하였다. 그러나 한국기후학이 당면한 문제는 인적자원의 절대적인 빈 곤과 더불어 인접분야에 비하여 연구환경이 열악한 것이다. 즉, 대학에서는 비전공자에 의한 기후학 교육이 빈번하고, 국지기후 연구의 경우는 실측을 요하기도 하는데 자료의 생성 및 분석에 필요한 장비가 절대적으로 부족하다. 따라서 한국의 기후학의 발전을 도모하려면 기 후학자의 배출이 급선무이고, 기후학자는 물론, 대학 및 연구소간의 연구 및 자료 교류 등의 상호협조가 요청된다.

  • PDF

Imputation of Multiple Missing Values by Normal Mixture Model under Markov Random Field: Application to Imputation of Pixel Values of Color Image (마코프 랜덤 필드 하에서 정규혼합모형에 의한 다중 결측값 대체기법: 색조영상 결측 화소값 대체에 응용)

  • Kim, Seung-Gu
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.6
    • /
    • pp.925-936
    • /
    • 2009
  • There very many approaches to impute missing values in the iid. case. However, it is hardly found the imputation techniques in the Markov random field(MRF) case. In this paper, we show that the imputation under MRF is just to impute by fitting the normal mixture model(NMM) under several practical assumptions. Our multivariate normal mixture model based approaches under MRF is applied to impute the missing pixel values of 3-variate (R, G, B) color image, providing a technique to smooth the imputed values.

Principal Component Analysis of Compositional Data using Box-Cox Contrast Transformation (Box-Cox 대비변환을 이용한 구성비율자료의 주성분분석)

  • 최병진;김기영
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.137-148
    • /
    • 2001
  • Compositional data found in many practical applications consist of non-negative vectors of proportions with the constraint which the sum of the elements of each vector is unity. It is well-known that the statistical analysis of compositional data suffers from the unit-sum constraint. Moreover, the non-linear pattern frequently displayed by the data does not facilitate the application of the linear multivariate techniques such as principal component analysis. In this paper we develop new type of principal component analysis for compositional data using Box-Cox contrast transformation. Numerical illustrations are provided for comparative purpose.

  • PDF

Big Data Analysis Using Principal Component Analysis (주성분 분석을 이용한 빅데이터 분석)

  • Lee, Seung-Joo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.6
    • /
    • pp.592-599
    • /
    • 2015
  • In big data environment, we need new approach for big data analysis, because the characteristics of big data, such as volume, variety, and velocity, can analyze entire data for inferring population. But traditional methods of statistics were focused on small data called random sample extracted from population. So, the classical analyses based on statistics are not suitable to big data analysis. To solve this problem, we propose an approach to efficient big data analysis. In this paper, we consider a big data analysis using principal component analysis, which is popular method in multivariate statistics. To verify the performance of our research, we carry out diverse simulation studies.

인공 신경망 기법을 이용한 제지공정의 지절 원인 분석

  • 이진희;이학래
    • Proceedings of the Korea Technical Association of the Pulp and Paper Industry Conference
    • /
    • 2001.04a
    • /
    • pp.168-168
    • /
    • 2001
  • 제지공정의 지절 현상은 많은 공정 변수들이 복합적으로 작용하여 발생하는 가장 큰 공정 트러블 중의 하나이다. 지절은 생산량 감소 뿐만 아니라 발생 후 공정의 복구 와 정리, 생산재가동 및 공정의 재안정화를 위해 많은 시간과 비용, 그리고 노력이 투 입되어야 하므로 공정의 효율과 생산성을 크게 저하시키는 요인이다. 그러나 지절 현상 의 복잡성 때문에 이에 대해 쉽게 접근하거나 해결하지 못하고 있는 것이 현실이지만 그 필요성은 더욱 더 증대되고 있다. 본 연구에서는 최근 들어 각종 산업분야에서 복잡 한 공정상의 결점 발견 및 진단에 효과적이라고 인정받고 있는 예측 분석기법인 인공 신경망(artificial neural network) 시율레이션과 일반적인 통계기법 중의 하나인 주성분 분석을 이용하여 제지 공정의 지절 현상의 검토 가능성을 타진하였다. 인공신경망이란 인간두뇌에서 일어나는 자극-반응-학습과정을 모사하여 현실세계에 존재하는 다양한 현상들의 업력벡터와 출력상태 간의 비선형 mapping올 컴퓨터 시율 레이션을 통하여 분석하고자 하는 기법으로, 여러 가지 현상들을 학습을 통해서 인식하 는 신경망 내의 신경단위들이 병렬처리에 의해 많은 양의 자료에 대한 추론이나 판단 을 신속하고 정확하게 해주는 특징이 있으며 실시간 패턴인식이나 분류 응용분야에도 매우 매력적으로 이용되고 있는 방법이다. 이러한 인공 신경망 기법 중에서도 본 연구 에서는 퍼셉트론의 한계점을 극복하기 위하여 입력총과 출력층에 한 개 이상의 은닉층 ( (hidden layer)을 사용하여 다층 네트워으로 구성하고, 모든 입력패턴에 대하여 발생하 는 오차함수를 최소화하는 방향으로 연결강도를 조정하는 back propagation 학습 알고 리즘을 사용하였다. 지절의 원인으로 추정 가능한 공정인자들을 변수로 하여 최적의 인 공신경망을 구축하기 위해 학습률과 모멘트 상수의 변화 및 은닉층의 수와 출력층의 뉴런 수를 조절하는 동의 작업을 거쳐 네트워크의 정확도가 높은 인공신경망을 설계하 였다. 또한 이러한 인공신경망과의 비교분석을 위해 동일한 공정 데이터들올 이용하여 보편적으로 사용하는 통계기법 중의 하나인 주성분회귀분석을 실시하였다. 주성분 분석은 여러 개의 반응변수에 대하여 얻어진 다변량 자료의 다차원적인 변 수들을 축소, 요약하는 차원의 단순화와 더불어 서로 상관되어있는 반응변수들 상호간 의 복잡한 구조를 분석하는 기법이다. 본 발표에서는 공정 자료를 활용하여 인공신경망 과 주성분분석을 통해 공정 트러블의 발생에 영향 하는 인자들을 보다 현실적으로 추 정하고, 그 대책을 모색함으로써 이를 최소화할 수 있는 방안을 소개하고자 한다.

  • PDF