• 제목/요약/키워드: 다변량 통계기법

검색결과 132건 처리시간 0.031초

오미자(Schisandra chinensis)의 국내 산지별 화학적마커 선정을 위한 LC/MS 기반의 대사체학 접근법 (LC/MS-based metabolomics approach for selection of chemical markers by domestic production region of Schisandra chinensis)

  • 김인선;오선민;송하은;김두영;윤다혜;이대영;류형원
    • Journal of Applied Biological Chemistry
    • /
    • 제66권
    • /
    • pp.467-476
    • /
    • 2023
  • 오미자(Schisandra chinensis)는 오미자과에 속하는 낙엽활엽덩굴식물로 한국, 일본, 중국, 대만 등 동아시아에 널리 분포한다. 오미자에 함유된 주요 성분에는 리그난 화합물뿐만 아니라 트리테르페노이드 화합물도 포함되어 있는 것으로 보고되었다. 한국 산지별 오미자의 특성을 구별하기 위해 대사산물 프로파일링과 다변량 통계 분석 기법인 PCA을 수행하여 판별식을 설정하였고, 그 결과 triterpenoids 16종, lignan 9종, flavonoid, phenylpropanoid, fatty acid 각 1종을 동정하였다. 또한 다변량 통계분석을 통해 OPLS-DA의 s-plot 모델을 적용하여 단양, 문경, 거창, 평창의 4개 그룹을 구분하는 것을 확인하였고, lanostane, cycloartane, 그리고 schiartane triterpenoid, dibenzocyclooctadiene lignan 이 각각 화학적마커로 동정하였다.

행렬도에서 군집분석의 활용 (Applications of Cluster Analysis in Biplots)

  • 최용석;김형영
    • Communications for Statistical Applications and Methods
    • /
    • 제15권1호
    • /
    • pp.65-76
    • /
    • 2008
  • 행렬도 (biplot)는 이원표 자료행렬 (two-way data matrix)의 행과 열을 그래프에 동시에 나타내어 이들의 관계를 살피려는 다변량 그래프적 분석기법이다 (Gower와 Hand, 1996; 최용석, 2006, 1장). 그래프적 분석기법은 그 특성상 대용량 자료를 해석하는 데는 어려움이 따른다. 따라서, 자료를 효과적으로 줄일 수 있는 군집분석을 활용하여 원자료와 변수간의 행렬도가 아닌 각 군집과 변수간의 행렬도 분석을 수행함으로써, 기존의 행렬도에서 해석의 어려웠던 대용량 자료에 대한 해석이 가능하게 되며, 자료에 대한 정보를 쉽게 파악할 수 있는 장점을 가진다.

댐의 담독운영을 위한 장기 저수지운영률 도출 및 평가 (Development and application of long-term reservoir operation rule for single operation)

  • 강신욱;이상호;김현식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.233-233
    • /
    • 2011
  • 필요한 수자원을 추가확보하기 위한 댐 건설이 갈수록 어려워짐에 따라 이미 건설된 댐을 최대한 활용하는 과학적 저수지운영 방안이 필요하다. 또한 댐운영자가 쉽게 실무에 적용할 수 있는 방법이어야 한다. 본 연구의 목적은 댐관리자가 이해하기 쉽고 사용하기 쉬운 장기 저수지운영 방안을 개발하고자 하는 것이다. 수위구간별 저수지운영을 위한 운영률을 구성하고 이에 따른 순단위 저수지운영 모형을 구축하였다. 다변량 추계학적 모의발생기법을 사용하여 댐 유입량을 모의 발생하였다. 저수지운영의 수위구간을 결정하기 위한 최적화 방법으로 메타휴리스틱 방법으로 차원변화 탐색기법을 선정하였다. 안동댐의 단독운영을 위한 수위구간별 저수지운영률을 도출하여 저수지 모의운영을 수행하고 기존의 운영실적과 모의결과를 저수지운영 평가기준에 따라 비교하여 평가하였다. 안동댐의 단독운영 결과 모의된 저수위는 실적 저수위보다 전반적으로 높게 유지되었고, 모의 발전량이 실적 발전량보다 평균적으로 높음을 볼 수 있었다. 안동댐의 실적 발전량 평균값은 124.81 GWh이며, 모의결과의 발전량은 131.01 GWh이었다. 모의 발전량이 전반적으로 높은 이유는 방류량이 적은 상황에서 저수위를 높게 유지하여 발전효율을 높게 한 것이 주된 이유라고 사료된다. 안동댐의 실적과 모의 결과를 3 가지 저수지운영 평가기준으로 평가한 결과, 실패한 횟수는 실적이 554 회, 모의결과는 426 회이었다. 또한 2 순 연속하여 실패가 발생한 횟수는 각각 71회, 48 회이었고, 최대 연속 실패는 각각 52 순, 51 순이었다. 또한 총운영 기간에 대한 성공 횟수의 비율을 나타내는 신뢰도는 실적은 0.53, 모의된 결과는 0.64로 약 9 %의 차이를 보였다. 취약도는 실적이 $12.69\times10^6\;m^3$, 모의된 결과가 $5.14\times10^6\;m^3$$7.55\times10^6\;m^3$의 차이를 보였다. 회복도는 실적이 0.21, 모의 결과가 0.13으로 모의결과가 0.08 낮은 것으로 나타났다. 도출된 장기 저수지운영률을 안동댐의 단독운영에 적용한 결과 실적보다 본 연구에서 개발한 방법론에 의한 모의운영이 공급량, 발전량, 저수지 운영평가 통계량에서 나은 결과를 보였다.

  • PDF

계층적 벌점함수를 이용한 주성분분석 (Hierarchically penalized sparse principal component analysis)

  • 강종경;박재신;방성완
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.135-145
    • /
    • 2017
  • 주성분 분석(principal component analysis; PCA)은 서로 상관되어 있는 다변량 자료의 차원을 축소하는 대표적인 기법으로 많은 다변량 분석에서 활용되고 있다. 하지만 주성분은 모든 변수들의 선형결합으로 이루어지므로, 그 결과의 해석이 어렵다는 한계가 있다. sparse PCA(SPCA) 방법은 elastic net 형태의 벌점함수를 이용하여 보다 성긴(sparse) 적재를 가진 수정된 주성분을 만들어주지만, 변수들의 그룹구조를 이용하지 못한다는 한계가 있다. 이에 본 연구에서는 기존 SPCA를 개선하여, 자료가 그룹화되어 있는 경우에 유의한 그룹을 선택함과 동시에 그룹 내 불필요한 변수를 제거할 수 있는 새로운 주성분 분석 방법을 제시하고자 한다. 그룹과 그룹 내 변수 구조를 모형 적합에 이용하기 위하여, sparse 주성분 분석에서의 elastic net 벌점함수 대신에 계층적 벌점함수 형태를 고려하였다. 또한 실제 자료의 분석을 통해 제안 방법의 성능 및 유용성을 입증하였다.

FT-IR 스펙트럼 기반 다변량통계분석기법에 의한 두과작물의 대사체 수준 식별체계 확립 (Establishment of rapid discrimination system of leguminous plants at metabolic level using FT-IR spectroscopy with multivariate analysis)

  • 송승엽;하태정;장기창;김인중;김석원
    • Journal of Plant Biotechnology
    • /
    • 제39권3호
    • /
    • pp.121-126
    • /
    • 2012
  • 본 연구에서는 국내에서 재배중인 대표적인 두과작물(대두, 완두, 강낭콩, 팥, 녹두, 동부)종자로부터 전세포추출물의 FT-IR 스펙트럼 데이터로부터 다변량통계분석(PCA, PLS-DA, HCA)을 이용하여 신속하고 간편한 종 구분체계를 확립하였다. 대사체수준에서 팥, 녹두, 동부는 유연관계가 높음을 알 수 있었으며 대두, 완두, 강낭콩은 비록 두과작물이지만 차이가 매우 큼을 알 수 있었다. 아울러 본 연구에서 얻어진 대사체 정보의 다변량통계분석에 의한 유연관계분석은 흥미롭게도 두과작물의 계통분류학적 유연관계와 밀접한 상관관계를 나타내었다. 따라서 FT-IR 스펙트럼 데이터의 다변량통계분석은 방법의 간편성과 신속성을 고려할 때 두과작물의 계통이나 품종의 신속한 식별 수단으로 활용이 가능할 것으로 기대된다. 또한 두과작물의 기능성 성분 함량 정보가 성공적으로 연계된다면 본 연구에서 확립된 대사체 기반 신속식별체계는 기능성 성분의 함량이 높은 계통이나 품종의 조기 선발수단으로 활용이 가능할 것으로 기대된다.

마코프 랜덤 필드 하에서 정규혼합모형에 의한 다중 결측값 대체기법: 색조영상 결측 화소값 대체에 응용 (Imputation of Multiple Missing Values by Normal Mixture Model under Markov Random Field: Application to Imputation of Pixel Values of Color Image)

  • 김승구
    • Communications for Statistical Applications and Methods
    • /
    • 제16권6호
    • /
    • pp.925-936
    • /
    • 2009
  • 자료의 독립성 가청 하에서 EM 알고리즘에 의한 경측치 대체 (imputation of missing values) 기법은 잘 알려져 있다. 그러나 공간자료를 다루는 응용문제에서는 독립성 가정이 확장된 마코프 랜덤 필드 (Markov random field; MRF) 하에서 다루어져야 할 것이다. 이에 본 논문에서는 마코프 랜덤 필드 모형 궁에서 다변량 자료 중에 다중의 결측치의 대체를 위한 EM 알고리즘을 제공한다. 이 기법은 몇 가지 현실척 가정하에서 결국 혼합모형에 의한 대체 기법 임을 보인다. 그리고 제공된 기법으로 3-변량으로 구성된 색조영상(color image)의 결측화소값 대체문제에 적용하여 그 유용성과 문제점을 밝히며, 문제정의 개선방안에 대해 논의한다.

주성분 분석을 이용한 빅데이터 분석 (Big Data Analysis Using Principal Component Analysis)

  • 이승주
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.592-599
    • /
    • 2015
  • 빅 데이터 환경에서 빅데이터를 분석하기 위한 새로운 방법의 필요성이 대두되고 있다. 데이터의 크기, 다양성, 그리고 적재 속도 등의 빅데이터 특성으로 인해 모집단의 추론에서 전체 데이터의 분석이 가능해졌기 때문이다. 그러나 전통적인 통계분석 방법은 모집단으로부터 추출된 확률표본에 초점이 맞추어져 있다. 따라서 기존의 통계적 접근방법은 빅데이터 분석에 적합하지 않은 경우가 발생한다. 이와 같은 문제점을 해결하기 위하여 본 논문에서는 빅데이터분석을 위한 새로운 접근방법에 대하여 제안하였다. 특히 대표적인 다변량 통계분석 기법인 주성분 분석을 이용하여 효율적인 빅데이터분석을 위한 방법론을 연구하였다. 제안방법의 성능평가를 위하여 통계적 모의실험을 실시하였다.

반도체 공정 신호의 이상탐지 및 분류를 위한 자기구상지도 기반 기법에 관한 연구

  • 윤재준;박정술;백준걸
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2011년도 제40회 동계학술대회 초록집
    • /
    • pp.36-36
    • /
    • 2011
  • 반도체 공정 신호는 주기 신호와 비주기 신호로 구분된다. 특정 패턴을 가지는 주기 신호는 해당 파라미터(parameter)에 대해서 패턴 매칭을 수행하여 관리하는 연구가 진행되고 있다. 반면 비주기 신호 데이터의 경우에는 패턴 매칭 방법을 수행할 수 없다. 또한 반도체 공정에서 얻을 수 있는 두 개 타입의 데이터는 그 파라미터가 방대하기 때문에 현재 실제 공정에 적용되고 있는 방식인 각각 하나의 파라미터에 대해 관리도(control chart)를 구성해 관리하는 것은 많은 비용과 시간의 낭비를 초래한다. 따라서 두 타입 데이터의 여러 개의 파라미터를 동시에 관측할 수 있고 파라미터간의 내재된 상관관계를 고려할 수 있는 장점을 가진 분석 기법에 대한 연구가 필요하다. 주기 신호의 이상탐지를 위한 기존 연구는 신호를 구간으로 나누어 구간별로 SPC 차트적용 시키는 방법, 각 시점 마다 측정되는 값을 하나의 변수로 고려하여 Hotelling's T square, PCA, PLS 등과 같은 다변량 통계 분석을 적용 시키는 방법들이 제시되어 왔다. 이러한 방법들은 다양한 특성을 가지는 주기신호를 분석하고 이상을 탐지 하는데 많은 한계점을 가진다. 이에 본 논문은 다양한 형태를 가지는 신호의 특성을 반영하여 자기구상지도를 기반으로 신호의 분류와 공정의 이상을 탐지하는 기법을 제안한다. 제안하는 기법은 자기구상지도를 이용하여 복잡한(고차원, 시계열) 신호를 2차원 상의 노드로 맵핑시킴으로써 신호의 특질(feature)을 추출하고 새로 표현된 신호의 특질을 기반으로 Logistic regression을 적용시켜 이상을 탐지 한다. 다양한 이상 상황을 가진 반도체 공정 신호를 사용하여 제안한 이상탐지 성능을 평가하였다.

  • PDF

경영정보의 인과구조 구축을 위한 다변량통계기법 적용에 관한 연구 (A study on applying multivariate statistical method for making casual structure in management information)

  • 조성훈;김태성
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1996년도 추계학술대회발표논문집; 고려대학교, 서울; 26 Oct. 1996
    • /
    • pp.117-120
    • /
    • 1996
  • The objective of this study is to suggest modified Covariance Structure Analysis that combine with existing Multivariate Statistical Method which is used Casual Analysis Method in Management Information. For this purpose, we'll consider special feature and limitation about Correlation Analysis, Regression Analysis, Path Analysis and connect Covariance Structure Analysis with Statistical Factor Analysis so that theoretical casual model compare with variables structure in collecting data. A example is also presented to show the practical applicability of this approach.

  • PDF

다중 지구과학자료를 이용한 GIS 기반 공간통합과 통계량 분석 : 광물 부존 예상도 작성을 위한 사례 연구 (GIS-based Spatial Integration and Statistical Analysis using Multiple Geoscience Data Sets : A Case Study for Mineral Potential Mapping)

  • 이기원;박노욱;권병두;지광훈
    • 대한원격탐사학회지
    • /
    • 제15권2호
    • /
    • pp.91-105
    • /
    • 1999
  • 최근 다중 지질정보의 통합적 해석은 GIS의 중요한 응용 분야중 하나로 인식되고 있다. 공간통합을 위하여 지구통계학적 방법들이 개발되어 있지만, 통합결과와 입력 주제도들 사이의 관계에 대한 통계적, 정량적 분석방법론의 개발은 아직까지 체계적으로 정립되어 있지 못한 상황이다. 본 연구에서는 지질도, 지화학자료, 항공지구물리자료, 지형자료 및 원격탐사 영상등 다양한 지질정보등이 보고된 옥동지역을 대상으로 하여 광물 부존 예상도 작성 사례연구를 수행하여 기존에 이용되고 있는 여러 공간 통합 방법중 확실인자 (Certainty Factor: CF) 추정방법과 다변량 통계 분석방법중 하나인 주성분분석을 시험적인 통합방법으로 우선적으로 적용한 뒤, 입력 자료와 통합결과에 대한 정량적인 통계량 정보를 추출하고자 하였다. 입력 주제도와 통합 결과사이의 관계 규명에는 통계 분할표를 이용한 통계처리를 편의 분석에는 잭나이프 방법을 적용하였다. 통합정보에 대한 통계량 분석을 통하여, 통합 결과와 입력자료 사이의 정량적 관계를 추출할 수 있었으며, 부가적으로 입력자료의 상태수준에 대한 판단정보를 얻을 수 있었다. 이러한 결과는 GIS 관점에서 통합결과 해석에 중요한 결정보조자료로 활용될 수 있으며, 복잡한 다중정보를 다루는데 공간 통합문제에서도 입력정보 검증을 위한 일반적일 처리과정으로도 발전할 수 있을 것으로 생각된다.