• 제목/요약/키워드: 다변량 통계기법

검색결과 132건 처리시간 0.038초

고차원 데이터에서 공분산행렬의 추정에 대한 비교연구 (A Comparative Study of Covariance Matrix Estimators in High-Dimensional Data)

  • 이동혁;이재원
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.747-758
    • /
    • 2013
  • 공분산 행렬은 다변량 통계분석에서 중요한 역할을 하고 있으며 전통적인 다변량 분석의 경우 표본 공분산 행렬이 참공분산 행렬의 추정량으로 주로 사용되었다. 하지만 변수의 수가 표본의 크기보다 훨씬 큰 고차원 데이터와 같은 경우에는 표본 공분산 행렬은 비정칙행렬이 되어 기존의 다변량 기법을 사용하는 데 적절하지 않을 수가 있다. 최근 이러한 문제점을 해결하기 위해 축소추정, 경계추정, 수정 콜레스키 분해 추정 등의 새로운 공분산 행렬의 추정량들이 제안되었다. 본 논문에서는 추정량들의 성능에 영향을 미칠 수 있는 여러 현실적인 상황들을 가정하여 모의실험을 통해 참공분산 행렬의 추정량들의 성능을 비교하였다.

EXCEL을 이용한 다변량자료분석 시스템 개발 (A Development of Multivariate Analysis System by Using Excel)

  • 한상태;강현철;한정훈
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.165-172
    • /
    • 2004
  • 최근 다변량자료 분석과 관련하여 이를 시스템으로 구현하려는 연구가 다양한 각도로 이루어지고 있다. 이러한 연구들의 공통적인 특징은 일반 사용자들에게 고급 통계분석기법을 편리하게 활용할 수 있도록 GUI(Graphical User Interface) 환경의 시스템을 제공해 준 것이다. 이러한 연구들의 연장선상에서, 본 연구에서는 사회 각 분야에서 가장 널리 활용되고 있는 사무용 프로그램 인 Excel을 활용하여 시스템을 개발함으로써, 일반 사용자들도 대화식으로 다변량자료 분석을 쉽게 수행할 수 있도록 하였다.

다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법 (Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance)

  • 남승찬;최용석
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.567-578
    • /
    • 2017
  • 일반적으로 그룹화된 다변량자료는 다변량 분산분석(multivariate analysis of variance; MANOVA)을 사용하여 그룹 간 차이를 검정할 수 있다. 그러나 만약 다변량 분산분석의 기본적인 가정이 위배되면 이 방법은 적절하지 못하다. 이 경우 다양한 거리로부터 그룹화된 비유사성을 계산한 후 다차원척도법(multidimensional scaling; MDS), 거리분석(analysis of distance; AOD) 그리고 비모수적 기법인 순열검정(permutation test)을 적용하여 문제를 해결할 수 있다. 다차원척도법은 비유사성으로부터 개체들의 좌표를 계산해주며 거리분석은 이 좌표를 활용하여 그룹구조를 파악하는데 유용하다. 특히 비유사성의 측도로 유클리드 거리를 사용하면 거리분석은 다변량 분산분석과 수리적으로 매우 밀접한 연관관계를 맺는다. 따라서 본 연구에서는 그룹화된 비유사성에 다차원척도법과 거리분석을 적용하여 그룹 내와 그룹 간의 구조를 파악하고 순열검정을 위한 새로운 검정통계량을 제안하려 한다. 덧붙여 유클리드 거리를 활용한 비유사성을 통해 거리분석과 다변량 분산분석과의 수리적 연관성을 고찰하고자 한다.

다변량 통계분석을 이용한 저수지증발량 영향인자에 관한 연구 (A Study of Influence Factors for Reservoir Evaporation Using Multivariate Statistical Analysis)

  • 이경수;곽성현;서용재;류시완
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.237-240
    • /
    • 2017
  • 지구온난화로 인해 세계 곳곳에서 기온상승이 관측되고 있으며, 이는 전지구적 기후시스템의 변화를 보여주는 대표적인 예이다. 온도를 비롯한 강수량, 풍속, 증발량 등의 기상학적, 수문학적 인자들이 각각 서로에게 영향을 주고 받으며 복잡하게 변화할 것이고, 그 변화폭도 점점 커질 것이다. 증발에 영향을 미치는 인자들은 크게 세 가지로 나뉘는데, 태양복사에너지, 온도, 바람, 기압, 습도와 같은 기상학적인자, 증발표면의 특성인자 그리고 수질인자로 분류할 수 있다. 증발에 영향을 주는 인자들은 예전부터 알려져 있지만 이들 간의 복잡한 상호작용에 대해 정확히 이해하기는 쉽지 않다. 본 연구에서는 댐유역의 증발량에 영향을 미치는 기상인자 파악을 위해 2008부터 2016년까지 관측된 낙동강수계 내 안동댐과 남강댐의 기상자료(기온, 강수량, 풍속, 상대습도, 기압, 일사량, 일조시간, 전운량)를 이용한 변화를 분석하였으며, 다변량 통계기법인요인분석을 통해 증발량과 상관성이 높은 인자들을 분류하였다. 안동댐과 남강댐 공통적으로 증발량과 기온, 기압이 같은 요인으로 분류되고 높은 상관성을 보였으며, 강수량, 일조시간, 일사량, 전운량이 같은 요인으로 분류되었다. 국내의 증발량 측정지점에 대한 추가적인 분석과 영향인자를 이용한 다변량회귀식과 인공신경망 통해 증발량 미측정 지점의 증발량 산정이 가능할 것으로 판단된다.

  • PDF

주성분점수를 이용한 이변량 공간자료에 대한 감도분석 (Sensitivity Analysis for Bivariate Spatial Data Using Principal Component Score)

  • 최승배;강창완
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.415-427
    • /
    • 2001
  • 공간통계학에서는 다변량 공간자료에 대한 예측방법으로서 코크리깅 기법을 이용한다. 본 논문에서는 코크리깅을 위한 첫 번째 단계인 교차베리오그램의 추정에 대한 감도분석 대신에 일반통계학적 측면에서 주성분점수를 이용한 감도분석방법을 제안한다. 변수가 2개인 경우, 교차베리오그램에 대한 감조분석의 결과와 제안된 주성분점수를 이용한 감도분석의 결과를 비교해 본다. 모의실험을 통하여 제안한 방법의 타당을 검증하고, 실제 자료를 이용한 사례분석의 결과로써 재확인해 본다.

  • PDF

원격탐사자료와 다변량 통계모형을 활용한 통합가뭄지수 개발 (Development of integrated drought index(IDI) using remote sensing data and multivariate model)

  • 박서연;김종석;김태웅;이주헌
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.359-359
    • /
    • 2020
  • 현재 우리나라의 가뭄감시 정보는 기상학적/농업적/수문학적 가뭄이 별도의 지수로 개발되어 다양한 형태의 정보를 생산·제공되고 있다. 각각의 가뭄 지수들 기준 및 특성에 따라 분석되고 있기 때문에 가뭄전문가의 입장에서는 매우 정밀한 가뭄정보를 제공받는 장점이 있는 반면에, 일반 국민들이 가뭄 정보를 받아들이고 이해하는데 어려움이 있어 이를 한눈에 알아볼 수 있는 통합가뭄지도가 필요하며, 통합가뭄도를 제작하기 위해서는 통합가뭄지수가 개발되어야 한다. 본 연구에서는 원격탐사자료를 활용하여 농업적 가뭄지수인 Agricultural Dry Condition Index (ADCI)와 수문학적 가뭄지수인 Water Budget-based Drought Index (WBDI)를 개발하였으며, 기상학적 가뭄지수인 Standardized Precipitation Index (SPI)를 포함하여 기상-농업-수문학적 가뭄지수를 결합한 통합가뭄지수를 산정하였다. 다양한 가뭄지수를 활용하여 개발되었기 때문에 다변량 통계 모형 중 선형 모형인 Principal Component Analysis (PCA)기법과 비선형 모형인 Kernel Entropy PCA, Kernel PCA를 적용하였다. 또한 과거 가뭄사상을 활용하여 산정된 통합가뭄지수 검증을 위해 과거 가뭄사상에 대한 가뭄 발생시기, 심도, 쇠퇴패턴이 양상 평가 및 Intentionally Biased Bootstrap Resampling (IBBR)을 활용한 지수별 민감도 분석을 통해 통합가뭄지수 적용성 평가를 진행하였다.

  • PDF

하천유량의 모의발생을 위한 추계학적 모형의 적용에 관한 연구 (A Study on the Stochastic Modeling for Stream Flow Generation)

  • 이주헌
    • 한국방재학회 논문집
    • /
    • 제1권2호
    • /
    • pp.115-121
    • /
    • 2001
  • 실측자료가 충분하지 못한 단기간의 유출량 자료로부터 추계학적 모형에 의해 장기간의 자료를 모의발생시키는 목적은 수공구조물의 설계에 필요한 설계홍수량의 산정 및 수자원 시스템의 운영조작 방침을 결정하기 위한 풍부한 입력자료를 제공하는데 있다. 특히 본 연구에서는 단일지점이 아닌 다지점에 대한 지점간 서로의 연관성을 고려한 하천유량의 추계학적인 모의 발생기법인 다변량 자기회귀 모형을 적용하고자 한다. 따라서 본 연구에서는 낙동강유역의 2개 지점에 대하여 다변량 모형을 적용하여 모의 발생된 월유량과 실측치를 통계적으로 비교, 분석하였다. 모의발생된 월유량과 실측치를 평균, 분산, 왜곡도, 상관관계 등에 의해 비교, 분석한 결과 모의발생된 월유량과 실측치는 통계적으로 매우 유사하게 나타났다.

  • PDF

다변량통계기법을 이용한 지하저장시설 주변의 지하수질 변동에 관한 연구 (Use of Multivariate Statistical Approaches for Decoding Chemical Evolution of Groundwater near Underground Storage Caverns)

  • 이정훈
    • 한국지구과학회지
    • /
    • 제35권4호
    • /
    • pp.225-236
    • /
    • 2014
  • 다변량통계기법은 수리지구화학 자료의 분석 및 해석에 많이 이용되어 왔다. 본 연구에서 대응분석과 주성분분석을 동시에 사용하여 인위적인 활동에 의한 지하수의 특징을 살펴보았다. 본 연구의 목적은 NETPATH 프로그램 속의 WATEQ4F를 이용하여 지하수 화학성분의 분화를 계산하고 이를 다변량통계기법을 이용하여 지구화학적인 정보를 추출하는 것이다. 연구지역은 한반도의 남동쪽에 위치한 울산의 LPG 저장시설이다. 본 연구지역에서는 다른 저장시설에서 관찰되는 초염기성의 조성을 가지는 지하수가 관찰되었다. 이러한 인위적인 영향에 의한 높은 pH를 가지는 지하수로 인해 Al의 분화특징과 탄산염의 침전을 유발할 수 있다. 본 연구에서는 연구지역에 지하수에 영향을 주는 두 인위적인 요소(세정작용와 시멘트영향)에 의해서 수리지구화학적인 특징과 상이 어떻게 변하는 가에 초점을 두었다. 이전 연구결과와 두 통계분석을 통해 제시된 결과를 비교하여 지구화학적인 정보를 이용한 주성분분석과 대응분석인 수리지구화학 연구에서 기초연구로 활용될 수 있음을 알 수 있다.

다변량 통계분석기법을 이용한 전국 표준유역 대상 수문학적 군집화 연구 (A Study on Hydrologic Clustering for Standard Watersheds of Korea Water Resources Unit Map Using Multivariate Statistical Analysis)

  • 안소라;김상호;김성준
    • 한국지리정보학회지
    • /
    • 제17권1호
    • /
    • pp.91-106
    • /
    • 2014
  • 본 연구는 다변량 통계분석기법을 이용하여 한국 수자원단위지도의 전국 795개 표준유역에 대하여 수문학적 군집화를 수행하였다. 국내 유역의 종합적인 특성인자 산정을 위해 지형, 하천, 기상, 토양, 토지이용 및 수문학 관련 유역특성인자 30개를 선정하였다. 다변량 통계기법인 요인분석을 통해 유역특성인자들 간의 상관관계를 분석하여 16개의 대표 유역특성인자들을 추출하였으며, 유역의 특징을 결정짓는 인자는 토양특성, 유역위치, 유역크기, 기상 및 수문특성에 관련된 인자들로 나타났다. 군집분석을 위해 전국의 기상, 강우, 수위관측소의 자료를 수집하고 양질의 자료보유현황을 검토하여 73개의 계측 유역을 구분하였다. 이 73개의 계측유역을 기준으로 하여, 나머지 미계측 유역 간에 16개의 대표 유역특성인자들과의 유클리드 거리를 계산함으로써 수문학적 군집화를 수행하였다. 그 결과 각 권역별로 동일권역 내 표준유역 사이의 유사성은 한강이 87%, 낙동강이 69%, 금강이 41%, 섬진강이 52%, 영산강이 27%로 분석되었다.