• 제목/요약/키워드: spurious correlations

검색결과 2건 처리시간 0.017초

고차원 대용량 자료분석의 현재 동향 (Current trends in high dimensional massive data analysis)

  • 장원철;김광수;김정연
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.999-1005
    • /
    • 2016
  • 빅 데이터의 출현은 여러가지 과학적 난제에 대답 할 수 있는 기회를 제공하지만 흥미로운 도전을 또한 제공한다. 이러한 빅데이터의 주요 특징으로 "고차원"과 "대용량"을 들 수가 있다. 본 논문은 이러한 두 가지 특징에 동반되는 다음과 같은 도전문제에 대한 개요를 제시한다 : (1) 고차원 자료에서의 소음 축적과 위 상관 관계; (ii) 대용량 자료분석을 위한 계산 확장성. 또한 본 논문에서는 재난예측, 디지털 인문학과 세이버메트릭스 등 다양한 분야에서 빅 데이터의 다양한 응용사례를 제공한다.

한국의 미세먼지 시계열 분석: 장기종속 시계열 혹은 비정상 평균변화모형? (Time Series Modelling of Air Quality in Korea: Long Range Dependence or Changes in Mean?)

  • 백창룡
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.987-998
    • /
    • 2013
  • 이 논문에서는 한국의 대기질을 결정하는 중요한 수치인 미세먼지(PM10)에 대한 통계적 고찰을 한다. 2011년 매시 관찰된 자료 분석을 토대로 미세먼지가 매우 높은 시차에서도 강한 양의 상관관계를 가지는 장기 종속 시계열의 특징을 보임을 밝힌다. 또한 주변분포는 꼬리가 두터운 모형으로서 로그-정규분포보다는 일반화 파레토 분포가 훨씬 더 자료를 잘 적합함을 보인다. 하지만 이러한 높은 상관관계는 종종 단순한 평균변화 모형에 의한 그럴듯싸한 가짜 효과에 기인하기도 하여 통계모형을 세우는데 많은 혼동을 준다. 따라서 이 논문에서는 강한 종속성이 장기 종속 시계열에 의한 것인지 아니면 비정상 평균변화에 의한 것인지 근본적인 물리적 모형에 대한 논의를 통계적인 가설 검정을 통해 살펴본다. 그 결과 미세먼지의 강한 종속성은 구조변화에의한 착시 효과임을 밝힌다.