• 제목/요약/키워드: 커널분위수회귀

검색결과 6건 처리시간 0.015초

비대칭 라플라스 분포를 이용한 분위수 회귀 (Quantile regression using asymmetric Laplace distribution)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1093-1101
    • /
    • 2009
  • 분위수 회귀모형은 확률변수들 사이에 확률적인 관계구조를 포함한 함수 모형을 좀 더 완벽하게 추정하도록 제공한다. 본 논문에서는 함수 추정에 로버스트하다고 알려져 있는 서포트벡터기계 기법과 이중벌칙커널기계를 이용하여 분위수 회귀모형을 추정하고자 한다. 이중벌칙커널기계는 고차원의 입력변수에 대한 분위수 회귀가 요구될 때 분위수 회귀모형을 잘 추정한다고 알려져 있다. 또한 본 논문에서는 광범위한 형태의 분위수 회귀모형 추정을 위해서 정규분포보다 비대칭 라플라스 분포를 이용한다. 본 논문에서 제안한 모형은 분위수 회귀모형 추정을 위해서 서포트벡터기계 기법에 이중벌칙커널기계를 이용하여 각각의 평균과 분산을 동시에 추정한다. 평균과 분산함수 추정을 위해 사용된 커널함수의 모수들은 최적의 값을 찾기 위해 일반화근사 교차타당성을 이용한다.

  • PDF

소지역 추정을 위한 M-분위수 커널회귀 (M-quantile kernel regression for small area estimation)

  • 심주용;황창하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.749-756
    • /
    • 2012
  • 소지역 추정을 위해 널리 사용되고 있는 방법 중 하나는 선형혼합효과모형이다. 그러나 종속변수와 독립변수 사이의 관계가 비선형일 때 이 모형은 소지역 관련 모수에 대해 편의된 추정값을 초래한다. 본 논문에서는 M-분위수 커널회귀를 사용하여 소지역의 평균을 추정하는 방법을 제안한다. 그리고 모의실험을 통하여 서포트벡터분위수회귀와 성능을 비교함으로써 제안된 방법의 우수성을 보인다.

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.

커널 제약식을 이용한 다중 비교차 분위수 함수의 순차적 추정법 (Stepwise Estimation for Multiple Non-Crossing Quantile Regression using Kernel Constraints)

  • 방성완;전명식;조형준
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.915-922
    • /
    • 2013
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정을 위해 커널 계수에 제약식을 부여하는 순차적 추정법을 제안하였으며, 모의실험을 통해 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

국소 선형 복합 분위수 회귀에서의 평활계수 선택 (Selection of bandwidth for local linear composite quantile regression smoothing)

  • 전명식;강종경;방성완
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.733-745
    • /
    • 2017
  • 국소복합분위수 회귀모형을 활용한 비모수적 함수 추정방법이 높은 효율성과 더불어 활발히 연구되고 있다. 이러한 추정과정에 커널을 사용한 자료 평활방법이 대표적으로 사용되고 있으며, 그 성능은 커널보다는 평활계수의 선택 크게 의존한다. 한편, 회귀함수 추정방법의 성능을 평가하는 기준으로는 통상적으로 $L_2$-노름이 사용되어 평균제곱오차 또는 평균적분제곱오차를 최소화하는 평활계수의 선택에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 국소선형 복합 분위수 회귀방법을 활용한 비모수 회귀모형 추정량의 성능을 결정하는 평활계수 선택의 최적성에 관해 연구하였다. 특히, 여러 장점을 가졌으나 수리적 어려움으로 연구가 미흡한 평균절대오차 및 평균적분절대오차를 최적의 기준으로 삼아 최적의 평활계수를 구하고 그 유일성에 관해 연구하였다. 나아가 기존의 평가기준인 평균제곱오차 및 평균적분제곱오차를 사용한 선택과의 관계를 파악하고 그 성능을 비교하였다. 이러한 과정에서 다양한 상황에서의 모의실험을 통해 제안한 방법의 특성을 규명하였다.

빅데이터를 이용한 실시간 민간소비 예측 (Real-time private consumption prediction using big data)

  • 신승준;서범석
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.13-38
    • /
    • 2024
  • 최근 코로나19 등으로 경제 불확실성이 확대됨에 따라 민간 경제주체의 경제상황을 직접적으로 반영하는 민간소비 동향을 신속히 파악할 필요성이 높아지고 있다. 이에 본 연구는 기존 거시경제지표 뿐만 아니라 빅데이터를 종합적으로 활용하여 민간소비를 실시간으로 추정(nowcasting)하는 방법을 제안하였다. 특히 초고차원 빅데이터의 적합을 위해 활용 가능한 다양한 기계학습 방법론을 비교분석하여 민간소비 추정의 정확도를 향상시키고자 하였다. 실증 분석 결과, 빅데이터를 비롯한 가용 공변량의 수가 많은 경우에는 변수를 미리 선별하여 모형적합에 활용하는 것이 민간소비 예측 성능을 향상시킬 수 있음을 확인하였다. 또한 코로나19 이후 빅데이터의 반영이 민간소비 예측 성능을 더욱 크게 향상시킴에 따라 경제 불확실성이 높은 상황일수록 새로운 정보를 적시에 반영할 수 있는 고빈도 빅데이터의 활용가치가 높은 것으로 판단된다.