• 제목/요약/키워드: 분위수

검색결과 82건 처리시간 0.018초

복합 분위수 회귀에 대한 붓스트랩 방법의 응용 (Bootstrapping Composite Quantile Regression)

  • 서강민;방성완;전명식
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.341-350
    • /
    • 2012
  • 선형 회귀모형에서 오차항들이 서로 독립이고 동일한 분포를 따른다고 가정할 경우, (회귀계수의 강건한 추정을 위하여) 모든 분위수 함수의 회귀계수가 동일한 값을 갖는다는 사실에 근거한 복합 분위수 회귀(composite quantile regression) 방법을 고려할 수 있다. 본 논문에서는 복합 분위수 회귀에서 사용되는 분위수의 개수를 선택하기 위해 붓스트랩 방법의 가능성을 검토하였다. 또한, 분위수 회귀와 복합 분위수 회귀의 성능을 비교하기 위해 붓스트랩 방법을 이용하여 신뢰구간을 구축하고, 이들의 포함확률과 평균길이를 비교하였다. 이러한 모의실험을 통하여 복합 분위수 회귀의 우월성과 통계적 추론에 있어서 붓스트랩 방법의 유용성을 확인하였다.

비대칭 라플라스 분포를 이용한 분위수 회귀 (Quantile regression using asymmetric Laplace distribution)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1093-1101
    • /
    • 2009
  • 분위수 회귀모형은 확률변수들 사이에 확률적인 관계구조를 포함한 함수 모형을 좀 더 완벽하게 추정하도록 제공한다. 본 논문에서는 함수 추정에 로버스트하다고 알려져 있는 서포트벡터기계 기법과 이중벌칙커널기계를 이용하여 분위수 회귀모형을 추정하고자 한다. 이중벌칙커널기계는 고차원의 입력변수에 대한 분위수 회귀가 요구될 때 분위수 회귀모형을 잘 추정한다고 알려져 있다. 또한 본 논문에서는 광범위한 형태의 분위수 회귀모형 추정을 위해서 정규분포보다 비대칭 라플라스 분포를 이용한다. 본 논문에서 제안한 모형은 분위수 회귀모형 추정을 위해서 서포트벡터기계 기법에 이중벌칙커널기계를 이용하여 각각의 평균과 분산을 동시에 추정한다. 평균과 분산함수 추정을 위해 사용된 커널함수의 모수들은 최적의 값을 찾기 위해 일반화근사 교차타당성을 이용한다.

  • PDF

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

커널 제약식을 이용한 다중 비교차 분위수 함수의 순차적 추정법 (Stepwise Estimation for Multiple Non-Crossing Quantile Regression using Kernel Constraints)

  • 방성완;전명식;조형준
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.915-922
    • /
    • 2013
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정을 위해 커널 계수에 제약식을 부여하는 순차적 추정법을 제안하였으며, 모의실험을 통해 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

표본분위수와 표본분위의 관계 (Relationship between the Sample Quantiles and Sample Quantile Ranks)

  • 안성진
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.707-716
    • /
    • 2011
  • 분위수와 분위(또는 타점위치)는 학계에서나 산업계에서 널리 사용되고 있다. 그런데 통계 소프트웨어에 구현되어 있는 표본 분위수 계산방법들과 표본 분위 계산방법들은 각각 적어도 일곱 가지가 있다. 분위수들이나 분위들을 정의하는 방법들 간의 사소해 보이는 차이가 그 값을 토대로 이루어지는 결정의 큰 차이를 가져올 수 있다. 이 논문에서는 경험적 누적확률을 사용한 기본 타점위치 방법과 Blom (1958)의 제안을 토대로 파생된 여섯 가지 타점위치 방법의 특징과 차이점을 논의하였다. 또 통계소프트웨어에 구현되어 있는 일곱 가지 표본분위수 계산방법들의 특징과 차이점들을 논의한 후 이들을 망라하는 하나의 일반식을 제시하였다. 이 논문에서는 이 일반식으로부터 얻어지는 통찰을 토대로 표본분위수에 대응되는 표본분위를 구하는 방법을 제안하였고, 이 제안을 각 표본분위수 방법에 적용하여 대응되는 표본분위 방법을 도출하였다. 이런 대응관계는 표본분위수와 표본분위에 대한 종합적 이해와 적용에 도움을 줄 수 있을 것이다.

집단화된 자료의 분위수를 계산하는 수정된 방법

  • 김혁주;유지선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.147-154
    • /
    • 2005
  • 본 논문에서는 집단화된 자료의 분위수들을 계산하는 수정된 방법을 제시하였다. 제시된 방법은 각 계급구간 안의 자료들이 그 구간에 걸쳐 균등한 간격으로, 그리고 구간의 중간점에 관하여 대칭으로 분포하고 있다고 가정하고 분위수들을 계산하는 방법이다. 개개의 자료값들이 주어진 자료를 통하여, 제시된 방법과 기존의 방법을 비교하였다.

  • PDF

반응표면실험계획을 평가하기 위한 동적분위수그림 (Animated Quantile Plots for Evaluating Response Surface Designs)

  • 장대흥
    • 응용통계연구
    • /
    • 제23권2호
    • /
    • pp.285-293
    • /
    • 2010
  • 반응표면실험계획들을 평가하기 위한 방법으로서 전형적인 방법이 알파벳최적화이다. 그러나 이러한 알파벳최적화(D-, A-, G-, V-최적화 등)는 하나의 수치이므로 그 유용성에도 불구하고 반응표면실험계획들이 갖는 추정반응값 분산의 분포에 대한 정보에 한계를 갖는다. 이를 극복하고자 하는 대안으로서 그래픽 방법들이 있는데 우리는 그 중에 분위수그림을 애니메이션화한 동적분위수그림을 제안할 수 있고 이 동적분위수그림을 이용하여 반응표면실험계획들이 갖는 추정반응값분산의 분포를 서로 비교, 평가할 수 있다.

소지역 추정을 위한 M-분위수 커널회귀 (M-quantile kernel regression for small area estimation)

  • 심주용;황창하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.749-756
    • /
    • 2012
  • 소지역 추정을 위해 널리 사용되고 있는 방법 중 하나는 선형혼합효과모형이다. 그러나 종속변수와 독립변수 사이의 관계가 비선형일 때 이 모형은 소지역 관련 모수에 대해 편의된 추정값을 초래한다. 본 논문에서는 M-분위수 커널회귀를 사용하여 소지역의 평균을 추정하는 방법을 제안한다. 그리고 모의실험을 통하여 서포트벡터분위수회귀와 성능을 비교함으로써 제안된 방법의 우수성을 보인다.

벌점화 분위수 회귀나무모형에 대한 연구 (Penalized quantile regression tree)

  • 김재오;조형준;방성완
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1361-1371
    • /
    • 2016
  • 분위수 회귀모형은 설명변수가 반응변수의 조건부 분위수 함수에 어떻게 관계되는지 탐색함으로서 많은 유용한 정보를 제공한다. 그러나 설명변수와 반응변수가 비선형 관계를 갖는다면 선형형태를 가정하는 전통적인 분위수 회귀모형은 적합하지 않다. 또한 고차원 자료 또는 설명변수간 상관관계가 높은 자료에 대해서 변수선택의 방법이 필요하다. 이러한 이유로 본 연구에서는 벌점화 분위수 회귀나무모형을 제안하였다. 한편 제안한 방법의 분할규칙은 과도한 계산시간과 분할변수 선택편향 문제를 극복한 잔차 분석을 기반으로 하였다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.