• 제목/요약/키워드: Box-Cox 변환

검색결과 24건 처리시간 0.018초

Box-Cox 대비변환을 이용한 구성비율자료의 주성분분석 (Principal Component Analysis of Compositional Data using Box-Cox Contrast Transformation)

  • 최병진;김기영
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.137-148
    • /
    • 2001
  • 비율을 나타내는 요소들로 이루어진 구성비율자료는 각 행들의 합이 1이 되는 제약을 가지고 있어 통계적으로 다루기가 쉽지 않다. 더구나 자료의 구조가 선형적인 형태를 보이지 않는 특성을 가지기 때문에 주성분분석과 같은 선형적인 다변량기법들을 구성비율자료에 적용을 할 때 잘못된 해석과 추론이 이루어질 가능성이 있다. 본 논문에서는 구성비율자료의 주성분분석에서 기존의 방법들이 가지는 문제점을 해결하기 위해 Box-Cox 대비변환(Box-Cox contrast transformation)을 이용한 새로운 형태의 분석방법을 제시한다. 그리고 실제자료의 분석과 모의실험을 통해서 Aitchison(1983)이 제시한 방법과 수행능력을 비교하고자 한다.

  • PDF

Box-Cox 변환에 의한 I-D-F 곡선의 평활화 (The Smoothing of Rainfall Intensity - Duration - frequency Relationships curve by the Box-Cox Transformation)

  • 이희창;성기원
    • 한국수자원학회논문집
    • /
    • 제36권2호
    • /
    • pp.153-159
    • /
    • 2003
  • I-D-F곡선을 유도할 때 강우자료의 보유연한이 충분하지 않을 경우 지속시간별 강우강도의 변화가 매끄럽게 연결되지 못하는 경우가 발생하기도 한다. 특히 곡선에서, 상대적인 장시간에 강우강도가 크게 되는 문제는 실무적으로 I-D-F 곡선을 이용하는데 큰 혼란을 야기 시킨다. 본 연구에서는 강우자료를 Box-Cox변환을 이용하여 지속시간과 강우강도의 상관관계를 통해 이러한 문제를 해결하는 방법을 제시한다. 산청과 영천의 강우자료에 대한 분석결과 Box-Cox 변환의 실효성을 확인할 수 있었다.

공간통계모형에서 Box-Cox 변환에 대한 영향력 분석연구

  • 이진희;신기일
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.153-158
    • /
    • 2002
  • 시계열 자료의 분석에서 분산이 일정하지 않을 경우 이에 대한 해결방법으로 변환이 사용된다. 그러나 이러한 변환은 분산을 안정화시킴으로서 추정 및 검정에 타당성을 주는 반면 새로운 편의를 생성하거나(Granger & Newbold,1976) 모형을 복잡하게 만듦으로써 해석의 어려움도 수반한다. 신과 강(2001)은 평균이 크고 그에 비해 분산이 작을 경우 Box-Cox 멱 변환이 시계열 자료에 대하여 별 영향을 미치지 않음을 연구하였다. 본 논문은 이에 대한 확장으로 공간자료에서도 이 이론이 성립함을 밝혔다.

  • PDF

이동-멱변환에 관한 연구 (Shift-Power Transformation)

  • 조기종;정석오;신기일
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.283-290
    • /
    • 2006
  • 일반적으로 Box-Cox변환과 같은 류의 멱변환은 분산 안정화 혹은 분포의 대칭성 향상 등을 목적으로 사용된다. 그러나 원 자료의 평균의 크기가 크면서 분산이 상대 적으로 작은 경우, 즉 변동계수가 작은 경우에는 제대로 작동하지 않는 것이 알려져 있다. 본 논문에서는 이러한 문제점을 해결하기 위한 이동-멱변환을 제안하고 모의실험과 실제 자료 분석을 통하여 그 효과를 확인하였다.

오차항이 AR(1)을 따르는 Box-Cox 변환 회귀모형에서 모형 식별을 위한 검정 (Test of Model Specification in Box-Cox Transformed Regression Model with AR(1) Errors)

  • 전수영;윤석진;황선영;송석헌
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.327-340
    • /
    • 2008
  • 본 연구에서는 오차항이 AR(1)을 따르는 회귀모형에서 올바른 추론을 도출하고자 모형식별의 문제를 다루었다. 이를 위해 Box-Cox 변환된 회귀모형을 고려하여 (i) Box-Cox 변환모형과 AR(1) 오차에 대한 동시 검정, (ii) AR(1) 오차가 존재하는 모형에서의 Box-Cox 변환모형에 대한 검정 그리고 (iii) 모형이 Box-Cox 변환되어 있을 때 오차가 AR(1) 과정을 따르는지에 대한 LM 검정통계량을 유도하였다. 특히 LM 검정방법에서 여러개의 모수가 비선형관계를 형성하고있어 정보행렬의 추정은 계산상 매우 어렵다. 따라서 정보행렬의 원소에 대한 기대값을 구함에 있어 Taylor전개를 이용하여 정보행렬을 구하고 이에 기반을 둔 LM 검정통계량($LM_E$)를 제안하고 모의실험결과 $LM_E$가 기존의 헤시안행렬에 기반을 둔 LM 검정통계량($LM_H$)에 비하여 유의수준을 잘 유지하고 있는 것으로 나타났다.

독립성분분석과 Box-Cox 변환을 이용한 동사 개념 클러스터링 (Verb concept clustering using Independent Component Analysis and Box-Cox transformation)

  • ;이창범;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-170
    • /
    • 2006
  • 본 논문에서는 한국어 동사의 개념적 클러스터링 방법을 제안하다. 사용되는 기법은 독립성분분석, Box-Cox 변환, 상관분석 등이다. 독립성분분석은 잠재적인 성분을 통계적 독립(statistical independence)에 기반하여 추출하는 분석 방법이다. 그런데, 독립성분분석에서는 mixture(동사)의 분포는 정규 분포(가우시안 분포)에 따른다고 가정한다. 따라서 동사의 분포를 보다 정규 분포화 할 필요가 있다. 이에 본 논문에서는 Box-Cox 변환을 이용하여 동사의 분포를 정규 분포에 근사한다. 또한, 독립성분분석에서는 추출할 적당한 성분의 개수를 결정할 수가 없다. 이에 본 논문에서는 주성분분석의 결과로 획득되는 고유치의 누적 기여율을 이용하여 독립성분의 수를 결정한다. 그리고, 추출된 독립성분 벡터와 동사 벡터간의 상관계수에 이용하여 독립성분(개념)에 밀접하게 관련 있는 동사들을 하나의 클러스터로 구성한다. 한국어 동사를 대상으로 클러스터링한 결과, Box-Cox 변환을 적용한 경우가 더 좋은 성능을 보였다.

  • PDF

주식 거래 자료 분석을 위한 ACD 모형 성능 비교 (Performance Evaluation of the ACD Models for Analysing the Transaction Data of the KOSPI Stocks)

  • 김삼용;정다운
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.21-29
    • /
    • 2009
  • Engle과 Russell (1998)의 ACD 모형은 재무학에서 가격과 거래 시간의 밀접한 관계에 대한 관심을 불러 일으켰다. ACD 모형은 GARCH 모형과의 유사성을 바탕으로 Box-Cox 변환과 충격 함수 곡선(shocks impact curve)을 적용시켜 Log ACD, Power ACD, Box-Cox ACD 등과 같은 보다 유연한 모형으로 일반화될 수 있다. 본 연구에서는 이와 같이 일반화된 ACD 모형들을 국내 주식시장에서 거래되고 있는 주식의 price duration에 적용시켜 그 성능을 비교해보고자 한다.

국내 이동전화 통화수요의 요금탄력성 추정에 관한 연구 (A Study on Price Elasticities of mobile telephone Demand in Korea)

  • 정우수;조병선
    • 한국통신학회논문지
    • /
    • 제32권6B호
    • /
    • pp.390-401
    • /
    • 2007
  • 본 연구는 2000년 1월부터 2005년 12월까지의 월별 시계열 자료를 이용하여 통화수요의 요금탄력성을 추정하고 분석하는 것을 목적으로 한다. 본 연구에 사용된 데이터는 M발신통화량, M발신요금지수, L발신요금지수, 소득수준, 가입자수 등의 자료가 이용되었다. 본 연구에서는 요금탄력성의 추정을 위하여 크게 두가지 계량적 방법을 사용하였다. 첫번째는 설명변수에 종속변수의 시차를 고려한 동태적인 로그선형모형을 일반화된 적률추정법(GMM)을 이용하여 장 단기 탄력성을 추정하였다. 두번째는 Box-Cox변환모형을 응용하여 시간의 변화에 따른 요금탄력성의 변화추이를 추정하였다. 연구결과 L발신요금지수는 요금탄력성의 중요한 변수로서 포함하지 않은 경우 과대추정될 수 있음을 알 수 있었다. Box-Cox변환모형을 이용한 추정결과 요금탄력성은 시간의 경과에 따라 감소하는 추세를 나타내고 있었으며, 이는 이동통신서비스가 점점 더 필수재로 전환을 하고 있는 것을 나타내는 것으로 분석된다.

한국 멸치어업의 어획량 분석과 예측 ARIMA 모델 및 스펙트럼 해석 (Analysis and Prediction of Anchovy Fisheries in Korea ARIMA Model and Spectrum Analysis)

  • 박해훈;윤갑동
    • 한국수산과학회지
    • /
    • 제29권2호
    • /
    • pp.143-149
    • /
    • 1996
  • 우리나라 멸치어업에서의 1971~1992년 동안의 22년간 월별 어획량 자료를 시계열 분석하여 어획량을 분석, 예측하였다. 시계열 분석은 다른 생물학적, 해양학적, 사회 경제적인 요소가 없어도 단지 어획량 자료만으로 분석과 예측이 가능하다. 첫 20년간인 1971~1990년 사이의 월별 멸치 어획량 자료를 ARIMA 시계열 모형에 적용시켜 구한 결과는 다음과 같다. 로그 (대수) 변환시켰을 때의 ARIMA 모형: $$(1-0.381B)(1-0.027B^{12}+0.141B^{24})(1-B^1)(1-B^{12})Z_t=(1-0.968B)(1-0.727B^{12})e_t$$, Box-Cox 변환시켰을 때의 ARIMA 모형: $$(1-0.431B)(1-B^{12})Z_t=(1-0.882B^{12})e_t$$, 위의 두 모형중 Box-Cox 변환시킨 것이 로그 (대수) 변환시킨 것보다 예측오차가 적었으며, Box-Cox 변환식은 $Y'=(Y^{0.58}-1)/0.58$ 이었다. 위의 두 모형 중 후자의 모형을 이용하여 1991~1992년 사이의 월별 어획량을 예측하였다. 예측 어획량과 실제 어획량과의 월별 오차범위는 1.0~63.2% (1991년에 1.6~63.2%이고, 1992년에는 1.0~60.4%)였다. 예측 어획량이 각 연도별로 148,201M/T과 148,834M/T인데 비해, 실제 어획량은 170,293M/T, 168,234M/T이었다. 2년 동안의 총어획량에 대한 오차는 12.3%였다. 또한 스펙트럼 분석은 순환변동의 주기가 2.2개월, 6.1개월, 10.2개월, 12개월, 14.7개월에서 상대적으로 큰 성분이 있음을 나타내었다 이 순환변동 성분은 적절한 ARIMA 모형을 결정하는 데도 도움이 된다.

  • PDF

유역의 수문학적 상사성을 이용한 Nash 모형의 불확실성 평가 (Assessment of Uncertainty for Applying Nash's Model Using the Hydrologic Similarity of Basins)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제36권3호
    • /
    • pp.399-411
    • /
    • 2003
  • Nash의 관측평균순간단위도의 신뢰구간을 결정하는 기법을 개발하였다. 이 방법은 두 매개변수를 Box-Cox 변환과 유역의 상사성관계식을 이용하여 이변수정규분포의 확률변수화하고 이들의 선형 상관관계를 이용한 통계적 추정과정과 더불어 parametric bootstrap 방법을 이용한 단위도의 신뢰구간 산정 등으로 구성된다. 또한 이 방법은 미계측유역에 대한 단위도 추정에도 이용이 가능한 특징을 갖고 있다. 위천유역에 대하여 제안된 방법을 적용한 결과 제시된 방법론은 단위도의 불확실성을 평가하고 그리고 미계측 유역에 대한 매개변수 추정에 있어서 적절한 대안임을 확인할 수 있었다.