• 제목/요약/키워드: 다중회귀 모형

검색결과 705건 처리시간 0.028초

AR(1)모형에서 자기회귀계수의 다중검정을 위한 베이지안방법 (Bayesian Method for the Multiple Test of an Autoregressive Parameter in Stationary AR(L) Model)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.141-150
    • /
    • 2003
  • 본 논문은 베이즈인자(Bayes factor)를 이용하여 정상(stationary) AR(1)모형의 자기회귀계수에 대해 다중검정하는 방법을 제시한다. 모수들에 대한 사전분포로는 무정보 사전분포(noninformative prior distribution)를 가정한다. 이러한 경우에 통상적으로 사용되는 베이즈인자를 근사없이 정확히 계산하여 각 모형에 대한 사후확률(posterior probability)을 얻는다. 최종적으로 모의실험 자료 및 실제 자료에 적용하여 이론의 결과가 잘 부합되는지를 검토한다.

로버스트주성분회귀에서 최적의 주성분선정을 위한 기준 (A Criterion for the Selection of Principal Components in the Robust Principal Component Regression)

  • 김부용
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.761-770
    • /
    • 2011
  • 회귀모형에 연관성이 높은 설명변수들이 포함되면 다중공선성의 문제가 야기되며, 동시에 자료에 회귀 이상점들이 포함되면 최소자승추정량에 바탕을 둔 제반 통계적 추론은 심각한 결함을 갖게 된다. 이러한 현상들은 데이터마이닝 분야에서 많이 볼 수 있는데, 본 논문에서는 두 가지 문제를 동시에 해결하기 위한 방안으로서 로버스트주성분회귀를 제안하였다. 특히 최적의 주성분을 선정하기 위한 새로운 기준을 개발하였는데, 설명변수들의 표본공분산 대신에 MVE-추정량을 기반으로 하였으며, 고유치가 아니라 상태지수의 크기에 바탕을 둔 선정기준을 제안하였다. 그리고 주성분모형에서의 추정을 위하여 회귀이상점에 대해 로버스트한 LTS-추정을 도입하였다. 제안된 선정기준이 기존의 기준들보다 다중공선성과 이상점이 유발하는 문제들을 잘 해결할 수 있음을 모의실험을 통하여 확인하였다.

로지스틱모형에서의 주성분회귀 (Principal Components Regression in Logistic Model)

  • 김부용;강명욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.571-580
    • /
    • 2008
  • 로지스틱회귀분석은 고객관계관리나 신용위험관리 등의 분야에서 많이 사용되는 기법인데, 이러한 분야에서의 로지스틱회귀모형에는 연관성이 높은 설명변수들이 다수 포함되어 다중공선성의 문제를 유발하는 경우가 있다. 다중공선성이 존재하는 상황에서 최우추정량은 심각한 결함을 갖는다는 사실은 잘 알려졌다. 이 문제를 해결하기 위하여 로지스틱주성분회귀를 연구하되, 분석상의 주요 과정인 주성분 선정을 위한 방법을 새롭게 제안하였다. 추정량의 분산을 최소가 되게 하는 상태지수 값을 측정하고, 이 값에 영향을 미치는 주요 요인들을 컨조인트분석에 의해 파악하여 주성분 선정기준을 결정하는 모형을 구축하였다. 제안된 방법은 다중공선성 문제를 적절히 해결하면서도 모형의 적합성을 향상시킨다는 사실이 모의실험을 통하여 확인되었다.

다중 베이즈요인에 의한 회귀모형 오차항의 자기상관 검정 (On Testing the First-order Autocorrelation of the Error Term in a Regression Model via Multiple Bayes Factor)

  • 한성실;김혜중
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.605-619
    • /
    • 1999
  • 본 논문은 회귀분석에서 오차항의 1차 자기상관 존재 여부 및 그 값을 검정하는 방법을 베이지안 접근법으로 제안하였다. 이 방법은 모수공간의 다중분할로 인해 얻어진 여러 가설들에 대한 다중결정문제를 다중 베이즈요인에 관한 이론과 일반화 Savage-Dickey 밀도비를 이용한 사후확률 추정법을 합성하여 개발되었다. 이 방법은 기존의 검정법들에서 가능한 검정 뿐 아니라 이들이 해결할 수 없는 자기상관에 대한 다중결정문제에도 사용이 가능한데 그 효용성이 있다. 모의실험을 통하여 제안된 검정법의 유효성을 평가하였다.

  • PDF

선형회귀 모형에서 자기공분산 기반 추정 (Autocovariance based estimation in the linear regression model)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.839-847
    • /
    • 2011
  • 이 연구에서는 다중 선형회귀 모형에서 자기공분산에 근거한 회귀 계수의 추정량을 도출하였다. 자기공분산에 근거한 방법은 Park (2009)에 제시된 방법으로 직관적으로 매혹적이지는 않지만, 이것에 근거한 추정량이 회귀 계수의 불편추정량이 된다. 설명변수 벡터가 어떤 정칙조건을 만족한다면, 오차가 자기회귀이동평균 모형을 따르면 만족되는 약한 조건 하에서 이 추정량이 최소제곱 추정량과 점근적으로 동일한 분포를 가지며 또한 회귀 계수에 확률 상 수렴한다는 것을 보였다. 마지막으로 모의실험을 통해 이 성질들이 소표본에서도 성립하는 것을 보였다.

순서형 회귀분석을 활용한 악성 댓글 분류 (Hate Speech Classification Using Ordinal Regression)

  • 이세영;박새롬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.735-736
    • /
    • 2021
  • 인터넷에서 댓글 시스템은 자신의 의사표현을 위한 시스템으로 널리 사용되고 있다. 하지만 이를 악용하여 상대방에 대한 혐오를 드러내기도 한다. 악성댓글에 대한 적절한 대처를 위해 빠르고 정확한 탐지는 필수적이다. 본 연구에서는 악성 댓글 분류 문제를 해결하기 위해서 순서가 있는 분류 레이블의 성질을 활용한 순서형 회귀 (Ordinal regression) 기반의 분류 모델을 제안한다. 일반적인 분류 모형과는 달리 혐오 발언 정도에 따라 다중 레이블을 부여하여 학습을 진행하였다. 실험을 통해 Korean Hate Speech Dataset에 대해 LSTM기반의 모형의 출력층을 다르게 구성하여 순서형 회귀 기반의 모형들의 성능을 비교하였다. 결과적으로 예측 결과에 대한 조율이 가능한 순서형 회귀 모형이 일반적인 순서형 회귀 모형에 비해서 편향된 예측에 대해 추가적인 성능 향상을 보였다.

  • PDF

한강인도교 수위와 영향인자간의 다중회귀분석에 의한 홍수위 예측모형 (The Flood Forecasting Model for the In-do Brdg. by the Multi-regression Analysis between the Water-level and the Influence Parameters)

  • 윤강훈;신현민
    • 물과 미래
    • /
    • 제27권3호
    • /
    • pp.55-69
    • /
    • 1994
  • 홍수시 한강 인도교에 대한 단기간 예보의 정확도를 제고하기 위한 통계학적 홍수예보모형으로 '인도교수위와 영향인자간의 다중회귀분석에 의한 다변수 모형(MM 모형)'과 '수위구간별 다중회귀분석에 의한 다수준 다변수 모형(MMP 모형)' 그리고 '수위의 증감추세에 따른 2 수준 다변수 모형(2MP 모형)'을 제시하였다. 연구대상으로는 분석된 세가지 모형 중, 'MM 모형'은 4시간예측시 평균오차가 35cm 이내의 정도를 나타내며 'MMP 모형'은 모형개발시에 구분한 각 수위구간에 대해서는 매우 작은 평균오차를 나타내지만 실제 홍수사상에 적용시에는 뚜렷한 정도의 향상을 나타내지 못하는 것으로 보인다. 이것은 실제홍수시 수위가 각 구간내에만 머물지 않기 때문인 것으로 보인다. 한편 '2MP 모형'은 예측정도가 가장 높으나 드물게 발산현상이 나타나고 있어 안정도가 떨어지며, 'MMP 모형'은 '2MP 모형'과 비교하여 예측정도는 약간 떨어지나 안정된 예측결과를 보여준다.

  • PDF

기상 변수를 고려한 모델에 의한 단기 최대전력수요예측 (Short-term Peak Power Demand Forecasting using Model in Consideration of Weather Variable)

  • 고희석;이충식;최종규;지봉호
    • 융합신호처리학회논문지
    • /
    • 제2권3호
    • /
    • pp.73-78
    • /
    • 2001
  • 특수일 부하를 예측하기 위하여 BP 신경회로망 모형과 다중 회귀모형을 구성한다. 신경회로망 모형은 패턴 변환비를 이용하고, 다중회귀 모형은 평일 환산비를 이용하여 특수일 부하를 예측한다. 주간 피크 부하예측 모형에 패턴 변환비를 이용하여 짧고 긴 특수일 부하를 예측 한 결과 주간 평균 오차율이 1∼2[%]로 나와 본 기법의 적합성을 확인할 수 있다. 하지만, 패턴 변환비 방법으로는 하계의 특수일 부하 예측은 어려웠다. 따라서 기온-습도, 불쾌지수 등을 설명변수로 하는 다중 회귀 모형을 구성하고 평일 환산비를 이용하여 하계의 특수일 부하를 예측한다. 평일만의 예측 모형과 예측 결과를 비교해 보면 월 평균 오차율이 비슷하게 나와 이용한 방법의 적합성을 확인하였다. 그리고, 통계적 검정을 통해 구성한 예측 모형의 유효성을 입증할 수 있었다. 이로서 본 연구에서 제시한 특수일 부하를 예측하는 기법의 적합성을 확인함으로서 피크 부하 예측시 큰 난점 중의 하나가 해결되었다.

  • PDF

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

도로포장 반응모형에 대한 통계모형 개발 (A Development of Statistical Model for Pavement Response Model)

  • 이문섭;박희문;김부일;허태영
    • 한국산업정보학회논문지
    • /
    • 제17권5호
    • /
    • pp.89-96
    • /
    • 2012
  • 도로포장 반응모형의 구축을 위하여 새로운 방법론으로 부분최소제곱회귀모형의 활용성을 소개하고 실제 FWD 실험자료에 적용시켰다. 실증분석 결과 일반 다중회귀모형에서 발생된 다중공선성 문제를 부분최소제곱회귀모형을 통하여 해결방안을 제시하였으며, 변환된 자료가 아닌 원시자료를 이용하여 모형을 구축할 수 있다는 장점도 가지고 있다.