• Title/Summary/Keyword: Robust 회귀분석

Search Result 75, Processing Time 0.019 seconds

로버스트 추정법을 이용한 자기상관회귀모형에서의 특이치 검출 (Outlier Detection of Autoregressive Models Using Robust Regression Estimators)

  • 이동희;박유성;김기환
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.305-317
    • /
    • 2006
  • 시계열 자료에서의 특이치, 특히 이 가운데 가법적 특이치가 모형의 식별, 모수의 추정 및 예측과 관련된 분석 전과정을 왜곡하는 것은 잘 알려져 있다. 그러나 특이치가 다수 발생하는 경우, 특히 연속적으로 집단을 이루어 발생할 때 대부분 특이치 검출방법은 가면화효과와 수렁화효과때문에 이들을 정확히 판별하지 못한다. 본 논문에서는 p차 자기상관회귀모형에 대한 고붕괴점 회귀추정량을 이용한 양방향 로버스트 필터방법을 제안했다. 실제 사례와 모의실험을 통해 제안한 방법이 매우 정확하게 시계열 자료에 포함된 특이치들을 검출하고 있음을 확인할 수 있다.

부산지역 오피스텔 가격 결정요인 분석 (A Study on the Factors Determining Officetel Price in Busan)

  • 최열;김형준;여정훈
    • 대한토목학회논문집
    • /
    • 제35권3호
    • /
    • pp.725-735
    • /
    • 2015
  • 본 연구는 부산지역 오피스텔의 가격을 결정하는데 있어서 영향을 주는 요인들이 어떤 것들이 있는지에 대해 실증적 분석을 하여 오피스텔 시장을 구체적으로 이해하는데 목적이 있다. 시세가를 통해 오피스텔 가격 결정요인을 분석하는 것은 오피스텔 공급자로 하여금 적절한 규모와 입지선택에 도움을 줄 수 있고, 수요자들에게는 목적에 따른 오피스텔 선택에 도움이 되리라 판단하여 본 연구를 실시하였다. 부산지역 오피스텔의 실거래가를 종속변수로 하고 물리적 특성과 입지적 특성, 그리고 지역적 특성을 나타내는 요인들을 독립변수로 하여 OLS선형회귀분석(Ordinary Least Square)과 준로그모형분석(Semi-log model), 그리고 로버스트회귀분석(Robust regression)을 이용하여 오피스텔의 가격결정요인을 분석하였다.

결합예측에 관한 실증적 연구 (An empirical study on the combined forecasts)

  • 이우리
    • 응용통계연구
    • /
    • 제1권2호
    • /
    • pp.10-26
    • /
    • 1987
  • 미래의 한 관측값이 여러 방법으로 예측되었을 때, 이들 예측값들을 적절한 방법으로 결합 시키면 더 좋은 예측값을 얻을수 있게 된다. 본 논문에서는 결합예측을 위한 기존의 방법들을 간략히 소개하고, 결합 가중치의 추정을 위한 몇가지 대안적 절차를 제시한 후, 국내의 여러 자료들을 이용한 실증적 분석을 통하여 결합방법들에 대한 예측력을 비교 $\cdot$ 검토하게 된다. 실증적 분석 결과에 의하면, 제한 회귀가중치, 제한 로버스트 회귀가중치 및 혼합 회귀 가중치에 의한 결합방법들이 로버스트했다. 그러나 모든 경우에서 항상 가장 우수한 결합 방법은 발견될 수 없으므로 사전적으로 개별예측들의 특성을 분석하여, 대응되는 결합방법을 선책한다면 보다 유용한 예측결과를 얻을수 있게 된다.

이상치 탐지법을 이용한 강건 이분산 검정 (Robust tests for heteroscedasticity using outlier detection methods)

  • 서한손;윤민
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.399-408
    • /
    • 2016
  • 회귀분석에서 이분산이 발생할 경우 표준적 추정절차에 따른 결과는 유효하지 않게 되므로 이를 확인하는 것이 필요하다. 이분산 문제와 더불어 이상치가 함께 존재하면 이분산에 관한 진단은 왜곡될 수 있다. 이상치가 존재할 때 이분산을 진단하는 기존의 방법들은 강건통계량을 이용하거나 이상치를 제거하는 접근법을 사용한다. 이분산 문제에서 이상치를 탐지하기 위하여 여러 가지 접근법이 제시되었다. 본 연구에서는 이분산 진단과정에서 이상치를 배제하기 위하여 기존의 이분산 검정과정에 순차적 이상치 탐지법을 적용하는 절차를 제시한다. 제시된 방법은 모의실험 및 예제를 통해 기존의 검정방법과 검정력을 비교한다.

벌점 스플라인 회귀모형에서의 이상치 탐지방법 (An Outlier Detection Method in Penalized Spline Regression Models)

  • 서한손;송지은;윤민
    • 응용통계연구
    • /
    • 제26권4호
    • /
    • pp.687-696
    • /
    • 2013
  • 이상치가 존재하는 경우 모형 적합의 결과가 왜곡될 수 있기 때문에 이상치 탐색은 데이터분석에 있어서 매우 중요하다. 이상치 탐지 방법은 많은 학자들에 의해 연구되어 왔다. 본 논문에서는 Hadi와 Simonoff (1993)가 제안한 직접적 이상치 탐지 방법을 벌점 스플라인 회귀모형에 적용하여 이상치를 탐지하는 과정을 제안하며 모의실험과 실제 데이터에 적용을 통하여 스플라인 회귀모형, 강건 벌점 스플라인 회귀모형과 효율성을 비교한다.

문자인식을 위한 로버스트 역전파 알고리즘 (A Robust Backpropagation Algorithm and It's Application)

  • 오광식;김상민;이동로
    • Journal of the Korean Data and Information Science Society
    • /
    • 제8권2호
    • /
    • pp.163-171
    • /
    • 1997
  • 공학 분야에서 신경망에 대한 관심은 신호처리, 로보틱스, 컨트롤, 문자인식, 패턴인식 그리고 컴퓨터 그래픽 분야등에서 연구되고 있으며, 이들은 함수근사응용과 밀접한 관련이있다. 통계학 분야에서는 패턴인식의 판별분석, 주성분분석, 회귀분석 그리고 군집분석을 위한 신경망등에 대한 연구가 활발히 이루어지고 있다. 문자인식을 위한 다층 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있으나 이 알고리즘은 긴 훈련기간, 극소점 문제, 이상치(outlier)에 민감하다는 단점을 지니고 있다. 이상치에 민감한 일반적인 역전파 알고리즘의 단점을 극복하기 위해 이상치에 민감하지 않은 로버스트 알고리즘의 필요성이 대두되었다. 본 논문에서는 통계물리에서 자주 사용하는 방법을 이용하여 제안한 로버스트 역전파 알고리즘을 문자인식에 적용하여 일반적인 역전파 알고리즘의 문자인식 성능과 비교하였다.

  • PDF

한국노동패널자료를 활용한 국내 운송업 고용생산성 결정요인 분석 (An Analysis of the Determinants of Employment Productivity in Korean Transportation Industry Using Korea Labor and Income Panel Study)

  • 소애림;신승식
    • 한국항만경제학회지
    • /
    • 제35권1호
    • /
    • pp.57-76
    • /
    • 2019
  • 본 연구는 우리나라 산업 발전에 크게 기여한 운송산업의 주체인 운송업 종사자의 고용생산성 결정요인에 대해 다룬다. 본 연구는 노동패널자료를 활용해 운송업의 고용생산성 결정요인을 선정하고 패널 로지스틱 회귀 모형(Panel Logistic Regression), Panel OLS 모형, Panel Robust regression 모형을 활용하여 요인 간 영향력을 분석하였다. 분석 결과는 다음과 같다. 첫째, 정규직 여부의 경우 '학력'이 높을수록, '노조가입' 할수록, '직업훈련 경험'이 있을수록 긍정적인 효과가 나타난 것으로 분석되었다. 둘째, 고용안정성은 '학력'이 높고 '노조가입' 할수록 긍정적인 영향이 미치는 것으로 조사되었으며, '회사규모'가 크고 '기혼'일 경우 고용안정성이 큰 것으로 분석되었다. 셋째, 소득생산성의 경우 '나이', '학력', '회사규모'의 값이 클수록 긍정적인 영향을 미치고 '직업훈련 이외의 교육', '건강상태'의 값이 클수록 부정적인 영향을 미치는 것으로 분석되었다. 넷째, 직무만족도의 경우는 '여성'일수록, '노조가입' 할수록, '소득'이 높을수록, '고용안정성'이 높을수록 높았고, '보통사람대비 건강상태'가 좋을수록, '전반적 생활만족도'와 '경제적 수준'이 높을수록 직무만족도는 낮은 것으로 분석되었다. 본 연구에서 도출한 운송산업 고용생산성 결정요인의 분석과 향상 방안 모색을 통해 운송업 고용 생산성 향상에 기여할 수 있을 것으로 생각된다.

시간-종속적 공변량이 포함된 이분형 반복측정자료의 GEE를 이용한 분석에서 결측 체계에 따른 회귀계수 추정방법 비교 (Comparison of GEE Estimation Methods for Repeated Binary Data with Time-Varying Covariates on Different Missing Mechanisms)

  • 박보람;정인경
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.697-712
    • /
    • 2013
  • 다시점 자료 연구에서 일반화추정방정식은 가상관행렬을 잘못 가정하더라도 모수의 일치추정량을 도출하므로 많이 이용된다. 하지만, 결측 체계가 완전임의결측이 아닌 경우에는 편의추정량을 제공하고, 시간-종속적 공변량이 포함된 경우에는 가상관행렬에 따라 회귀계수 추정값이 다르게 도출될 수 있는 문제점이 있다. 결측 체계가 임의결측인 경우에 발생하는 문제를 해결하기 위해 가중 방법과 다중대체 방법을 사용하는 것이 제안되었다. 본 논문에서는 시간-종속적 공변량이 포함된 이분형 반복측정자료를 GEE를 이용하여 분석할 때 다양한 결측 체계에서 일반화추정방정식 방법, 가중 방법, 다중대체 방법의 회귀계수 추정에 대한 로버스트성과 정확성을 모의실험을 통하여 비교해 보았다. 세 가지 방법 모두에서 시간-종속적 공변량의 회귀계수가 시간-독립적 공변량의 회귀계수에 비해 가상관행렬에 따라 추정값의 차이가 크게 나타났다. 다른 두 방법에 비해 다중대체 방법이 가상관행렬의 형태에 대해 더 로버스트하고 편의도 작은 추정치를 도출하였다.

안정적 유전자 특징 선택을 위한 유전자 발현량 데이터의 부트스트랩 기반 Lasso 회귀 분석 (Lasso Regression of RNA-Seq Data based on Bootstrapping for Robust Feature Selection)

  • 조정희;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권9호
    • /
    • pp.557-563
    • /
    • 2017
  • 많은 수의 유전자 데이터를 이용해서 Lasso 회귀 분석을 할 때, 유전자 발현량 값들 사이의 높은 상관성으로 인하여 회귀 계수의 추정값이 회귀 분석의 반복 시행마다 달라질 수 있다. L1 정규화에 의해 축소되는 회귀 계수의 불안정성은 변수 선택을 어렵게 하는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 부트스트랩 단계를 반복 시행하여 높은 빈도로 선택된 유전자들을 이용한 회귀 모형들을 만들고, 각 모형들에서 안정적으로 선택되는 특징 유전자들을 찾고, 그 유전자들이 위양성 결과가 아님을 입증하였다. 또한, 회귀모형 별 예측지수의 정확도를 실제지수와의 상관관계를 이용해 측정하였는데, 선택된 특징 유전자들의 회귀계수 부호의 분포가 정확도와 관련성을 보임을 확인하였다.

로버스트 다층전방향 신경망을 이용한 패턴인식 (Pattern Recognition using Robust Feedforward Neural Networks)

  • 황창하;김상민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.345-355
    • /
    • 1998
  • 다층전방향 신경망을 학습시키기 위해 역전파 알고리즘이 널리 사용되고 있으나 이 알고리즘은 긴 훈련시간, 극소점 문제, 이상치에 민감하다는 단점을 가지고 있다. 한편 실제문제에서는 많은 경우에 자료에 과대오차와 이상치가 포함되게 된다. 따라서 과대 오차에 민감하지 않고, 이상치의 영향을 최소화시키는 로버스트 역전파 알고리즘의 필요성이 대두되었다. 본 논문에서는 기존의 두종류의 로버스트 역전파 알고리즘을 이론적으로 비교하고 비선형 회귀 함수추정과 문자인식과 같은 패턴인식 문제에 적용하여 실험결과를 분석한다. 그리고 향후 연구과제로 신경망 학습을 위해 베이지안 기법의 사용을 제안한다.

  • PDF