• 제목/요약/키워드: 회귀분석법

검색결과 1,434건 처리시간 0.025초

근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교 (Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data)

  • 백승현
    • 대한안전경영과학회지
    • /
    • 제15권4호
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

극단치 분포의 모수 추정방법 비교 연구(회귀 분석법을 기준으로) (Comparison Study of Parameter Estimation Methods for Some Extreme Value Distributions (Focused on the Regression Method))

  • 우지용;김명석
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.463-477
    • /
    • 2009
  • 극단치 분포의 모수 추정방법으로 최우추정법, 확률가중적률법, 회귀분석법은 기존 연구에서 활발하게 적용되어져 왔다. 그러나 이들 세 가지 추정방법 가운데, 회귀분석법의 우수성은 엄격하게 평가되어진 적이 없다. 본 논문에서는 몬테칼로 시뮬레이션을 통하여 Generalized Extreme Value(GEV) 분포와 Generalized Pareto(GP) 분포의 모수 추정에 회귀분석법 및 다른 추정방법을 적용하여 비교 연구한다. 시뮬레이션 결과, 표본의 크기가 작은 경우 회귀분석 법은 GEV 분포의 위치모수 추정시 편의 측면과 효율성 측면에서 다른 방법보다 우수한 경향을 나타내었다. GP 분포의 규모모수 추정시에는 표본의 크기 가 작을 경우 회귀분석법이 다른 방법보다 작은 편의를 나타내었다. 회귀분석법은 표본의 크기 가 작거나 적당히 큰 경우에도 GEV 분포나 GP 분포의 형태모수 추정시에 형태모수의 값이 -0.4일 경우, 다른 방법보다 우수한 경향을 나타내었다.

KRUGLYAK과 LANDER의 유전연관성 비모수 방법과 반복 자료를 고려한 가중 회귀분석법의 비교 (Comparisons of Kruglyak and Lander's Nonparametric Linkage Test and Weighted Regression Incorporating Replications)

  • 최은경;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 형제 쌍(sibpair)의 연속형 형질(continuous traits) 자료를 이용한 유전연관성 검정 법(linkage test)으로서 Haseman과 Elston (1972)의 최소제곱(ordinary least square, OLS) 회귀분석법이 주로 사용된다. 비모수적 방법으로서 제시된 Kruglyak과 Lander (1995)의 검정통계량은 Haseman과 Elston (1972)의 방법에 대응되는 방법처럼 보이지만 실제로는 매우 다르다. 본 논문에서는 Kruglyak와 Lander (1995)의 검정통계량과 Haseman과 Elston (1972)의 검정통계량의 관계를 설명하고 모의실험으로 두 검정통계량의 검정력을 비교한다. 유전연관성에 사용되는 형제 자료의 특징은 한정된 설명변수의 값에 매우 많은 자료가 반복(replicated)되었다는 점이며, 이러한 반복 자료에 더욱 적절한 가중 회귀분석법을 제안한다. 가중 회귀분석법의 효율성을 정규분포 또는 정규분포가 아닌 연속형 형질 모의실험 자료로 알아본 결과 형제 쌍 자료의 유전연관성 검정에서 가중 회귀분석법이 다른 검정법들보다도 검정력이 높음을 확인하였다.

회귀문제를 위한 비선형 특징 추출 방법 (Nonlinear feature extraction for regression problems)

  • 김성민;곽노준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.86-88
    • /
    • 2010
  • 본 논문에서는 회귀문제를 위한 비선형 특징 추출방법을 제안하고 분류문제에 적용한다. 이 방법은 이미 제안된 선형판별 분석법을 회귀문제에 적용한 회귀선형판별분석법(Linear Discriminant Analysis for regression:LDAr)을 비선형 문제에 대해 확장한 것이다. 본 논문에서는 이를 위해 커널함수를 이용하여 비선형 문제로 확장하였다. 기본적인 아이디어는 입력 특징 공간을 커널 함수를 이용하여 새로운 고차원의 특징 공간으로 확장을 한 후, 샘플 간의 거리가 큰 것과 작은 것의 비율을 최대화하는 것이다. 일반적으로 얼굴 인식과 같은 응용 분야에서 얼굴의 크기, 회전과 같은 것들은 회귀문제에 있어서 비선형적이며 복잡한 문제로 인식되고 있다. 본 논문에서는 회귀 문제에 대한 간단한 실험을 수행하였으며 회귀선형판별분석법(LDAr)을 이용한 결과보다 향상된 결과를 얻을 수 있었다.

  • PDF

복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교: 소규모사업체조사 데이터 분석을 중심으로 (Comparison of Regression Model Approaches fined to Complex Survey Data)

  • 이기재
    • 한국조사연구학회지:조사연구
    • /
    • 제2권1호
    • /
    • pp.73-86
    • /
    • 2001
  • 본 논문은 복합표본조사 분석에서 회귀모형 접근법으로 사용되는 모형 기반 접근법, 설계 기반 접근법과 일반화 추정 방정식 접근법을 설명하고, 이들을 실증적으로 비교한 것이다. 또한 설계 기반 접근법과 일반화 추정 방정식 접근법에 대해서 설계효과와 가중치 효과 분석을 통해서 표본 설계가 모수 추정에 미치는 영향을 살펴보았다.

  • PDF

유전자 알고리즘을 이용한 비모수 회귀분석

  • 김병도;노상규
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.584-594
    • /
    • 1998
  • 선형회귀분석은 가장 널리 사용되는 데이터 분석기법이지만 독립변수와 종속변수간의 관계가 선형이라고 가정하기 때문에 문제점을 가지고 있다. 비모수 회귀분석(Nonparametric Regression)은 선형회귀분석의 문제점을 극복할 수 있는 방법으로 변수간의 관계의 형태를 미리 가정하지 않고 데이터에 의해 결정하는 방법이다. 본 연구에서는 유전자 알고리즘을 비모수 회귀분석법 중의 하나인 Regressoin Splines에 적용하였다. 인위적 데이터를 이용한 평가 결과 유전자 알고리즘은 다양한 상황에서 매우 우수한 것으로 나타났다.

  • PDF

다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교 (Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method)

  • 이성호;이재준;박진희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

로지스틱 회귀분석을 통한 암반사면의 안정성 평가법 제안 (A Proposal of the Evaluation Method for Rock Slope Stability Using Logistic Regression Analysis)

  • 이용희;김종열
    • 터널과지하공간
    • /
    • 제14권2호
    • /
    • pp.133-141
    • /
    • 2004
  • 현장조사를 통해 암반사면의 안정성을 평가하기 위해서 여러 연구자들에 의해 평가법이 제안되었다. 그러나 기존의 평가법들은 제안자의 주관적 판단에 의해 평가항목의 선정과 가중치가 달리 적용되고 있어 평가법에 따라 안정성 평가결과도 서로 상이하게 나타나고 있다. 따라서 각 평가항목에 대한 가중치의 객관성을 확보하기 위해 로지스틱 회귀분석을 실시하여 안정성 평가법을 제안하였다.

조건부 자기회귀모형을 이용한 송이버섯 생산량 예측 (Forecasting of Pine-Mushroom Yield Using the Conditional Autoregressive Model)

  • 이진희;신기일
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.307-320
    • /
    • 2000
  • 송이버섯 생산량과 기후인자와의 관계를 통계적으로 규명하기 위한 노력이 꾸준이 진행되어 왔다. 최근 박현 등(1998)은 송이버섯 생산량과 기후인자의 관계를 자기회귀모형을 이용하여 분석하였으나 예측력이 떨어지는 것으로 나타났다. 본 논문에서는 예측의 정확성을 높이기 위한 방법으로 송이버섯 생산이 있다는 조건을 이용한 조건부 자기 회귀모형을 제안하였다. 두 모형의 예측력을 비교한 결과 조건부 자기회귀모형이 더 우수한 것으로 나타났다.

  • PDF

상호변수 최소자승 회귀분석 방법의 제안 (A Suggestion of Two-Way Variable Algorism for Least-Squares Regression Analysis)

  • 이창해
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.189-193
    • /
    • 2005
  • 기존의 회귀식을 사용하거나 새로 유도하여 사용하는 경우 모두 일반적으로 회귀분석의 특성을 간과하고 사용하는 경우가 종종 발생한다. 일반적으로 자료들에서 구해진 회귀식은 분명히 독립변수와 종속변수가 구분되어 유도되었음에도 불구하고 이 식을 사용함에 있어서는 간혹 그 구분을 무시하고 역으로 적용하는 경향이 있었다. 그러나, 독립$\cdot$종속변수가 서로 바뀌면, 연직거리의 잔차들로부터 유도되는 기존의 회귀분석에 의하여, 회귀식이 서로 달라지기 때문에 역으로 적용하여서는 안된다. 이를 해결하기 본 연구에서는 상호변수 최소자승 회귀분석법을 제안하였다. 이론적 내용을 검토를 위해 임진강 영평천의 영중수위표 지점의 2001-2003년의 유량측정자료와 수위-유량곡선을 비교 분석하였다. 결론적으로 상호변수 회귀분석을 사용하면, 기존의 잘못 사용해온 관행을 해소할 수 있을 것이다.

  • PDF