• 제목/요약/키워드: 주성분회귀법

검색결과 38건 처리시간 0.021초

근적외선 분광 데이터 예측 모형을 위한 데이터 마이닝 기법의 성능비교 (Performance Comparison of Data Mining Approaches for Prediction Models of Near Infrared Spectroscopy Data)

  • 백승현
    • 대한안전경영과학회지
    • /
    • 제15권4호
    • /
    • pp.311-315
    • /
    • 2013
  • 본 논문에서는 주성분 회귀법과 부분최소자승 회귀법을 비교하여 보여준다. 이 비교의 목적은 선형형태를 보유한 근적외선 분광 데이터의 분석에 사용할 수 있는 적합한 예측 방법을 찾기 위해서이다. 두 가지 데이터 마이닝 방법론인 주성분 회귀법과 부분최소자승 회귀법이 비교되어 질 것이다. 본 논문에서는 부분최소자승 회귀법은 주성분 회귀법과 비교했을 때 약간 나은 예측능력을 가진 결과를 보여준다. 주성분 회귀법에서 50개의 주성분이 모델을 생성하기 위해서 사용지만 부분최소자승 회귀법에서는 12개의 잠재요소가 사용되었다. 평균제곱오차가 예측능력을 측정하는 도구로 사용되었다. 본 논문의 근적외선 분광데이터 분석에 따르면 부분최소자승회귀법이 선형경향을 가진 데이터의 예측에 가장 적합한 모델로 판명되었다.

로버스트추정에 바탕을 둔 주성분로지스틱회귀 (Principal Components Logistic Regression based on Robust Estimation)

  • 김부용;강명욱;장혜원
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.531-539
    • /
    • 2009
  • 로지스틱회귀분석은 고객관계관리를 위한 데이터마이닝 분야에서 많이 사용되는 기법인데, 이 분야의 모형설정 과정에서는 연관성이 매우 높은 설명변수들이 모형에 함께 포함되어 다중공선성의 문제를 유발하며, 더욱이 회귀자료에 이상점들이 포함되면 최우추정량은 심각한 결함을 갖게 된다. 두 가지 문제점을 동시에 해결하기 위하여 로버스트주성분로지스틱회귀를 적용할 수 있는데, 본 논문에서는 주성분의 선정기준을 결정하는 모형을 개발하고, 주성분모형에서의 추정치에 미치는 이상점의 영향을 축소하기 위한 로버스트추정법을 제안하였다. 제안된 추정법은 다중공선성과 이상점이 유발하는 문제들을 적절히 해결해 준다는 사실이 모의실험을 통하여 확인되었다.

교통문화지수 영향요인에 의한 유형화와 영향정도에 관한 연구 (A Study on Patterning and Grading by the Impact of Traffic Culture Index)

  • 정철우;정헌영;고상선
    • 한국항해항만학회지
    • /
    • 제30권1호
    • /
    • pp.35-43
    • /
    • 2006
  • 본 연구는 교통안전공단과 사단법인 녹색교통운동이 공동으로 개발한 교통문화지수와 관련한 2002년과 2003년의 전국 81개 도시 자료를 토대로 통계적 분석을 행하여 이들 대상도시들을 유형화하고, 집단별 영향요인에 근거하여 교통사고 예방대책들을 제시하고자 하였다. 먼저 교통문화지수와 영향요인들에 대한 주성분분석 결과로는 4개의 주성분으로 구분 지울 수 있었으며, 도시 특성별 최적 집단 수는 4개가 적합한 것으로 나타났다. 또한 이들 유형화된 집단별 교통문화지수에의 영향요인을 단계별 다중 회귀분석법을 이용하여 분석한 결과, 4개 집단 모두 높은 설명력을 갖는 회귀모형을 구축할 수 있었다. 이에 따라 각 집단별 교통사고 예방대책들을 구체적으로 제시할 수 있었으며, 아울러 투자된 시설이 얼마나 교통사고 예방에 효과적이었는가를 분석할 필요성이 있음을 향후의 연구 과제로 제시하였다.

주성분 분석법을 이용한 회귀다항식 기반 모델 및 패턴 분류기 설계 (Design of Regression Model and Pattern Classifier by Using Principal Component Analysis)

  • 노석범;이동윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.594-600
    • /
    • 2017
  • 본 논문에서는 매우 높은 차원을 가진 데이터에서 의미 있는 특징 벡터 추출하여 입력 공간의 차원을 줄이기 위하여 주성분 분석법을 사용하였다. 주성분 분석법을 이용하여 축소된 차원을 가진 입력 데이터를 이용하여 회귀 다항식의 입력벡터로 사용하는 모델과 패턴 분류기의 설계 방법을 제안하였다. 제안된 모델 및 패턴 분류기는 매우 단순한 구조를 가진 회귀다항식을 기반으로 설계하여 모델 및 패턴 분류기의 과적합 문제를 해결 하고자 하였다. 제안된 설계방법을 적용하여 설계된 모델과 패턴 분류기의 성능을 비교 및 평가하기 위하여, 다양한 기계 학습 데이터 집합을 사용하였다.

다변량 분석법에 의한 Anionic Surfactant와 Nonionic Surfactant의 동시정량 (Simultaneous Determination of Anionic and Nonionic Surfactants Using Multivariate Calibration Method)

  • 이상학;권순남;손범목
    • 대한화학회지
    • /
    • 제47권1호
    • /
    • pp.19-25
    • /
    • 2003
  • 흡수 분광법에 의해 얻은 스펙트럼을 주성분분석(principal analysis, PCA) 으로 자료를 요약하여 주성분 회귀분서(principal component regression, PCR)과 부분 최소자승법(partial least squares, PLS)으로 음이온과 비이온 계면활성제(anionic and nonionic surfactant)를 동시에 정량하는 방법에 대하여 연구하였다. 두 가지 계면활성제가 서로 다른 농도로 혼합되어 있는 26개의 시료용액을 400~700 nm 범위에서 스펙트럼을 얻었고, 이를 이용하여 PCR과 PLS회귀모델을 얻었다. 두 가지 계면활성제가 서로 다른 농도로 포함된 5개의 외부검정용 시료들의 스펙트럼들을 이용해서 회귀모델의 적합성을 검정하기 위하여 외부검정용 시료의 농도를 계산하였다. 계산된 농도를 이용하여 relative standard error of prediction(RSEP$_{\alpha}$)를 구하여 회귀모델의 적합성을 검정하였다.

국적선사의 경쟁력 강화를 위한 한중정기항로 활성화 방안에 대한 실증연구 (An Empirical Study on the Activation Approach for the Competitive Power of Korean Shipping Company in the Korea-China Liner Routes)

  • 이용호
    • 한국항해항만학회지
    • /
    • 제27권2호
    • /
    • pp.163-170
    • /
    • 2003
  • 본 연구는 한중정기항로에서 국적선사 활성화 방안에 관한 실증연구이다. 본 연구를 위하여 한중항로의 국적정기선사, 중국적 정기선사, 3국적 정기선사 등의 종사자에 실문지 500매를 배포하여 290매 회수하였으며, 한중정기항로 국적선사 활성화 요인과 물동량 증대효과의 관련성을 검증하기 위하여 먼저, 설문문항의 신뢰성(Reliability)은 크론바하 알파(Cronbach's Alpha)에 의한 내적 일관성 검사법을 통하여 검정하였고, 독립변수의 구성타당성(Construct Validity)을 검정하기 위해서 변수들이 선형결합이라는 가정 하에 요인을 추출하는 주성분 법(Principal Components)을 이용한 요인분석(Factor Analysis)을 실시하였다. 그리고 연구가설을 검증하기 위하여 다변량 회귀분석(Multiple Regression Analysis)을 실시하였다.

주성분 회귀분석 및 인공신경망을 이용한 AE변수와 응력확대계수와의 상관관계 해석 (Analysis on Correlation between AE Parameters and Stress Intensity Factor using Principal Component Regression and Artificial Neural Network)

  • 김기복;윤동진;정중채;박휘립;이승석
    • 비파괴검사학회지
    • /
    • 제21권1호
    • /
    • pp.80-90
    • /
    • 2001
  • AE 신호와 재료의 기계적 물성과의 관계를 정량적으로 제시할 수 있는 방법을 개발하였다. 재료의 여러 가지 기계적 성질들 중 피로균열 거동에 관련된 응력확대계수를 중심으로 AE 신호와 같은 다변량 데이터의 처리에 많이 사용되고 있는 주성분 회귀분석과 비선형적 문제 해결에 적합한 신경회로망 기법을 이용하였다. 이를 위하여 강교량 부재인 SWS490B 강에 대한 피로균열전파 실험을 수행하였으며 표준 CT 시편에 대한 피로균열진전 시 발생하는 AE 신호의 각 변수와 응력확대계수와의 관계를 고찰하였다. 통계분석 방법인 변수선택법을 적용한 결과 AE 카운트(RC), 에너지(EN), 신호지속시간(ED)의 각각에 대한 유의성이 높은 것으로 나타났으나 전반적으로 전체 AE 변수를 모두 이용할 경우 통계적 유의성이 높은 것으로 나타났다. 부재의 반복하중 시 발생하는 피로균열진전을 정량적으로 도출할 수 있는 응력확대계수 추정모델을 개발하고 평가하였다. 미지 시료에 대하여 개발된 모델의 응력확대계수 예측 성능을 분석한 결과 주성분 회귀모델과 인공신경망 모델 모두 우수한 예측성능을 나타내었으나 전반적으로 인공신경망 모델이 주성분 회귀모델보다 다소 양호한 것으로 분석되었다.

  • PDF

데이터 마이닝을 통한 기술경영 전략 수립에 관한 연구 (Establishment of Strategy for Management of Technology Using Data Mining Technique)

  • 이준석;이준혁;김갑조;박상성;장동식
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.126-132
    • /
    • 2015
  • 기술예측은 현재까지 관측된 특정기술에 대한 데이터를 바탕으로 미래에 그 기술이 어떠한 상태가 될 지를 알아보는 것으로써 기술경영 전략 수립 시 유용하게 사용된다. 현재는 전문가 의견을 바탕으로 한 분석법을 이용하여 기술예측을 실시하고, 국가, 기업 그리고 연구자는 이를 근거로 연구개발의 방향 및 전략을 수립한다. 전문가의 의견을 바탕으로 하는 정성적 기술예측은 전문가마다 다른 결과를 예상할 수 있고, 여러 전문가의 의견을 수집하여야 하므로 많은 시간과 비용을 필요로 한다. 이러한 문제점을 극복하고 예측에 대한 객관성을 확보하여 기업의 연구개발 의사결정을 돕기 위해 정량적 예측법을 바탕으로 한 기술예측 방법이 연구되고 있다. 본 논문에서는 정량적 분석법에 기반 한 기술예측 방법론에 대한 연구를 제안한다. 제안된 방법은 데이터 수집, 주성분 분석, 그리고 데이터마이닝 기법 중 하나인 로지스틱 회귀분석을 이용한 예측 단계로 구성되어 있다. 본 연구에서는 무인자동차에 관련된 특허 문서를 이용하여 데이터를 수집 및 추출하고, 특허문서의 텍스트를 마이닝하여 분석이 가능한 형태로 구축한다. 주성분분석 후 추출된 주성분 점수를 이용하여 로지스틱 회귀분석을 실시하며 이를 바탕으로 개발현황 분석 및 기술예측을 시행한다.

분할 역회귀모형에서 차원결정을 위한 점근검정법 (Asymptotic Test for Dimensionality in Sliced Inverse Regression)

  • 박종선;곽재근
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.381-393
    • /
    • 2005
  • 회귀모형에서 필요한 설명변수들의 선형결합들을 탐색하기 위한 방법 중의 하나로 분할역회귀모형을 들 수 있다. 이러한 분할역회귀모형에서 모형에 필요한 설명변수들의 선형결합의 수, 즉 차원을 결정하기 위한 여러 가지의 검정법들이 소개 되었으나 설명변수들의 정규성 가정을 필요로 하거나 다른 제약이 있다. 본 논문에서는 주성분분석에 대한 확률모형을 이 용하여 정규성가정을 필요로하지 않으며 분할의 수에 로버스트한 검정법을 소개하고 모의실험과 실제자료에 대한 적용결과를 통하여 기존의 검정법과 비교하였다.

주성분분석에 의한 결손 자료의 영향값 검출에 대한 연구 (Detecting Influential Observations in Multivariate Statistical Analysis of Incomplete Data by PCA)

  • 김현정;문승호;신재경
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.383-392
    • /
    • 2000
  • 1970년대 후반부터 영향력이 있는 관측값을 검출하기 위해서 회귀분석을 포함한 다양한 다변량 해석법에서의 영향분석 및 감도분석에 대한 연구가 진행되어 왔다. 결손 값이 포함된 불완전한 자료에 관해서도 이러한 연구가 필요하다. 이와 관련하여 Kim et al.(1998)등은 평균벡터와 분산공분산행렬에 대한 최우추정값에 초점을 두고 불완전한 자료에 대한 다변량 해석법에서의 감도분석에 관한 방법적 연구를 다루었다. Kim et al.(1998)에서는 Cook’s D 통계량을 이용하였으나, 본 논문에서는 결손값이 있는 다변량 자료에 대해서 주성분을 이용하여 영향력이 있는 관측값을 검출하는 방법에 대해서 살펴보았다. 이 때, 결손값은 EM알고리즘에 의해 대치하여 PCA 통계량을 유도하였다.

  • PDF