• 제목/요약/키워드: 다항 회귀분석

검색결과 155건 처리시간 0.024초

주성분회귀분석을 활용한 다항회귀분석 성능개선: PGF 수치역변환 사례를 중심으로 (Improving Polynomial Regression Using Principal Components Regression With the Example of the Numerical Inversion of Probability Generating Function)

  • 양원석;박현민
    • 한국콘텐츠학회논문지
    • /
    • 제15권1호
    • /
    • pp.475-481
    • /
    • 2015
  • 종속변수와 설명변수 사이의 관계가 선형이 아닌 경우에는 비선형 관계를 반영할 수 있는 다항회귀분석을 이용하여 회귀분석을 수행한다. 한편, 다항회귀분석에는 설명변수의 거듭제곱항들이 설명변수에 추가되므로 설명변수들 사이에 상관관계가 발생하여 다항회귀모형의 성능 저하 문제가 발생할 수 있다. 본 논문에서는 PGF 수치역변환 문제를 사례로 하여 주성분회귀분석을 통해 다항회귀분석의 성능을 극적으로 향상시킬 수 있음을 보인다. 본 논문에서는 PGF의 정의를 이용하여 PGF를 다항회귀분석으로 모형화한다. 다항회귀분석을 이용하여 PGF 전개식의 회귀계수를 추정하면 회귀계수의 추정 자체가 불가능하거나 계수 추정의 정확성이 저하되는 문제가 발생한다. 이 경우 다항회귀분석에 주성분회귀분석을 적용하면 계수 추정의 정확도가 극적으로 향상되어 다항회귀분석의 계수 추정 시 발생하는 문제를 해결할 수 있음을 밝힌다.

일강우자료를 활용한 지하수위 예측기법 개발 (Development of a Technique for Estimating Ground Water Level Using Daily Precipitation Data)

  • 박재현;최용선;박창근;양정석;부성안
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.189-193
    • /
    • 2006
  • 대체용수원의 개발이 시급하게 대두되어지고 있는 가운데 제한된 수자원을 보다 효과적으로 사용하기 위한 하나의 방법으로 지하댐(Groundwater Dam) 건설을 이용한 지하수 자원의 개발이 하나의 방법으로 제안되었다. 하지만 해안지역에 설치된 지하댐을 운영할 경우 지하수위 변동에 따른 염수의 침입을 고려하여 운영하여야 한다. 특히 갈수시는 지하수위 하강이 강하게 나타나는 시기로 지하수위는 지하댐 최적운영을 위한 중요한 지표가 된다. 특히 강우량 자료를 활용한 가뭄지수와 지하수위의 관계를 설명 할 수 있다면 예상 강우자료를 활용한 장래의 지하수위를 예측 할 수 있으며 이것은 지하댐 운영에 매우 효과적으로 활용 할 수 있을 것이다. 본 연구에서는 기존의 강우와 예상 강우 자료를 활용하여 지하수위 예측기법을 개발하였다. 과거 강수량의 일이동 평균값을 바탕으로 한 다항 회귀모델을 수립하여, 계절적 특성을 고려한 구간을 분리하여 적용하였다. 예측된 지하수위의 정확성을 알아보기 위해 관측된 지하수위와 예측된 지하수위를 비교 분석하였다. 분석 결과 단순회귀기법을 지하수위를 예측한 경우 $0.62{\sim}0.63$의 상관계수를 보인반면 다항회귀기법을 적용한 결과 $0.62{\sim}0.84$로 상관계수가 증가하였다. 대체적으로 관측된 지하수위와 예측된 지하수위는 비슷한 경향을 보였다. 따라서 지하댐 운영에 있어 최적의 취수량을 개발하기위해 일강우자료를 활용한 지하수위 예측기법의 활용성은 매우 높은 것으로 판단된다.

  • PDF

국소가중다항회귀분석을 이용한 이상치제거 및 자료보정기법 개발 (GPS를 이용한 개별차량 주행속도를 중심으로) (Correction of Erroneous Individual Vehicle Speed Data Using Locally Weighted Regression (LWR))

  • 임희섭;오철;박준형;이건우
    • 대한교통학회지
    • /
    • 제27권2호
    • /
    • pp.47-56
    • /
    • 2009
  • 현장에서 수집되는 교통원시자료는 수집장비의 결함 및 주변환경 등에 의해 다양한 이상치가 발생한다. 원시자료의 품질은 추가 가공을 통해 생성되는 교통정보의 신뢰도에 직접적인 영향을 미치는 중요한 요인이다. 실시간으로 수집되는 교통원시자료를 1차 가공하는데 있어서 핵심은 이상치(Outlier)를 검지하고 보정하는 것이라고 할 수 있다. 본 연구에서는 GPS장비를 이용해 얻은 개별차량의 주행속도에서 발생하는 이상치를 제거하고 보정하는 기법을 제안하였다. GPS는 광범위한 교통네트워크상의 차량추적에 용이하게 사용될 수 있는 장점이 있다. 수집된 개별차량의 주행속도에서 이상치를 검지하고 보정하기 위해 국소가중다항회귀분석(LWR: Locally Weighted Regression)을 적용하였다. 또한 국소가중다항회귀분석을 수행하기 위한 파라미터 결정 알고리즘을 개발하여 적용하였다. 개발된 필터링 기법의 성능 평가를 위해 Synthetic Outlier를 생성 및 주입하여 개발된 필터링 기법을 통해 보정시키고 원시자료와 비교 분석 하였고, LWR을 이용한 기법의 상대적 성능 평가를 위해 지수평활화를 이용한 기법과 비교하였다. 평가 결과 LWR기법이 지수평활화를 이용한 기법보다 낮은 오차율을 보여 상대적으로 우수함을 검증하였다. 본 연구에서 제안한 방법론은 교통정보공학 분야의 자료처리 및 정보가공을 위한 도구로서 활용도가 클 것으로 기대된다.

노인의 사망요인 분석: 치매와 타 원인간의 비교

  • 김한곤
    • 한국인구학
    • /
    • 제30권1호
    • /
    • pp.49-66
    • /
    • 2007
  • 본 연구는 2001년 한국에서 사망한 60세 이상 노인들 62,000명의 사망기록 자료를 이용하여 사망원인의 다양성을 보여주는 한편 치매에 의한 사망원인을 가장 잘 예측할 수 있는 변수를 경험적으로 규명하고자 실시하였다. 이와 같은 목적을 위한 연구내용은 다음과 같다. 첫째, 노인들의 주요 사망원인에 해당하는 악성종양, 뇌혈관 질환, 심장병, 당뇨, 만성 호흡기 질환, 치매, 고혈압, 간 질환, 사고, 결핵 및 기타 질병 등 11개 사망원인에 대하여 빈도분석을 실시하였다. 둘째, 60세 이상 사망자들 가운데 치매에 의한 사망원인과 나머지 19개의 사망원인을 비교하여 치매에 의한 사망에 영향을 미치는 요인들을 다항로지스틱회귀분석을 통해 분석하였다. 그 결과, 한국의 노인인구 가운데 연령이 높을수록 치매로 인하여 사망할 가능성(우도비)이 높으며 여성이 남성에 비해 치매에 의하여 사망할 가능성이 높은 것으로 밝혀졌다. 그러나 교육수준이 높을수록 치매에 의하여 사망할 가능성이 낮은 것으로 나타났으며 거주지역은 치매에 의한 사망과 통계적으로 유의미한 관계가 있었으나 일관성은 없는 것으로 밝혀졌다. 한편 결혼지위는 치매에 의한 사망과 통계적으로 유의미한 관계가 없는 것으로 나타났다.

다범주 자료의 다항로짓 모형과 로지스틱 회귀모형 비교;장애연금 특성분석 중심으로 (Comparison of Multinomial Logit and Logistic Regression on Disability Pensioners' Characteristic)

  • 김미정
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.589-602
    • /
    • 2008
  • 순위형 다범주 자료에 있어서 범주값의 증감에 대한 설명변수의 특성분석을 위하여 다항로짓모형을 적합하여 분석하고 로지스틱 회귀모형을 적합하여 분석한 결과와 비교하였다. 이를 통하여 장애연금 수급자자료의 재정추계를 위해 필요한 일곱 가지 요인인 성별, 수급나이, 가입기간, 가입종별, 소득활동여부, 소득수준, 장애원인이 장애등급에 미치는 영향을 파악하였다. 일곱 요인 모두 장애응급에 대한 연관성이 있음을 확인하였고 이 가운데 다섯 요인은 장애등급의 증감에 있어서도 일정한 추세를 보였으나, 장애원인과 소득수준은 장애등급의 증감에는 일정한 추세를 보이지 않음을 확인하였다. 본 연구의 결과는 장애연금 관리방안을 모색하는데 있어서 장애등급에 따른 설명 요인의 특성을 반영하는데 필요한 가이드라인을 제공할 수 있을 것으로 기대한다. 장애등급 분류에 있어서 다중분류의 정분류율은 각각 42.56%와 42.43%로 로지스틱 회귀모형의 경우 다중로짓 모형의 경우보다 다소 높았지만 거의 비슷한 정확도를 보였다.

신경회로망과 회귀모형을 이용한 특수일 부하 처리 기법 (Special-Days Load Handling Method using Neural Networks and Regression Models)

  • 고희석;이세훈;이충식
    • 조명전기설비학회논문지
    • /
    • 제16권2호
    • /
    • pp.98-103
    • /
    • 2002
  • 전력수요를 예측할 경우 가장 중요한 문제 중의 하나가 특수일 부하의 처리문제이다. 따라서 본 연구에서 길고(구정, 추석) 짧은(식목일, 현충일 등) 특수일 피크 부하를 신경회로망과 회귀모형을 이용하여 예측하는 방법을 제시한다. 신경회로망 모형의 특수일 부하 처리는 패턴 변환비를 이용하며, 4차의 직교 다항 회귀모형은 과거의 10년 (1985∼1994)간의 특수일 피크부하 자료를 이용하여 길고 짧은 특수일 부하를 예측한다. 특수일 피크 부하를 예측한 결과, 신경회로망 모형의 주간 평균 예측 오차율과 직교 다항 회귀모형의 예측 오차율을 분석한 결과 1∼2[%]대로 두 모형 모두 양호한 결과를 얻었다. 또한 4차의 직교 다항 회귀 모형의 수정결정계수 및 F 검정을 분석한 결과 구성한 예측 모형의 타당성을 확인하였다. 두 모형의 특수일 부하를 예측한 결과를 비교해 보면 긴 특수일 부하를 예측할 때는 패턴 변환비를 이용한 신경회로망 모형이 보다 더 효과적이었고, 짧은 특수일 부하를 예측할 경우에는 두 방법 모두 유효하였다.

잠재프로파일 분석방법 적용을 통한 사회복지시설 종사자의 직무만족도 유형과 예측요인 (Latent Profile Analysis Method Application in the Job Satisfaction Types and Predictive Factors of Social Welfare Institution Workers)

  • 이형하
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.177-179
    • /
    • 2023
  • 본 연구에서는 사회복지시설 종사사의 직무만족도 유형을 살펴보고 유형별 예측변인과의 영향관계를 검증하였다. 이러한 연구목적을 검증하기 위해 보건복지부의 '사회복지시설 실태조사'(2014년) 데이터에서 직무만족도 변인에 모두 응답한 11,660명을 최종 분석하였다. 잠재프로파일 분석결과, 사회복지사의 직무만족도 유형은 4집단으로 나타나 '최상 직무만족도집단', '중상 직무만족도집단', '중간 직무만족도집단', '최하 직무만족도집단'으로 명명하였다. 다항로지스틱 분석결과, CLASS4(최상 직무만족도집단)를 준거집단으로 하여 CLASS1(최하 직무만족도집단)과 비교해 노동강도대비 보수수준 평가, 타직종대비 보수수준 평가, 시설안전도, 인권보장도를 높게 인식할수록 CLASS4(최상 직무만족도집단)에 속할 확률이 높아지는 것으로 나타났다. 다만, 이직의사는 낮을수록 CLASS4(최상 직무만족도집단)에 속할 확률이 높아지는 것으로 나타났다. CLASS4를 준거집단으로 하여 CLASS2집단, CLASS3집단도 비교분석 하였다.

  • PDF

도시 쇠퇴지역 공간 특성을 반영한 적합 도시재생 사업유형 적용방안 연구 (A Study on the Application of Suitable Urban Regeneration Project Types Reflecting the Spatial Characteristics of Urban Declining Areas)

  • 조돈철;신동빈
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.148-163
    • /
    • 2021
  • 본 연구는 「도시재생 활성화 및 지원에 관한 특별법」에 따라 2017년부터 시작된 도시재생 뉴딜사업(이하 '뉴딜사업')의 종류가 다양해짐에 따라 데이터 기반의 정확한 쇠퇴진단과 사업유형 예측이 중요하다고 판단되어, 전국 읍면동을 대상으로 가장 적합한 뉴딜사업 유형을 판별할 수 있는 적용 모형 개발을 위한 연구를 수행하였다. 적용 모형 개발을 위한 데이터는 통계지리정보서비스(SGIS)와 도시재생정보체계의 '도시재생 종합정보 개방체계'를 통해 수집하고 데이터 전처리를 거쳐 분석 모델을 위한 데이터를 구축하였다. 적용 모형은 다항 회귀분석과 다항 로지스틱 회귀분석을 통해 4가지 모형을 도출하였다. 4가지 모형의 적용 가능성과 유효성 검증을 위해 서울특별시를 대상으로 각 모형별로 기존에 선정된 뉴딜사업지에 공간분포도를 비교 분석한 결과 DI-54 모형이 가장 높은 일치율을 확인할 수 있었다. 또한 DI-54 모형을 전국 954개 도시 쇠퇴지역에 적용해본 결과에서도 적합 도시재생 사업유형 판별에 활용 가능성을 확인할 수 있었다.

공정변수간의 교호작용을 고려한 모서리 접합두께 및 처짐량 예측 회귀식 도출 (Derivation of predicting regression equations of bonding thickness and deflection of glass edge considering the interaction effects between the parameters)

  • 김영신;전의식
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.511-516
    • /
    • 2013
  • 유리 모서리 접합은 디스플레이 및 건축, 가전 등 산업계의 다양한 분야에 활용되고 있으며, 패널 접합부의 두께 및 형상은 단열성능 및 강도 등 패널의 주요 성능에 큰 영향을 미치는 요인으로 작용한다. 이런 모서리 접합부의 단면은 수소혼합가스토치를 이용하여 모서리를 용융 접합 할 경우 공정변수에 의해 형상이 결정된다. 따라서 본 논문에서는 가스토치를 이용하여 모서리 접합 시 접합부에 영향을 미치는 공정변수를 설정하고, 접합단면의 형상변수를 설정하여 두 변수간의 상관관계를 분석하기 위한 회귀식을 도출하고자 하였다. 회귀식 도출을 위해 공정변수가 형상변수에 미치는 주효과 및 교호작용을 분석하였으며, 변수간의 교호작용을 고려한 다항회귀식을 도출하였다. 도출된 다항회귀식을 통해 각 공정변수 변화에 따라 모서리 접합 두께 예측 및 처짐량 예측이 가능하다.

기계학습을 활용한 도로비탈면관리시스템 데이터 품질강화에 관한 연구 (The Study for Improvement of Data-Quality of Cut-Slope Management System Using Machine Learning)

  • 이세혁;김승현;우용훈;문재필;양인철
    • 지질공학
    • /
    • 제31권1호
    • /
    • pp.31-42
    • /
    • 2021
  • 도로비탈면관리시스템(Cut-Slope Management System, CSMS)은 전국 일반국도 비탈면에 대해 기초·정밀 조사를 바탕으로 데이터베이스를 구축해왔다. 그런데 이러한 데이터는 사람에 의해 기록되기 때문에 데이터 누락 및 오기입 문제가 발생할 수밖에 없다. 본 연구에서는 데이터의 불완전성 문제를 극복하기 위해 여러 머신러닝 기반의 예측모델들을 개발하고 이를 이용한 데이터 품질 강화 가능성을 검토하고자 하였다. 우선 다 범주 문자형 데이터를 수치화하는 과정을 수행하였고, 선정된 데이터 항목들에 대해 다항 로지스틱 회귀분석(Multinomial Logistic Regression)과 심층신경망(Deep-Neural-Network) 기반의 예측모델들을 개발하였다. 그 결과, 심층신경망 모델들의 정확도가 월등히 높은 것으로 나타났다. 향후 개발된 모델들을 활용하여 누락 및 오기입 데이터의 보완이 가능할 것으로 기대된다.