• Title/Summary/Keyword: 다중 로지스틱 회귀분석

Search Result 262, Processing Time 0.029 seconds

주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구 (A study on the properties of sensitivity analysis in principal component regression and latent root regression)

  • 신재경;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.321-328
    • /
    • 2009
  • 회귀분석에서 설명변수들 사이에 상관이 높으면 최소제곱추정법에서 구한 회귀계수들의 정도가 떨어진다. 다중공선성이라 불리는 이 현상은 실제 자료분석에서 심각한 문제를 야기시킨다. 이 다중공선성의 문제를 극복하기 위한 여러 가지 방법이 제안되었다. 능형회귀, 축소추정량 그리고 주성분분석에 기초한 주성분회귀와 고유값회귀등이 있다. 지난 수십 년간 많은 통계학자들은 일반적인 중 회귀에서 감도분석에 관해 연구하였으며, 주성분회귀, 고유값회귀와 로지스틱 주성분회귀에 대해서도 같은 주제로 연구하였다. 이 모든 방법에서 주성분분석은 중요한 역할을 하였다. 또한, 많은 통계학자들이 주성분분석과 관련된 다변량 방법에서 감도분석에 대해 연구를 하였다. 본 연구논문에서는 주성분회귀와 고유값회귀를 소개하고, 또한 주성분회귀와 고유값회귀에서 감도분석의 방법을 소개하고, 마지막으로 이들두방법에 대한 감도분석의 성질에 대해 논의하였다.

  • PDF

종이신문 열독자의 특성이 정기구독 여부에 미치는 영향에 대한 로지스틱 회귀분석 (Logistic regression analysis of newspaper readers characteristics affecting regular subscription)

  • 이세영;김재희
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.653-669
    • /
    • 2019
  • 뉴미디어의 등장과 발달로 인해, 과거 미디어의 대부분을 차지한 종이신문의 이용량이 점차 줄어들어 종이신문의 정기구독률이 2016년 14%로 매우 저조하게 나타났다. 따라서 본 연구는 종이신문 정기구독 여부에 영향을 미치는 열독자 요인을 파악하고자 수행되었다. 이를 위해 한국 언론 진흥재단의 2016년과 2017년의 언론수용자 의식조사의 자료를 분석에 사용하였다. 열독자의 성별, 연령, 학력, 가구소득, 열독일수, 열독시간, 열독분량을 열독자의 특성으로 지정하였으며, 정기구독 여부에 열독자의 어떠한 특성이 영향을 미치는지 알아보기 위해 다중 로지스틱 회귀를 적합하고 해석하였다.

머신러닝 기법을 이용한 대설피해 예측 및 적합성 검토 (Prediction of Snow Damage Using Machine Learning Technique)

  • 이형주;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.192-192
    • /
    • 2020
  • 취약성 분석의 결과로 폭설에 의한 기후노출은 현재에는 강원권이 가장 취약한 것으로 나타났다. 그러나 미래에는 강원권, 충청권, 호남권을 연결하는 축으로 취약지역이 확대될 것으로 전망된다. 본 연구에서는 다양한 머신러닝 기법을 이용하여 대설피해 예측을 실시하였다. 머신러닝 기법으로는 로지스틱회귀모형, 서포트벡터 머신, 의사결정트리 모형을 적용하였다. 종속변수로 대설피해액 자료를 이용하였고, 독립변수로 기상관측자료, 사회·경제적 요소를 사용하였다. 결과적으로 기존에 사용했던 다중회귀모형과 머신러닝 기법으로 예측한 예측력을 비교 및 분석하였고, 예측력이 가장 높은 머신러닝 기법을 제시하였다. 본 연구에서 대설피해 예측을 위해 사용된 예측력이 가장 높은 기법을 활용하여 대설피해를 예측한다면, 미래에 전국적으로 확대될 대설피해에 대해 효과적으로 대비할 수 있을 것으로 기대된다.

  • PDF

다중회귀분석을 이용한 3축 가속도 센서기반 활동량 추정 방법 (Calorie Burn Estimation Algorithm from a Accelerometer using Multiple Regression Analysis)

  • 최선탁;이규필;김준호;조위덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.953-955
    • /
    • 2016
  • 본 논문은 다중 회귀 분석을 이용하여 3축 가속도센서기반의 활동량을 추정하는 방법을 제안한다. 본 연구를 위해 총 59명의 피 실험자가 자체 제작한 활동량계를 착용한 뒤 트레드밀에서 일정한 속도로 걷는/뛰는 동작을 수행한 신호를 수집하였다. 수집한 3축 가속도 신호의 에너지 값에서 사전에 정의한 특징들을 산출한다. 그 다음 각 특징별로 선형, 지수, 로지스틱 회귀 분석을 적용하여 적합도가 높은 특징을 선정한다. 마지막으로 산출된 회귀식들을 사용하여 다중 회귀 분석 방법으로 활동량을 추정한다. 호흡가스 대사 분석기(K4B2)를 착용한 뒤 동일한 방법으로 실험을 수행 하고 제안한 방법과 정확도를 비교한 결과 제안한 방법의 정확도는 86.38 %로 산출되었다. 이는 기존의 Kim 외 3인의 연구결과[1]보다 2.70 %, Actical의 정확도보다 4.31 % 높은 수치이다.

음주운전 초.재범자 특성 비교 (Comparison of Behavior Patterns between First and Repeated Offenders in Driving While Intoxicated(DWI))

  • 정철우;장명순
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.149-160
    • /
    • 2009
  • 본 연구의 목적은 음주운전초 재범자들의 특성을 비교하고, 운전자의 혈중 알코올 농도 모형과 음주운전 재범에 모형을 개발하는 데에 있다. 운전자의 혈중 알코올 농도 예측모형은 다중회귀분석을, 음주운전 재범모형은 로지스틱 회귀분석 방법을 이용하였다. 본 연구에 따른 결과를 요약하면 다음과 같다. 첫째, 음주운전 재범자는 초범자에 비하여 형사전과와 교통사고 경력이 많았으며, 무면허 운전자는 운전면허 소지자에 비하여 혈중 알코올 농도가 높았다. 둘째, 음주운전 운전자들의 혈중 알코올 농도 회귀모형이 개발되었으며, 형사전과, 운전거리가 주요 변수임을 알 수 있었다. 셋째, 음주운전 재범 모형이 개발되었으며 과거 교통사고 경력, 운전면허 유무, 형사전과가 재범에 가장 중요한 요인인 것으로 나타났다.

빅데이터 통합모형 비교분석 (Comparison analysis of big data integration models)

  • 정병호;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.755-768
    • /
    • 2017
  • 빅데이터가 4차 산업혁명의 핵심으로 자리하면서 빅데이터 기반 처리 및 분석 능력이 기업의 미래 경쟁력을 좌우할 전망이다. 빅데이터 처리 및 분석을 위한 RHadoop과 RHIPE 모형은 R과 Hadoop의 통합모형으로 지금까지 각각의 모형에 대해서는 연구가 많이 진행되어 왔으나 두 모형간 비교 연구는 거의 이루어 지지 않았다. 본 논문에서는 대용량의 실제 데이터와 모의실험 데이터에서 다중 회귀 (multiple regression)와 로지스틱 회귀 (logistic regression) 추정을 위한 머신러닝 (machine learning) 알고리즘을 MapReduce 프로그램 구현을 통해 RHadoop과 RHIPE 간의 비교 분석하고자 한다. 구축된 분산 클러스터 (distributed cluster) 하에서 두 모형간 성능 실험 결과, RHIPE은 RHadoop에 비해 대체로 빠른 처리속도를 보인 반면에 설치, 사용면에서 어려움을 보였다.

우리나라 노인의 배우자 유무와 우울과의 관련성 (The Relationship between Existence of Spouses and Depression of Korean Elderly)

  • 박형수;정미화;유진호
    • 한국전자통신학회논문지
    • /
    • 제7권5호
    • /
    • pp.1181-1187
    • /
    • 2012
  • 노인 우울은 삶의 만족을 저하시킬 뿐 아니라 노인 자살의 중요한 위험요인이다. 본 연구에서는 남자와 여자 노인의 배우자 유무와 우울과의 관련성에 대하여 질병관리본부에서 실시한 4기 2차년도 2008년 국민건강영양조사 대상자중 65세 이상 노인 남자 615명, 여자 904명을 연구대상으로 하였다. 분석은 카이제곱 검정과 다중로지스틱 회귀분석을 통해 일반적 특성, 이환 및 건강관련 특성과 우울과의 관련성을 파악하였다. 연구결과 연령, 가구소득, 주관적 건강상태, 활동제한 유무, 스트레스 정도 등을 보정한 다중로지스틱 회귀분석에서 배우자가 없는 남자 노인의 비차비는 2.37(95% CI 1.03-5.45)로 우울을 더 느꼈으며, 여자노인의 경우에서는 배우자의 유무와 우울과는 관련성이 없었다.

가족특성이 고등학생의 비만에 미치는 영향 (Family Factors and Obesity in High School Students)

  • 이상미
    • 한국산학기술학회논문지
    • /
    • 제17권8호
    • /
    • pp.84-93
    • /
    • 2016
  • 본 연구의 목적은 고등학생의 비만에 영향하는 가족특성을 규명하기 위함이며 I광역시 소재 고등학교에 재학 중인 384명의 고등학생을 대상으로 서술적 조사연구가 수행되었다. 자료 수집은 2015년 2월부터 4월까지 설문조사에 의해 이루어졌다. 설문지는 체중, 키, 개인특성과 가족특성에 대한 내용을 포함하였으며 수집된 자료는 다중 로지스틱 회귀분석에 의해 분석되었다. 다중 로지스틱 회귀분석 결과, 남학생인 경우(aOR = 4.37; 95% CI [1.26, 15.16]), 아버지의 직업이 비정규직인 경우(aOR = 3.10; 95% CI [1.15, 8.40])와 양부모 가정이 아닌 경우(aOR = 3.52; 95% CI [1.29, 9.61])가 비만의 영향요인으로 나타났다. 본 연구 결과는 여학생에 비해 상대적으로 덜 주목을 받아왔던 남학생의 비만의 위험성과 건강한 체형관리의 중요성에 대한 인식의 향상이 필요함을 제시하였다. 또한 청소년의 비만 예방과 관리를 위해 낮은 사회경제적 수준과 불완전한 가족구조의 고위험 가족특성을 가진 청소년에 대한 중재프로그램을 적용할 필요가 있다.

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • 정윤;황석해
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA:multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 등이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적 요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation)알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉층의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.

  • PDF