• 제목/요약/키워드: 로지스틱 회귀

검색결과 1,734건 처리시간 0.029초

로지스틱 회귀모형을 분석하기 위한 SPSS, SAS, STATA의 비교분석

  • 김순귀;정동빈
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.287-292
    • /
    • 2002
  • 최근 여러 분야에서 로지스틱 회귀에 대한 필요성과 그 응용이 급증하면서 이를 분석하기 위한 통계패키지가 많이 개발되어 사용되고 있다. 이 논문에서는 자료의 유형에 따라 활용할 수 있는 여러 형태의 로지스틱 회귀모형을 간단히 살펴보고, SPSS, SAS, STATA, MINITAB과 같은 통계패키지를 사용하여 로지스틱 회귀모형에 적용할 때 각각 다룰 수 있는 범위와 그 특징에 대해 다룬다.

  • PDF

가중치 세분화 기반의 로지스틱 회귀분석 모델 (Fine-Grain Weighted Logistic Regression Model)

  • 이창환
    • 전자공학회논문지
    • /
    • 제53권9호
    • /
    • pp.77-81
    • /
    • 2016
  • 로지스틱 회귀분석은 오랫동안 다양한 분야에서 예측을 위한 기술 혹은 변수 간의 관계를 설명하기 위하여 사용되어 왔다. 로지스틱 회귀분석에서 각 속성은 목적 값에 대한 중요도를 가지는데 본 연구에서는 이를 세분화하여 각 속성의 값에 따라서 중요도를 부여하는 새로운 방법을 제시한다. 점진적 하강법을 이용하여 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하였다. 제안된 방법은 다양한 데이터를 이용하여 실험하였고 본 연구의 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

마코프 로지스틱 회귀모형을 이용한 강수 확률예측

  • 박정수
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.345-352
    • /
    • 2006
  • 현 기상의 시점에서 강수 확률 예측을 위해 가장 적절한 모형은 공간적 종속성과 시간적 종속성을 고려한 모형이 선택되어져야 한다. 보통 마크프 연쇄 모형과 예보인자를 이용하는 회귀 모형이 모두 고려된 모형을 사용한다. 본 논문에서는 강수 형태를 세 개의 상태로 나눈 경우, 즉 맑은 경우, 흐린 경우, 비온 경우로 나누어 마코프 로지스틱 회귀모형을 세우고 강수확률을 예측 할 수 있도록 하였다. 또한 서울 지역의 강수 자료를 이용하여 기존의 마코프 회귀모형과 마코프 로지스틱 회귀모형을 서로 비교하여 실제적 적용 문제를 다루었다.

  • PDF

속성값 기반의 정규화된 로지스틱 회귀분석 모델 (Value Weighted Regularized Logistic Regression Model)

  • 이창환;정미나
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1270-1274
    • /
    • 2016
  • 로지스틱 회귀분석은 통계학 등의 분야에서 예측을 위한 기술 혹은 변수 간의 상관관계를 설명하기 위하여 오랫동안 사용되어 왔다. 이러한 로지스틱 회귀분석 방법에서 현재 각 속성들은 목적 값에 대하여 동일한 중요도를 가지고 있다. 본 연구에서는 이러한 가중치 계산을 좀더 세분화하여 각 속성의 값이 서로 다른 중요도를 가지는 새로운 학습 방법을 제시한다. 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하기 위하여 점진적 하강법을 이용하여 개발하였다. 본 연구에서 제안된 방법은 다양한 데이터를 이용하여 실험하였고 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

한계강우량 산정을 위한 로지스틱 회귀분석 (Logistic regression analysis for Critical Rainfall Estimation)

  • 이창현;이강원;금호준;김병현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

수정 결정계수를 사용한 로지스틱 회귀모형에서의 변수선택법 (Variable Selection for Logistic Regression Model Using Adjusted Coefficients of Determination)

  • 홍종선;함주형;김호일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.435-443
    • /
    • 2005
  • 로지스틱 회귀모형에서 결정계수는 선형 회귀모형보다 다양하게 정의되며 그 값들도 매우 작아 로지스틱 회귀모형 평가기준으로 사용되는 통계량이 라고 할 수 없다. Liao와 McGee(2003)는 부적절한 설명변수의 추가 또는 표본크기의 변화에 민감하지 않은 두 종류의 수정 결정계수를 제안하였다. 본 연구에서는 실제자료에 적용한 로지스틱 회귀모형에서 수정 결정계수를 포함한 네 종류의 결정계수들을 변수선택의 기준으로 사용하여 기존의 변수선택 방법인 전진선택, 후진제거, 단계적 선택방법, AIC 통계량 등을 사용한 방법들과 비교하여 그 적절함과 효율성을 토론한다.

2007년 한국프로야구에서 도루성공모형 (Steal Success Model for 2007 Korean Professional Baseball Games)

  • 홍종선;최정민
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.455-468
    • /
    • 2008
  • 야구경기의 승패에 영향을 미치는 중요한 요인으로 간주되는 도루의 성공모형을 개발하기 위하여 2007년 한국프로야구 기록자료를 바탕으로 로지스틱 회귀모형들을 제안한다. 또한 한국프로야구의 도루성공과 실패에 대해 판별분석을 실시하고 분류 기준값을 결정하였으며, 판별분석 분류표를 이용해 로지스틱 회귀분석과 판별분석의 효율성을 비교한다. 전체적인 모형의 정확도는 로지스틱 회귀모형이 판별분석보다 더 좋은 것으로 나타났고, 연속형 자료를 범주형으로 변환한 자료에 대한 로지스틱 회귀모형도 유사한 효율성을 갖고있다.

로지스틱 회귀모형을 이용한 비대칭 종형 확률곡선의 추정 (Estimation of Asymmetric Bell Shaped Probability Curve using Logistic Regression)

  • 박성현;김기호;이소형
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.71-80
    • /
    • 2001
  • 로지스틱 회귀모형은 이항 반응자료에 대한 가장 보편적인 일반화 선형모형으로 독립변수에 대한 확률함수를 추정하는데 이용된다. 많은 실제적 상황에서 확률함수가 종형의 곡선형태로 표현되는데 이 경우에는 2차항을 포함한 로지스틱 회귀모형을 이용한 분석은 대칭성을 갖는 확률함수에 대한 가정으로 인해 비대칭 형태의 종형곡선에서는 확률함수의 신뢰성이 저하되고, 2차항을 포함하기 때문에 독립변수의 효과를 설명하기가 쉽지 않다는 제한점을 가지고 있다. 본 논문에서는 이러한 문제점을 해소하기 위해서 로지스틱 회귀분석과 반복적 이분법을 이용하여 종형의 형태에 관계없이 확률곡선을 추정하는 방법론을 제안하고 모의 실험을 통해 2차항을 포함한 로지스틱 회귀모형과 비교하고자 한다.

  • PDF

로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발 (Flood Risk Forecasting using Logistic Regression for the Han River Basin)

  • 이선미;최영제;이재응
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF

3차원 잔차산점도를 이용한 로지스틱회귀모형에서 교호작용의 탐색 (Exploring interaction using 3-D residual plots in logistic regression model)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.177-185
    • /
    • 2014
  • 로지스틱회귀모형에서 설명변수만으로는 충분히 설명이 되지 못하고 설명변수의 변환된 형태인 이차항 또는 교호작용항이 필요한 경우가 있다. 설명변수가 두 개이고 조건부 분포가 이변량 정규분포를 따르는 경우 로지스틱회귀모형에서는 기본적으로 이차항과 교호작용항이 모형에 포함되어야 한다. 하지만 조건부 분포의 분산과 상관계수에 따라 이차항과 교호작용항이 필요하지 않게 되는 경우도 있다. 분산이나 상관계수에 대한 정보는 산점도를 보고 대체적인 판단이 가능하지만 교호작용항의 필요성을 판단하기가 쉽지 않다. 본 논문에서는 3차원 잔차산점도를 이용한 교호작용의 탐색방법을 제시하고 이 방법을 실제 자료에 적용시켜본다.