• 제목/요약/키워드: 로지스틱회귀

검색결과 1,744건 처리시간 0.027초

로지스틱 회귀모형을 분석하기 위한 SPSS, SAS, STATA의 비교분석

  • 김순귀;정동빈
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.287-292
    • /
    • 2002
  • 최근 여러 분야에서 로지스틱 회귀에 대한 필요성과 그 응용이 급증하면서 이를 분석하기 위한 통계패키지가 많이 개발되어 사용되고 있다. 이 논문에서는 자료의 유형에 따라 활용할 수 있는 여러 형태의 로지스틱 회귀모형을 간단히 살펴보고, SPSS, SAS, STATA, MINITAB과 같은 통계패키지를 사용하여 로지스틱 회귀모형에 적용할 때 각각 다룰 수 있는 범위와 그 특징에 대해 다룬다.

  • PDF

가중치 세분화 기반의 로지스틱 회귀분석 모델 (Fine-Grain Weighted Logistic Regression Model)

  • 이창환
    • 전자공학회논문지
    • /
    • 제53권9호
    • /
    • pp.77-81
    • /
    • 2016
  • 로지스틱 회귀분석은 오랫동안 다양한 분야에서 예측을 위한 기술 혹은 변수 간의 관계를 설명하기 위하여 사용되어 왔다. 로지스틱 회귀분석에서 각 속성은 목적 값에 대한 중요도를 가지는데 본 연구에서는 이를 세분화하여 각 속성의 값에 따라서 중요도를 부여하는 새로운 방법을 제시한다. 점진적 하강법을 이용하여 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하였다. 제안된 방법은 다양한 데이터를 이용하여 실험하였고 본 연구의 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

로지스틱회귀에서 잔차산점도를 이용한 모형평가 (Model assessment with residual plot in logistic regression)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.141-150
    • /
    • 2015
  • 로지스틱회귀에서 모형을 평가하거나 진단할 때 가설검정이 주로 사용되지만 이것만으로는 놓칠 수 있는 부분이 많고 이에 대한 보완을 위하여 그래픽적 방법의 사용이 요구된다. 그래프를 이용한 모형의 적절성 평가를 위한 도구로 잔차산점도가 널리 이용되고 있으나 적용 범위가 선형회귀에 국한되는 문제점이 있다. 해결 방안으로 주변모형산점도를 이용하여 모형의 적절성을 평가하는 방법이 있으나 역시 문제점을 가지고 있다. 본 논문에서는 주변모형산점도의 대안으로 카이잔차산점도를 제안하고 그 효용성을 알아본다.

마코프 로지스틱 회귀모형을 이용한 강수 확률예측

  • 박정수
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.345-352
    • /
    • 2006
  • 현 기상의 시점에서 강수 확률 예측을 위해 가장 적절한 모형은 공간적 종속성과 시간적 종속성을 고려한 모형이 선택되어져야 한다. 보통 마크프 연쇄 모형과 예보인자를 이용하는 회귀 모형이 모두 고려된 모형을 사용한다. 본 논문에서는 강수 형태를 세 개의 상태로 나눈 경우, 즉 맑은 경우, 흐린 경우, 비온 경우로 나누어 마코프 로지스틱 회귀모형을 세우고 강수확률을 예측 할 수 있도록 하였다. 또한 서울 지역의 강수 자료를 이용하여 기존의 마코프 회귀모형과 마코프 로지스틱 회귀모형을 서로 비교하여 실제적 적용 문제를 다루었다.

  • PDF

속성값 기반의 정규화된 로지스틱 회귀분석 모델 (Value Weighted Regularized Logistic Regression Model)

  • 이창환;정미나
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1270-1274
    • /
    • 2016
  • 로지스틱 회귀분석은 통계학 등의 분야에서 예측을 위한 기술 혹은 변수 간의 상관관계를 설명하기 위하여 오랫동안 사용되어 왔다. 이러한 로지스틱 회귀분석 방법에서 현재 각 속성들은 목적 값에 대하여 동일한 중요도를 가지고 있다. 본 연구에서는 이러한 가중치 계산을 좀더 세분화하여 각 속성의 값이 서로 다른 중요도를 가지는 새로운 학습 방법을 제시한다. 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하기 위하여 점진적 하강법을 이용하여 개발하였다. 본 연구에서 제안된 방법은 다양한 데이터를 이용하여 실험하였고 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

한계강우량 산정을 위한 로지스틱 회귀분석 (Logistic regression analysis for Critical Rainfall Estimation)

  • 이창현;이강원;금호준;김병현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

수정 결정계수를 사용한 로지스틱 회귀모형에서의 변수선택법 (Variable Selection for Logistic Regression Model Using Adjusted Coefficients of Determination)

  • 홍종선;함주형;김호일
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.435-443
    • /
    • 2005
  • 로지스틱 회귀모형에서 결정계수는 선형 회귀모형보다 다양하게 정의되며 그 값들도 매우 작아 로지스틱 회귀모형 평가기준으로 사용되는 통계량이 라고 할 수 없다. Liao와 McGee(2003)는 부적절한 설명변수의 추가 또는 표본크기의 변화에 민감하지 않은 두 종류의 수정 결정계수를 제안하였다. 본 연구에서는 실제자료에 적용한 로지스틱 회귀모형에서 수정 결정계수를 포함한 네 종류의 결정계수들을 변수선택의 기준으로 사용하여 기존의 변수선택 방법인 전진선택, 후진제거, 단계적 선택방법, AIC 통계량 등을 사용한 방법들과 비교하여 그 적절함과 효율성을 토론한다.

로지스틱 회귀모형에서 이변량 정규분포에 근거한 로그-밀도비 (Log-density Ratio with Two Predictors in a Logistic Regression Model)

  • 강명욱;윤재은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.141-149
    • /
    • 2013
  • 로지스틱회귀모형에서 두 설명변수의 조건부 분포가 모두 이변량 정규분포라고 할 수 있다면 설명변수들의 함수로 표현되는 로그-밀도비를 통해 모형에 포함시켜야하는 항을 알 수 있다. 두개의 이변량 정규분포에서 분산-공분산행렬이 같은 경우에는 이차항과 교차항 없이 일차항만으로 충분하다. 상관계수가 모두 0이면 교차항은 설명변수의 분산과 관계없이 필요하지 않다. 또한 로지스틱회귀모형에서 로그-밀도비를 통해 이차항과 교차항이 필요하지 않게 되는 다른 조건들도 알아본다.

로지스틱회귀모형의 로버스트 추정을 위한 알고리즘 (Algorithm for the Robust Estimation in Logistic Regression)

  • 김부용;강명욱;최미애
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.551-559
    • /
    • 2007
  • 로지스틱회귀에서 일반적으로 사용되는 최대우도추정법은 이상점에 대해 로버스트 하지 않다. 따라서 본 논문에서는 로지스틱회귀모형의 로버스트 추정을 위한 알고리즘을 제안하고자 한다. 이 알고리즘은 V-마스크 형태의 경계기준에 의해 나쁜 지렛점과 수직이상점을 식별하고, 식별 결과를 바탕으로 이상점의 영향력을 감소시키기 위한 효과적인 방안을 모색한다. 이상점의 영향력 감소는 가중치와 조정치를 적절히 선정함으로 가능하며, 그 결과 붕괴점이 높은 추정치를 얻게 된다. 제안된 알고리즘을 다양한 자료에 적용하여 정분류율을 측정하여 비교하였는데, 새로운 알고리즘이 최대우도추정보다 정확한 분류를 해 주는 것으로 평가되었다.

2007년 한국프로야구에서 도루성공모형 (Steal Success Model for 2007 Korean Professional Baseball Games)

  • 홍종선;최정민
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.455-468
    • /
    • 2008
  • 야구경기의 승패에 영향을 미치는 중요한 요인으로 간주되는 도루의 성공모형을 개발하기 위하여 2007년 한국프로야구 기록자료를 바탕으로 로지스틱 회귀모형들을 제안한다. 또한 한국프로야구의 도루성공과 실패에 대해 판별분석을 실시하고 분류 기준값을 결정하였으며, 판별분석 분류표를 이용해 로지스틱 회귀분석과 판별분석의 효율성을 비교한다. 전체적인 모형의 정확도는 로지스틱 회귀모형이 판별분석보다 더 좋은 것으로 나타났고, 연속형 자료를 범주형으로 변환한 자료에 대한 로지스틱 회귀모형도 유사한 효율성을 갖고있다.