• 제목/요약/키워드: 로지스틱회귀

검색결과 1,750건 처리시간 0.032초

재입원 예측 모형 개발에 관한 연구 (A Study on the Development of Readmission Predictive Model)

  • 조윤정;김유미;함승우;최준영;백설경;강성홍
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.435-447
    • /
    • 2019
  • 불필요한 재입원을 예방하기 위해서는 재입원 확률이 높은 집단을 집중적으로 관리할 필요가 있다. 이를 위해서는 재입원 예측모형의 개발이 필요하다. 재원예측 모형을 개발하기 위해 1개 대학병원의 2016년에서 2017년의 2년간의 퇴원요약환자 데이터를 수집하였다. 이때 재입원 환자는 연구 기간 내에 2번 이상 퇴원한 환자라 정의 하였다. 재입원환자의 특성을 파악하기 위해 기술통계와 교착분석을 실시하였다. 재입원 예측 모형개발은 데이터마이닝 기법인 로지스틱회귀모형, 신경망, 의사결정모형을 이용하였다. 모형평가는 AUC(Area Under Curve)를 이용하였다. 로지스틱회귀모형이 AUC가 0.81로 가장 우수하게 나옴에 따라 본 연구에서는 로지스틱 회귀모형을 최종 재입원 예측 모형으로 선정을 하였다. 로지스틱회귀모형에서 선정된 재입원에 영향을 끼치는 주요한 변수는 성별, 연령, 지역, 주진단군, Charlson 동반질환지수, 퇴원과, 응급실 경유 여부, 수술여부, 재원일수, 총비용, 보험종류 등이었다. 본 연구에서 개발한 모형은 1개병원의 2년치 자료이므로 일반화하기에는 제한점이 있다. 추후에 여러 병원 장기간의 데이터를 수집하여 일반화 할 수 있는 모형을 개발하는 것이 필요하다. 더 나아가 계획에 없던 재입원 까지 예측을 할 수 있는 모형을 개발하는 것이 필요하다.

머신러닝기법을 이용한 산사태 발생인자의 영향도 분석 (Machine-Learning Evaluation of Factors Influencing Landslides)

  • 박성용;문성우;최재완;서용석
    • 지질공학
    • /
    • 제31권4호
    • /
    • pp.701-718
    • /
    • 2021
  • 본 연구에서는 산사태가 다수 발생한 충주 산척면 지역을 대상으로 야외지질조사 및 일련의 실내시험을 수행하여 데이터를 취득하고, 이후 인공신경망(Artificial neural network)과 로지스틱 회귀분석(Logistic regression)을 적용하여 각 인자가 산사태 발생에 미치는 영향도를 분석하였다. 야외지질조사 시 산사태 발생 유무에 따라 불교란시료를 채취하였으며, 동적 콘 관입시험기를 이용하여 토심을 측정하였다. 실내시험은 미국 표준시험법인 ASTM 규정에 따라 진행되었으며, 인자간 다중공선성을 해결하기 위해 VIF(Variation inflation factor)를 산정하였다. 다중공선성 분석을 통해 총 9개 인자(전단강도, 암종, 토심, 포화함수비, 비중, 투수계수, USCS, 사면 경사, 고도)가 분석에 적용되었다. 추후 도출되는 각 인자별 영향도를 직접적으로 비교하기 위해서 데이터는 최소값 0, 최대값 1이 되도록 최소-최대 정규화한 후 로지스틱 회귀분석 및 인공신경망 분석에 적용되었다. 로지스틱 회귀분석 결과, 토심, 경사, 포화함수비, 전단강도 순으로 산사태 발생에 영향력이 크게 나타났으며, 인공신경망 분석 결과, 경사, 토심, 포화함수비, 전단강도 순으로 영향력이 크게 나타났다. 각 분석기법으로 산정된 영향도를 산술평균한 결과, 토심, 경사, 포화함수비, 전단강도가 상위 4개 인자로 선정되었으며, 이들의 영향도 합계는 약 70%로 분석되었다.

구조방정식과 로지스틱 회귀분석을 이용한 임도비탈면 산사태의 주요 영향인자 선정 (Major Factors Influencing Landslide Occurrence along a Forest Road Determined Using Structural Equation Model Analysis and Logistic Regression Analysis)

  • 김형신;문성우;서용석
    • 지질공학
    • /
    • 제32권4호
    • /
    • pp.585-596
    • /
    • 2022
  • 본 연구는 충주시 산척면 상산마을 일대 임도 비탈면을 대상으로 지질 및 지형 인자 중 산사태 발생에 영향력이 큰 인자를 선정하기 위하여 수행되었다. 연구지역은 집중호우 기간에 반경 2 km 이내에서 집중적으로 다수의 산사태가 발생했기 때문에 동일 강우조건 및 식생 조건으로 가정할 수 있다. 따라서 이들의 영향을 배제한 상태로 지형적 요인 및 토층의 물리·역학적 특성과 관련된 인자들만의 영향도를 파악할 수 있는 지역이다. 산사태 발생지점 37개소와 미발생 지점 45개소를 대상으로 현장조사, 실내시험, 지형 공간분석 등을 통해 토층의 물리·역학적 자료 및 비탈면의 지형 자료를 수집하였다. 수집된 자료를 대상으로 이상치 제거, 최소-최대 정규화, 다중공선성 진단의 순으로 전처리를 수행하였고, 9개의 독립 변수를 선정한 후 구조방정식 모형분석과 로지스틱 회귀분석을 실시하였다. 통계학적 분석 결과, 토층두께, 공극률 및 포화단위중량이 연구지역의 산사태 발생에 크게 영향을 미친 것으로 파악되며, 상기 3개 인자의 영향도 합계는 구조방정식 모형분석에서 전체의 71%, 로지스틱 회귀분석에서 전체의 83%를 차지하는 것으로 분석되었다.

롤 모델의 창업자 특성차이에 대한 영향에 관한 연구 (A Study on the Effects of Role Models on Differences in Entrepreneurs' Characteristics)

  • 이주헌
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.53-66
    • /
    • 2023
  • 롤 모델은 개인의 직업 혹은 경력선택에 영향을 주기도 한다고 알려져 있다. 창업을 선택함에 있어서 롤 모델의 긍정적 영향은 많은 연구를 통해 이미 밝혀진 바가 있다. 롤 모델로는 혈연으로 연결된 가족 구성원인 부모형제 및 친척뿐만 아니라 사회적 관계로 만난 지인을 롤 모델로 선정한다고 한다. 본 연구에서는 자기이외에 롤 모델이 없는 창업자들과 롤 모델이 있는 창업자들로 구분하였다. 그리고 롤 모델이 있는 창업자들과 롤 모델이 없는 창업자들 간에 개인속성, 기업가정신 요인들, 학습지향성의 차이를 검증하고자 하였다. 또, 부모형제 및 친척 롤 모델을 강한 유대의 롤 모델로 지인 롤 모델을 약한 유대의 롤 모델로 구분하였다. 강한 유대 롤 모델을 가진 창업자들과 약한 유대 롤 모델을 가진 창업자들 간에 개인속성, 혁신성, 진취성, 위험감수성, 학습지향성의 차이를 검증하고자 하였다. 이를 위해 요인분석, t-검증 및 로지스틱 회귀분석을 실시하였다. 본 연구를 통해 밝혀진 실증분석 결과는 다음과 같다. 첫째, 롤 모델이 없는 창업자들 중 여성의 비율이 높은 것으로 나타났다. 둘째, 약한 유대의 롤 모델을 가진 창업자들이 강한 유대의 롤 모델을 가진 창업자들에 비해 큰 규모의 창업기업을 운영한다는 것이 밝혀졌다. 셋째, 약한 유대의 롤 모델을 가진 창업자들이 강한 유대의 롤 모델을 가진 창업자들에 비해 학습지향성이 더 높은 것으로 나타났다. 넷째, 로지스틱 회귀분석을 통해 살펴본 결과 롤 모델의 유무에 대한 영향은 성별, 학습지향성, 위험감수성, 창업규모 순인 것으로 나타났다. 다섯째, 로지스틱 회귀분석 결과에서 롤 모델의 유형에 대한 영향은 학습지향성, 창업규모의 순인 것으로 나타났다.

  • PDF

손해배상액과 무효심판 판례를 이용한 특허 로열티율 산정 회귀모형 (Regression Models for Determining the Patent Royalty Rates using Infringement Damage Awards and Inter-Partes Review Cases)

  • 양동홍;강근석;김성철
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.47-63
    • /
    • 2018
  • 무형자산의 가치평가에 많이 사용되고 있는 수익접근법과 시장접근법의 특성을 모두 가지고 있는 로열티공제법을 사용하여 지식재산권의 경제적 가치를 평가할 때, 로열티공제법의 중요한 투입변수인 로열티율을 객관적으로 산정하는 수리적 모형을 제시한다. 이를 위하여 미국의 특허침해 손해배상액을 로열티율로 산정한 판례를 참고로 하여 로열티율을 종속변수로, 당해 특허권의 특허지표를 독립변수로 하여 로열티율 산정 회귀모형을 적용한다. 또한 미국의 당사자계재심(Inter-Partes Review)판례를 참고로 하여 특허무효거절 결과를 종속변수로 하고 당해 특허권의 특허지표를 독립변수로 하여 로지스틱회귀 모형을 적합시킨다. 최종 로열티율은 위의 로열티율 산정 회귀모형에서 산출된 로열티율과 로지스틱회귀모형에서 산출된 특허무효거절 확률을 결합하여 산정한다. 마지막으로, 본 논문에서 구축된 모형에 의해 산정된 로열티율과 기준 방식에 의해 산정된 로열티율을 비교하여 제안된 모형의 객관성과 신뢰성을 분석한다.

2017 International Ice Hockey Federation World Championship의 승리 결정요인 분석 (Factors Contributing to Winning in Ice Hockey: Analysis of 2017 Ice Hockey World Championship)

  • 이주성;김혜영;김채은;프라밧;문제헌
    • 한국체육학회지인문사회과학편
    • /
    • 제57권4호
    • /
    • pp.387-394
    • /
    • 2018
  • 본 연구의 목적은 국제아이스하키연맹(IIHF)이 개최하는 대회에서 승리 팀을 결정하는 주요 변인들을 파악하여 전략 및 전술 수립에 필요한 정보를 제공하는 것이다. 2017 IIHF World Championship 1부 리그 14개 팀의 예선 및 본선을 포함한 64개 경기의 기록지를 분석대상으로 하였다. 분석변인은 save, shot on goal, penalty in minute, time on power play, power play goal, face off win의 비율, 승패 간 로지스틱 회귀분석, 중다회귀분석, 주성분분석을 수행하였다. 로지스틱 회귀분석 결과 승리와 관련이 있는 변인은 shot on goal(p<.001)와 face off win(p<.001)이고 penalty in minute(p<.01)과 time on power play(p<.01)는 부정적인 영향을 미친다. 중다회귀분석에 의하여 산출한 승패 비율과 각 변인과의 상관분석에서는 save(p<.01), face off win(p<.001)가 정적인 상관관계이고 penalty in minute(p<.001)이 부정적인 상관관계이다. 주성분분석 결과에서는 승리한 팀의 경우 페널티 요인, 공격 요인, 수비 요인으로 구성되는 반면 패배한 팀에서는 페널티 요인을 제외하고 공격과 수비 요인이 혼합되어 구성되었다. 따라서 최상위 팀이 참가하는 아이스하키 경기에서 승리하기 위해서는 페널티를 받지 않는 내에서 거친 플레이가 이루어져야 하고 face off win 비율을 높일 수 있는 방안이 마련되어야 할 것이다.

음주운전 초.재범자 특성 비교 (Comparison of Behavior Patterns between First and Repeated Offenders in Driving While Intoxicated(DWI))

  • 정철우;장명순
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.149-160
    • /
    • 2009
  • 본 연구의 목적은 음주운전초 재범자들의 특성을 비교하고, 운전자의 혈중 알코올 농도 모형과 음주운전 재범에 모형을 개발하는 데에 있다. 운전자의 혈중 알코올 농도 예측모형은 다중회귀분석을, 음주운전 재범모형은 로지스틱 회귀분석 방법을 이용하였다. 본 연구에 따른 결과를 요약하면 다음과 같다. 첫째, 음주운전 재범자는 초범자에 비하여 형사전과와 교통사고 경력이 많았으며, 무면허 운전자는 운전면허 소지자에 비하여 혈중 알코올 농도가 높았다. 둘째, 음주운전 운전자들의 혈중 알코올 농도 회귀모형이 개발되었으며, 형사전과, 운전거리가 주요 변수임을 알 수 있었다. 셋째, 음주운전 재범 모형이 개발되었으며 과거 교통사고 경력, 운전면허 유무, 형사전과가 재범에 가장 중요한 요인인 것으로 나타났다.

서울 경마 경기 우승마 예측 모형 연구 (Analysis of Horse Races: Prediction of Winning Horses in Horse Races Using Statistical Models)

  • 최혜민;황나영;황찬경;송종우
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1133-1146
    • /
    • 2015
  • 경마 산업은 국내 합법 사행산업의 대부분을 차지하고 있다. 그러나 사행성 도박이라는 인식 하에 여타 스포츠 산업에 비해 활발한 통계적 분석이 이루어지지 않고 있다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 우승마를 예측하는 모형 개발에 있다. 모형 적합에 사용한 데이터는 한국 마사회에서 제공하는 자료를 바탕으로 하였으며, 경마 성적표, 경주마 정보, 기수 정보, 조교사 정보 등을 사용하였다. 예측 모형은 크게 두 모형으로 나누어 순위를 기반으로 한 모형과 기록을 기반으로 한 모형으로 적합하였고, 분석 방법으로는 선형회귀분석, 랜덤 포레스트, 로지스틱 회귀 분석을 사용하였다. 그 결과 말 기본 정보와 과거 우승 경력, 기수의 과거 우승 경력 등이 순위 예측에 큰 영향을 미치는 것을 알 수 있었다. 모형 적합에 사용되지 않은 최근 1개월 간 데이터를 이용하여 단승식, 복승식, 삼복승식으로 배팅한 결과 모형 간 큰 차이가 없었고, 모두 양의 수익을 얻을 수 있었다.

기운 일반화 t 분포를 이용한 이진 데이터 회귀 분석 (Binary regression model using skewed generalized t distributions)

  • 김미정
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.775-791
    • /
    • 2017
  • 이진 데이터는 일상 생활에서 자주 접할 수 있는 데이터이다. 이진 데이터를 회귀 분석하는 방법으로 로지스틱(Logistic), 프로빗(Probit), Cauchit, Complementary log-log 모형이 주로 쓰이는데, 이 방법 이외에도 Liu(2004)가 제시한 t 분포를 이용한 로빗(Robit) 모형, Kim 등 (2008)에서 제시한 일반화 t-link 모형을 이용한 방법 등이 있다. 유연한 분포를 이용하면 유연한 회귀 모형이 가능해지는 점에 착안하여, 이 논문에서는 Theodossiou(1998)에서 제시된 기운 일반화 t 분포 (Skewed Generalized t Distribution)의 이용하여 우도 함수를 최대로 하는 이진 데이터 회귀 모형을 소개한다. 기운 일반화 t 분포를 R glm 함수, R sgt 패키지를 연결하여 이 논문에서 제시한 방법을 R로 분석할 수 있는 방법을 소개하고, 피마 인디언(Pima Indian) 데이터를 분석한다.

로드킬 발생 영향요인 분석 - 설악산 국립공원 44번 국도를 대상으로 - (Analysis of Influential Factors of Roadkill Occurrence - A Case Study of Seorak National Park -)

  • 손승우;길승호;윤영조;윤정호;전형진;손용훈;김민선
    • 한국조경학회지
    • /
    • 제44권3호
    • /
    • pp.1-12
    • /
    • 2016
  • 본 연구는 설악산 국립공원 내 44번 국도를 대상으로 로지스틱 회귀분석을 실시하여 로드킬이 발생한 지역의 공간적 특성을 분석하고, 분석 결과의 적합도 및 예측도를 평가하여 로드킬 발생 근본 원인을 파악하고자 하였다. 2008년부터 2013년까지 구축된 81개의 로드킬 데이터를 종속변수로 설정하고, 선행연구 및 현장조사를 통해 도출한 경사, 향, 식생, 백두대간 등의 자연환경 요인과 펜스 옹벽 등의 인공시설물, 경작지, 주거지역 등의 토지이용 변수를 독립 변수로 설정하고, 로지스틱 회귀분석을 실시하여 회귀식을 추정하였다. 식생 영급, 하천으로부터의 거리, 펜스 옹벽 등의 설치구간, 주거지역 건물 등의 시설로부터의 거리가 로드킬에 영향을 미치는 변수로 선택되었다. 회귀모형에 포함된 모든 변수들은 유의수준(p<0.01)을 충족하였다. 회귀모형에서 로드킬 발생에 가장 큰 영향력을 보인 변수는 펜스 옹벽 등의 설치구간(회귀계수: -1.0135)으로 나타났으며, 가장 낮은 영향력을 보인 변수는 식생 영급(회귀계수: 0.0001)으로 나타났다. 즉, 펜스 옹벽 등의 설치 구간에서는 로드킬이 일어날 확률이 낮으며, 주거지역 건물 등의 시설로부터의 거리가 가까울수록, 하천으로부터의 거리가 가까울수록, 식생 영급이 커질수록 로드킬 발생이 높아질 수 있다. 추정된 로지스틱 회귀모형 결과로부터 로드킬이 일어날 것이라고 옳게 예측한 확률은 74.1%, 로드킬이 일어나지 않을 것이라고 옳게 예측한 확률은 70.4%로 나타났다. 전체적으로는 옳게 분류한 확률은 72.2%로 비교적 높은 비율을 보였다. 본 연구를 통해 로드킬 저감을 위한 계획 및 정책 수립, 방지시설 설치 계획 등의 공간의사 결정에 객관적 근거로 도움을 줄 수 있을 것으로 사료된다.