• 제목/요약/키워드: 로지스틱모형

검색결과 541건 처리시간 0.024초

로지스틱 회귀분석과 의사결정나무 분석을 이용한 일 대도시 주민의 우울 예측요인 비교 연구 (Comparative Analysis of Predictors of Depression for Residents in a Metropolitan City using Logistic Regression and Decision Making Tree)

  • 김수진;김보영
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.829-839
    • /
    • 2013
  • 본 연구는 로지스틱 회귀분석과 의사결정나무 분석을 활용하여 일 대도시 주민의 우울에 영향을 주는 요인을 예측하고 비교하고자 시도된 서술적 조사연구이다. 연구대상은 20세에서 65세 미만의 일 대도시 주민 462명이었다. 자료 수집은 2011년 10월 7일부터 10월 21일까지이었으며, 자료 분석은 SPSS 18.0 프로그램을 이용하여 빈도, 백분율, 평균과 표준편차 및 ${\chi}^2$-test, t-test, 로지스틱 회귀분석, roc curve, 의사결정나무 분석으로 분석하였다. 본 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었다. 로지스틱 회귀분석에서 특이도 93.8%, 민감도 42.5%이었고, 본 연구의 모형 적합도를 roc curve 검증 한 결과 AUC=.84으로 본 연구 모형은 적합(p=<.001)하다고 할 수 있다. 우울예측에 대한 의사결정나무 분석은 분류에 대한 예측 정확도에서 특이도 98.3%, 민감도 20.8%이었고, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5% 이었다. 본 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 사료된다.

Selecting the Best Soil Particle-Size Distribution Model for Korean Soils

  • 황상일
    • 환경정책연구
    • /
    • 제2권1호
    • /
    • pp.77-86
    • /
    • 2003
  • 입도분포는 토양의 수리특성을 추정하는 데 많이 사용되고 있다. 본 연구는 다양한 가정조건을 가진 9개의 입도분포모형을 가지고 한국토양을 대상으로 어떤 모형이 가장 잘 입도분포를 모사하는지를 조사하였다. 4개의 추정변수를 가진 Fredlund모형, 로지스틱성장곡선, 그리고 Weibull분포가 다른 모형에 비해 PSD를 잘 모사하였다. 특히 추정변수가 없는 로지스틱 성장곡선 함수가 좋은 모사를 나타낸 것이 흥미로웠다.

  • PDF

데이터마이닝 기법을 이용한 주가자료 분석

  • 손인석;황창하;조길호;김태윤
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.99-104
    • /
    • 2001
  • 본 연구의 주된 목표는 1997년 주가자료를 데이터마이닝 기법인 로지스틱모형, 의사결정트리, 신경망, SVM(support vector machine), 뉴로퍼지모형을 사용하여 분석한 후 우리나라 경제상황을 진단하고 예측하는데 가장 적합한 모형을 찾고 그 모형을 해석하는데 있다. 1997년 주가자료를 훈련자료로 간주하여 그 당시 경제 상황에 따라 적절한 구간으로 나누고 훈련시킨 결과 중요한 변수로는 주가지수, 등락률 10일 이동분산, 10일 이동분산의 변동비로 나타났으며 적절한 기법으로는 의사결정트리, 신경망, SVM임을 알 수 있다. 1997년 이외의 주가자료를 데이터마이닝 기법(신경망, 의사결정트리, SVM)에 적용한 결과, 우리나라 경제상황을 고려해 볼 때 신경망이 가장 정확도가 좋은 기법으로 보여진다.

  • PDF

로지스틱회귀모형의 로버스트 추정을 위한 알고리즘 (Algorithm for the Robust Estimation in Logistic Regression)

  • 김부용;강명욱;최미애
    • 응용통계연구
    • /
    • 제20권3호
    • /
    • pp.551-559
    • /
    • 2007
  • 로지스틱회귀에서 일반적으로 사용되는 최대우도추정법은 이상점에 대해 로버스트 하지 않다. 따라서 본 논문에서는 로지스틱회귀모형의 로버스트 추정을 위한 알고리즘을 제안하고자 한다. 이 알고리즘은 V-마스크 형태의 경계기준에 의해 나쁜 지렛점과 수직이상점을 식별하고, 식별 결과를 바탕으로 이상점의 영향력을 감소시키기 위한 효과적인 방안을 모색한다. 이상점의 영향력 감소는 가중치와 조정치를 적절히 선정함으로 가능하며, 그 결과 붕괴점이 높은 추정치를 얻게 된다. 제안된 알고리즘을 다양한 자료에 적용하여 정분류율을 측정하여 비교하였는데, 새로운 알고리즘이 최대우도추정보다 정확한 분류를 해 주는 것으로 평가되었다.

카테고리별 다중회귀분석 방법을 이용한 지하철역별 수요 추정 모형 개발 (Modelling the Subway Demand Estimation by Station Using the Multiple Regression Analysis by Category)

  • 손의영;권병우;이만호
    • 대한교통학회지
    • /
    • 제22권1호
    • /
    • pp.33-42
    • /
    • 2004
  • 지하철역별 수요는 개통 후 경과 연도에 따라서 S자 형태로 증가한다. 즉 개통 초기에는 잠재되어 있던 지하철 수요가 시간의 경과에 따라 계속적으로 증가하다가, 개통 후 10$\sim$13년 정도가 경과하면 최대를 나타낸 후 거의 정체하는 현상을 보인다. 그러나 지금까지 지하철 수요를 추정하기 위해서 이용되었던 4단계 모형은 이러한 지하철 수요의 증가 추세를 반영할 수 없기 때문에 실제 수요와 많은 차이를 보였다. 따라서 본 연구에서는 이러한 문제를 해결해 보고자 서울시 지하철 2$\sim$8호선의 실제 수요를 토대로 지하철역별 수요, 특히 순수한 승차인원을 추정하는 모형을 개발하였다. 모형에 적용되는 함수식은 실제 지하철역별 수요와 가장 유사한 형태를 보이고 있는 로지스틱 함수식을 이용하였다. 또한 각각의 지하철역별로 나타나는 상이한 특성은 카테고리로 분류하여 모형에 반영하였다. 카테고리는 토지이용도, 사회경제활동의 규모, 그리고 지하철역의 특성에 따라 분류하였다. 각 카테고리별 특성을 대표하는 독립 변수로 인구 종사자수, 학생수와 개통 후 경과 연도 등을 선정하였다. 그 결과 카테고리별로 추정된 지하철역별 수요는 통계적으로 매우 유의한 것으로 나타났다. 본 연구는 지하철역별로 승차하는 순수한 수요를 보다 정확하게 추정하기 위한 모형을 개발하는 것이 주된 목적이다. 반면에 본 모형을 이용하여 지하철역별 하차 수요 및 횐승 수요를 추정하는 것은 어렵다. 따라서 기존에 지하철 수요를 추정하는 데에 가장 많이 사용된 4단계 모형과 접목하여야 하며, 이에 대한 방안도 본 연구에서 제시하였다.

출발지 공간 연관성을 고려한 지역별 수단선택확률 추정 연구 (Estimating Probability of Mode Choice at Regional Level by Considering Spatial Association of Departure Place)

  • 엄진기;박만식;허태영
    • 한국철도학회논문집
    • /
    • 제12권5호
    • /
    • pp.656-662
    • /
    • 2009
  • 일반적으로 교통수단선택 모형은 이용자의 인구 및 개인통행특성 등을 반영한 수단별 선호도를 효용함수로 구축하여 분석하고 있다. 본 연구에서는 이용자의 출발지에 대한 공간적 연관성을 수단선택모형에 고려한 방법을 제시하였다. 이를 위하여 공간적 연관성을 포함하는 공간로지스틱 회귀모형을 고려하였다. 신뢰성있는 추정값을 얻기 위해 베이지안 기법을 적용하였으며 이 연구에서 제시한 방법론은 수단선호도 조사가 이루어지지 않은 지역에 대해서도 수단분담률을 추정할 수 있을 것으로 기대된다.

지진 재현수준 예측에 대한 로그-로지스틱 분포와 일반화 극단값 분포의 비교 (Comparison of log-logistic and generalized extreme value distributions for predicted return level of earthquake)

  • 고낙경;하일도;장대흥
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.107-114
    • /
    • 2020
  • 자연 재해로부터 관측되는 자료를 대상으로 재현 수준 예측 등과 같은 자료 분석을 위해 일반화 극단값 분포(generalized extreme value)가 자주 사용되어 왔다. 표본 수가 충분히 큰 경우 연속적인 블록 최댓값들은 점근적으로 일반화 극단값 분포를 따른다. 하지만 소표본인 경우 이러한 사실은 성립되지 않을 수도 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 모형 적합도 검정 및 모형 선택을 통해 로그-로지스틱(log-logistic) 분포의 사용을 제안한다. 하나의 예증으로서 중국 지진 자료를 대상으로 하여 로그-로지스틱 분포를 이용하여 재현 기간별 재현 수준 예측 및 신뢰구간을 제시한다.

한국국민의 가계 금융부채에 대한 체감도 분석 (Analysis of Stress level of Korean Household Members due to Household Debt)

  • 오만숙;현승미
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.297-307
    • /
    • 2009
  • 최근 금융위기의 요인이 되고 있는 가계부채에 대하여 가계구성원이 느끼는 부담감, 즉, 가계부채에 대한 체감도에 가계구성원의 속성들(주택점유형태, 가구주 학력, 가구주 연령, 월소득, 거주지역)이 미치는 영향을 2004년도 국민은행이 조사한 실제자료를 가지고 분석하였다. 체감도를 부채에 대한 부담감이 낮음과 높음의 이항자료로 구분하여 가계구성원의 속성들을 설명변수로 갖는 로지스틱 회귀분석을 수행하였다. 적합도에 대한 우도비 통계량을 이용한 후진제거법을 사용하여 간단하면서도 자료를 잘 적합시키는 모형을 선택한 결과 2개의 2차 교호작용을 갖는 모형이 선택되었다. 선택된 모형에 대한 계수 추정치를 통하여 각 속성이 부채 체감도에 대하여 미치는 영향을 분석하였다. 또한 가계부채의 유무에 대하여 가계구성원의 속성들이 미치는 영향을 로지스틱 회귀모형을 통하여 유사한 방법으로 분석하였다 자가주택일수록, 월소득이 증가할수록, 가구주 학력이 낮을수록 그리고 가구주 연령이 낮아질수록 부채에 대한 체감도가 낮아짐을 알 수 있었다.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

충청권 소재 제조업체들의 현금 유동성 수준에 대한 재무적 분석 (Financial Factors Influencing Corporate Cash Reserves of Firms in Chungcheong Province in the Korean Capital Markets)

  • 김한준
    • 한국산학기술학회논문지
    • /
    • 제18권1호
    • /
    • pp.679-687
    • /
    • 2017
  • 본 논문의 주제는 국내 자본시장에서 충청권에 본사가 위치한 기업들, 그 중, KOSDAQ 상장 회사들에 대한, 현금유동성 수준에 대한 재무적 결정요인 분석에 대한 실증연구이다. 본 연구를 수행하게 된 주요 동기로는 국제금융위기 이후, 동 표본회사들을 활용한 국내,외 연구들이 현재까지 미약한 수준이라고 판단되며, 현재 충청권 지역이 행정의 중심지로서의 확대와 인구통계학적 견지에서 점증적으로 수도권 등으로 부터의 동 지역으로의 인구 증가도 예상이 될 수 있다는 점 등이 요인들이다. 이러한 가정 하에서, 동 지역 자본시장 기반의 지속적인 학술 연구가 더욱 필요한 시점이라고 판단된다. 본문에서는 3가지의 가설들이 상대적 강건성을 보유한다고 판단되는 계량경제적 모형들 (즉, 정태적 패널자료모형, 토빗모형, 그리고 로지스틱모형 등)을 이용하여 검정이 되었다. 정태적 패널자료모형을 적용한 첫 번째 가설검정 결과와 관련, 동 모형에 입력된 총 9개의 설명변수들 중, 5개의 번수들 (즉, 매출채권회수기간, 유동비율, 부채비울, 매출액순이익률, 그리고 매출액)이 동 표본기업들의 현금유동성 수준에 통계적 유의성을 주는 변수들로 판명되었다. 추가적으로, 로지스틱모형을 활용한 가설검정과 관련하여, 총 설명변수들 중, 오직 2개의 변수들 (즉, 부채비율과 외국인지분율)만이 충청권 내의 2개의 행정지역인 충청북도와 충청남도 (대전시, 세종특별자치시 포함)에 각각 본사를 둔 기업들의 현금유동성 수준에 통계적 차별성을 주는 유의 변수들로 판명되었다. 본 연구결과의 학문적 그리고 실무적 관점에서의 기여점과 관련하여, 본 연구에서 유의성있는 변수들로 판명된 재무적 결정요인들을 향후 활용하여, 기업의 이윤 극대화를 위한 '최적 현금유동성 수준'에 대한 점진적 접근 가능성에 대한 추가 분석도 가능할 것으로 판단된다.