• 제목/요약/키워드: 프로빗 모형

검색결과 105건 처리시간 0.014초

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

가우시안 과정 분류에 대한 변분 베이지안 다항 프로빗 모형: 쥐 단백질 발현 데이터에의 적용 (Variational Bayesian multinomial probit model with Gaussian process classification on mice protein expression level data)

  • 손동현;황범석
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.115-127
    • /
    • 2023
  • 다항 프로빗 모형은 다중 분류와 선택 모형에서 흔히 사용하는 모형이다. 다항 프로빗 모형을 추정하기 위해 일반적으로 널리 사용하는 베이지안 접근법인 마르코프 연쇄 몬테카를로(MCMC) 방법은 계산 복잡도가 매우 높다는 문제점을 가지고 있다. 반면, 변분 베이즈 방법은 MCMC 방법보다 계산 복잡도는 낮으면서도 분류 성능적인 면에서 큰 차이가 나지 않아 더 효율적인 방법으로 알려져 있다. 본 연구에서는 가우시안 과정에 기반한 다항 프로빗 모형을 설명하고 해당 모형에 적용할 수 있는 변분 베이지안 근사법을 알아보고자 한다. 그리고 UCI에서 제공되는 쥐 단백질 발현 데이터에 가우시안 과정 분류에 대한 변분 베이지안 다항 프로빗 모형을 적용하여 그 성능을 확인하고 나이브 베이즈, K-최근접 이웃법, 서포트 벡터 머신 분류기의 성능과 비교한다.

순위 프로빗 모형을 활용한 정부연구개발투자 수혜 기업의 특성 분석

  • 이동욱
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2012년도 춘계 학술대회 논문집
    • /
    • pp.45-53
    • /
    • 2012
  • 본 연구에서는 정부의 R&D 투자를 받는 기업들의 특성을 규명하였다. 정부의 투자 행태를 반영하기 위해 순위 프로빗 모형(ordered probit)을 사용하였으며, 기업의 특성과 과제의 특성을 함께 고려함으로써 정부 정책의 실효성과 정합성을 분석하였다. 분석 결과 대기업, 매출액이 큰 기업, R&D집약도가 높은 기업, 벤처기업 등이 정부 R&D 투자를 많이 받는 것으로 나타났다. 기업특성과 과제 특성을 함께 분석한 결과, 중소기업이 신성장동력, 녹색기술 등에 대한 투자를 많이 받은 것으로 나타났다. 기업에 대한 투자가 개발연구 위주로 추진된 것은 합당하나, 대기업 중심, 성장기 기술 중심의 편중 현상은 개선의 여지가 있는 것으로 보인다.

  • PDF

영 과잉 순서적 프로빗 모형을 이용한 한국인의 음주자료에 대한 베이지안 분석 (Bayesian Analysis of Korean Alcohol Consumption Data Using a Zero-Inflated Ordered Probit Model)

  • 오만숙;오현탁;박세미
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.363-376
    • /
    • 2012
  • 순서적 다항 반응변수의 경우 종종 과도하게 많은 수의 관측치가 0 범주에서 발생하는 영 과잉 특성을 지닌다. 이러한 영 과잉 자료에서 0범주를 발생시키는 요인이 여러 개 존재할 때 일반적인 순서적 프로빗 모형은 자료를 설명함에 있어서 한계를 지닌다. 본 논문에서는 영 과잉 특성을 반영한 이 단계 영 과잉 순서적 프로빗 모형의 베이지안 분석기법을 제시하고 이를 2008년도 통계청에서 조사한 한국인의 음주소비 자료에 적용시킨다. 첫 번째 단계에서는 음주소비가 하나도 없다고 답한 0 범주에 속하는 비음주자들을 신념 또는 영구적 건강상의 문제 등으로 상황에 관계없이 음주를 하지 않는 절대적 비음주자(genuine non-drinker, non-participant)와 현재 소비가 없지만 상황에 따라 음주자가 될 가능성이 있는 잠재적 음주자(zero consumption potential drinker)로 구분하는 프로빗 모형을 적용시켜 분석한다. 두 번째 단계에서는 잠재적 음주자와 1 이상의 범주에 속하는 실제적 음주자를 합하여 음주자 집단으로 보고 이에 대하여 순서적 프로빗 모형을 적용하여 분석한다. 분석결과, 비음주자 중 약 30%가 절대적 비음주자로 음주자료가 일반적 순서적 자료에 비하여 뚜렷한 영 과잉 특성을 가짐을 알 수 있었다. 각 변수의 한계효과를 분석함으로써 같은 설명변수가 절대적 비음주자와 잠재적 음주자에 미치는 영향이 서로 반대로 나타날 수 있음을 발견하였고, 따라서 한국인의 음주자료에 대하여 제안된 영 과잉 순서적 프로빗 모형이 유용함을 보여주었다.

이산프로빗모형에서 소비자선호의 동태성 (Dynamics of Consumer Preference in Binary Probit Model)

  • 주영진
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.210-219
    • /
    • 2010
  • 본 연구에서는 선택모형을 이용하여 소비자패널자료를 분석함에 있어 시간의 흐름에 따라 동적(dynamic)으로 변화하는 소비자내부의 특성 차이를 반영한 특정소비자의 종적인 변화인 소비자동태성을 분석하였다. 선택모형 내에서 소비자동태성은 효용함수에 시변계수(time-varying coefficient)를 도입함으로써 표현될 수 있다. 본 연구에서는 이를 위해 계층적모형(hierarchical model)과 상태공간모형(state-space model)에 기반하여 Random-Walk 계수를 지니는 이산프로빗모형을 개발하였고, 개발된 모형을 패널자료로부터 추정하기 위하여 Gibbs 표본법을 적용하였다. 모형추정결과 효용함수의 시변계수들에 유의한 소비자동태성이 존재함을 확인할 수 있었다. 소비자동태성이 존재할 경우 이에 효과적으로 대응하기 위해서는 동적시장세분화가 필요하다고 할 수 있다.

순서형 프로빗 모형을 이용한 사고심각도 분석 (The Study on the Accident Injury Severity Using Ordered Probit Model)

  • 하오근;오주택;원제무;성낙문
    • 대한교통학회지
    • /
    • 제23권4호
    • /
    • pp.47-55
    • /
    • 2005
  • 최근 폭등하는 자동차의 이용과 교통사고의 증가는 물적 손실이란 측면에서 뿐만 아니라, 국민의 기본 생활권을 위협한다는 측면에서 교통사고를 줄이기 위한 많은 노력이 요구된다. 특히, 일반 도로구간에 비해 사고의 잠재성이 상대적으로 높은 교차로의 경우 이에 대한 적절한 대책이 필요하다. 이를 위해 본 연구에서는 교차로 교통사고에 있어서 사고 심각도에 영향을 미치는 요인들을 분석하고 이를 통하여 교차로 안전성 향상에 기여하고자 한다. 사고 심각도 분석에 있어서 사고 자료의 특성을 고려하여 순서형 확률모형 중 적절한 모형을 적용하였다. 데이터의 ${\epsilon}_i$(오차항)의 분포를 정규분포로 가정하여 순서형 프로빗 모형을 적용하였고 모형의 설명력과 적합성을 나타내는 $p^2$(우도비)와 $x^2$(Chi-square)의 값을 이용하여 최적의 사고 심각도 모형을 개발하였다. 개발된 심각도 모형을 분석한 결과, 교차로 교통사고 심각도에 영향을 미치는 변수는 부도로 교통량, 주도로 중차량 비율, 주도로 우회전 비율, 주도로 조명시설, 주도로 제약시설, 부도로 좌회전 유도선 등으로 분석되었다.

금리스프레드를 이용한 신흥경제 국가의 불황 예측: 국면 전환 모형 vs. 프로빗 모형 (Predicting Recessions Using Yield Spread in Emerging Economies: Regime Switch vs. Probit Analysis)

  • 박기현
    • 국제지역연구
    • /
    • 제16권3호
    • /
    • pp.53-73
    • /
    • 2012
  • 본 논문에서는 금리 스프레드가 두 아시아 국가의 경기불황을 예측할 수 있는가를 살펴보았다. 이를 위해 세계시장에 상대적으로 개방이 많이 되어 있고 무역활동이 활발한 두 개의 신흥경제국가인 한국과 태국을 선정 하였다. 본 논문에서는 두 개의 국면(Two-regime Markov-Switching model)과 세 개의 국면(Three-regime Markov-Switching model)이 있는 마코프 국면 전환 모형을 이용하여 아시아 경제위기의 불황확률을 추정해 보았다. 추정결과 태국의 금리스프레드는 태국의 불황 확률을 반영하였으나 한국의 금리스프레드는 불황 예측을 하지 못하는 것으로 나타났다. 또한, 세 개의 국면이 있는 모형이 두 개의 국면 있는 모형보다 아시아 금융위기의 불황예측에서 우수함을 밝혔다. 또한 본 논문에서는 경기상승과 경기불황이 있을 때 얼마나 지속되는가의 지속성(Duration)을 추정하였다. 이는 경기가 불황으로 움직일 때는 생산이 급격히 감소하는 반면 저점을 찍고 경기가 살아날 때는 생산이 천천히 오른다는 경기불황과 호황의 비대칭적 움직임을 테스트 하였다. 한편 마코프 국면 전환 모형의 결과와 전통적으로 많이 사용되어 왔던 프로빗(Probit) 모형의 결과를 비교 분석 하였다. 마코프 국면전환 모형이 프로빗 모형보다 경기변동의 예측력을 크게 향상시키지는 못하는 것으로 나타났다.

한국 프로야구의 승률 추정 (The estimation of winning rate in Korean professional baseball league)

  • 김순귀;이영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.653-661
    • /
    • 2016
  • 본 연구에서는 한국 프로야구의 승률을 추정하기 위하여 야구 경기의 피타고라스 정리라고 불리우는 방법을 사용하였고, 이 방법을 확장한 일반화 피타고라스 정리도 이용하면서 일반화 피타고라스 정리의 최적 지수 값을 찾아보았다. 그리고 다른 추정 방법들인 로지스틱 모형과 프로빗 모형의 사용을 제안하였다. 평균제곱오차의 제곱근 (RMSE)을 판정기준으로, 피타고라스 정리와 제안된 모형들의 효율성을 서로 비교하였다. 사용한 자료는 1982년부터 2015년 7월까지의 모든 한국 프로야구 기록이며, 제안한 방법은 일반화 피타고라스 정리를 이용한 승률 추정 방법보다 평균제곱오차의 관점에서 다소 나아졌음을 보여준다.