• 제목/요약/키워드: 이항 모수

검색결과 49건 처리시간 0.021초

가산자료(count data)의 과산포 검색: 일반화 과정 (Overdispersion in count data - a review)

  • 김병수;오경주;박철용
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.147-161
    • /
    • 1995
  • 생검실험에서는 다산을 통해 번식하는 쥐와 같은 설치류 동물들을 실험대상으로 하여 이항분포나 포아송분포 하에서 가산자료(count data)를 많이 생성한다. 다산을 통해 태어난 동물들을 독립적인 실험대상으로 간주하여 자료분석을 하면, 同腹仔 효과로 인해 기존의 평균과 분산사이의 관계를 벗어나는 과산포현상이 종종 나타난다. 이러한 현상을 무시했을 때 모수추정치에 대한 분산을 과소추정하고, 이로 인하여 가설검정에서 낮은 검정력을 갖게 된다. 이러한 문제점을 해결하기 위하여 최근 10년간 과산포현상을 검색하는 통계량들과 과산포를 반영하는 모형들이 제시되었는데, 이를 개관하고 이러한 절차들의 일반화 과정을 자료 유형별로 비교분석한다.

  • PDF

모비율 차이의 신뢰구간들에 대한 비교연구 (A Comparison of Confidence Intervals for the Difference of Proportions)

  • 정형철;전명식;김대학
    • 응용통계연구
    • /
    • 제16권2호
    • /
    • pp.377-393
    • /
    • 2003
  • 본 논문에서는 두 모비율의 차에 대한 기존의 신뢰구간들을 소개하고 붓스트랩 신뢰구간도 제안하였다 또한 모비율의 차에 대한 신뢰구간이 가지는 성질로서 근사신뢰구간의 하향추정의 문제와 정확신뢰구간의 상향추정의 문제점들을 확인하였고 평균포함 확률, 구간기대폭 그리고 왜도성 측면에서 종합적인 비교를 하였다. 특히 모수에 대한 사전분포를 가정하여 여러 신뢰구간들이 지니는 특징도 살펴보았다 기존의 신뢰구간들과 제안된 붓스트랩 신뢰구간은 소표본의 모의실험을 통하여 실제 포함확률의 평균을 기준으로 비교되었고 이항분포에서와 같이 정확신뢰구간이 지니는 보수성을 확인할 수 있었다. 신뢰구간의 평균포함확률의 등고선 그림도 소개하였다.

임의효과를 고려한 도심지 교차로 교통사고모형 개발에 관한 연구 (A Study on Developing Crash Prediction Model for Urban Intersections Considering Random Effects)

  • 이상혁;박민호;우용한
    • 한국ITS학회 논문지
    • /
    • 제14권1호
    • /
    • pp.85-93
    • /
    • 2015
  • 기존의 교통사고모형은 수집된 데이터에 대한 추정된 모수가 고정되어있다고 가정하여 교통량이나 기하구조의 길이와 폭 등은 설치형태와 관계없이 동일한 값을 적용하는 고정효과모형을 이용하여 개발하였다. 하지만 고정효과를 이용한 모형은 모형을 통해 추정된 계수의 표준오차 값이 과소 추정되거나 각 계수의 t-값이 과도하게 산정되어 모형의 설명력이 낮아지게 된다. 이를 극복하기 위하여 교통량, 기하구조, 그리고 관측되지 않은 다른 요인 등에 대한 이질성을 고려한 임의효과모형을 활용하여 모형을 개발할 수 있다. 본 연구에서는 임의효과모형의 효용성을 파악하고자 대전광역시 주요 89개 교차로를 대상으로 데이터를 수집하여 임의효과와 고정효과를 이용한 음이항 회귀모형을 개발하고 이를 비교 분석하였다. 모형개발 결과 년평균일교통량, 제한속도, 차로수, 우회전 전용차로 설치유무, 전방신호등 설치유무 등이 유효한 설명변수로 나타났으며 모형의 설명력을 비교해보면 로그-우도함수값이 임의효과에서 -1537.802로 고정효과의 로그-우도함수값 -1691.327보다 모형 설명력이 좋은 것으로 나타났으며 우도비의 경우 임의효과에서 0.279로 고정효과의 0.207보다 개선된 것으로 나타나 임의효과를 이용한 모형이 고정효과를 이용한 모형보다 우수한 것으로 나타났다.

유전자 프로그래밍을 이용한 고속도로 사고예측모형 (A Crash Prediction Model for Expressways Using Genetic Programming)

  • 곽호찬;김동규;고승영;이청원
    • 대한교통학회지
    • /
    • 제32권4호
    • /
    • pp.369-379
    • /
    • 2014
  • 전통적인 사고예측모형은 통계적 회귀분석에 주로 의존하였으나, 이는 자료 분포 및 함수 형태에 대한 가정에 따른 한계를 가지고 있다. 이에 따라 일부 연구는 신경망 등의 비모수적 기법을 모형 구축에 활용하였으나, 이는 독립변수와 종속변수 간의 직접적인 관계 규명이 어렵다는 한계가 있다. 유전자 프로그래밍 기법은 모형 개발에 특별한 가정이 필요없고, 사고요인 규명이 가능하다는 장점이 있다. 따라서 본 연구에서는 고속도로의 사고예측에 유전자 프로그래밍 기법을 적용함으로써 이러한 한계를 극복하고자 하였다. 이를 위하여 경부고속도로에서 최근 3년간(2010-2012년) 구득된 자료를 활용하였으며, 보다 세밀한 사고 특성 규명을 위해 고속도로 구간을 직선 구간과 곡선 구간으로 구분하였다. 사고 발생에 중요한 영향을 미치는 변수를 선택하기 위하여 랜덤 포레스트 기법을 이용하였으며, 최종 선택된 변수들을 활용하여 사고예측을 위한 유전자 프로그래밍 모형을 구축하였다. 구축된 모형의 예측 성능을 평가하기 위해 음이항 회귀모형과 비교해본 결과, 유전자 프로그래밍 모형의 예측 성능이 더 우수한 것으로 나타났다.

집계적 현시선호자료와 비집계적 진술선호자료를 이용한 화물수단선택모형 구축 (Freight Mode Choice Modelling with Aggregate RP Data and Disaggregate SP Data)

  • 강웅;이장호;박민철
    • 한국철도학회논문집
    • /
    • 제20권2호
    • /
    • pp.265-274
    • /
    • 2017
  • 본 연구는 공로로의 화물수송 편중에 따른 사회 경제적 문제를 해결하는 데 정확한 화물수요예측이 필요함에 따라 환적과 셔틀을 고려한 생산지-소비지(P-C) 자료를 활용하여 화물수단선택모형을 구축하였다. 모형은 집계적 형태의 RP 자료와 비집계적 형태의 SP 자료를 모두 활용하여 구축하였다. 철도수송이 이루어지는 주요한 품목 - 컨테이너, 양회, 철강 - 에 대하여 모형을 구축하였는데, 컨테이너는 기존의 SP기반 모형과는 달리 본 연구의 RP기반 집계모형에서는 타 품목에 비해 수송시간에 대해 민감한 것으로 나타났다. 한편, 양회와 철강은 RP, SP기반 모형 모두에서 수송비용에 민감한 것으로 나타났다. 기존의 대다수 SP기반 화물수단선택모형에서는 양회와 철강의 수단선택에서 수송시간이 일정 수준의 영향을 미친다는 것과는 다르게 본 연구의 RP기반 집계모형에서는 수송시간의 모수가 유효하지 않았다. 향후 철도수송을 보다 육성하기 위하여 컨테이너와 다른 품목간에 차별화된 전략이 필요함을 알 수 있었다.

금리수준별 금리변동성과 위험기준 자기자본제도 (Volatility by the level of interest rate and RBC)

  • 안준용;이항석;주효찬
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1507-1520
    • /
    • 2014
  • 본 연구는 금리변동성이 금리수준과 양의 상관관계가 있음을 밝힘으로써 현행 위험기준 자기자본제도 하에서 금리리스크의 측정에 사용되는 금리변동계수가 금리수준에 따라 달라질 필요가 있음을 제시한다. 이를 위해 본 연구는 국공채 금리 자료를 이용, 이자율의 역사적 변동성을 측정하여 이자율 수준과 금리변동성 간의 비례관계를 확인한다. 또한 균형이자율 모형 중 지수형 Vasicek 모형과 Cox-Ingersoll-Ross 모형을 통해 금리수준과 금리변동성의 상관관계를 분석한다. 이후 국공채 자료에 기반하여 두 이자율 모형의 모수를 추정하고 이에 따라 금리수준별 금리변동성을 측정한다. 이에 따르면 금리수준이 높을수록 금리변동성 역시 크게 나타난다. 금리가 2.8%일 경우 지수형 Vasicek 모형과 CIR 모형에서는 금리변동계수가 각각 0.9와 1.1로 현 제도 하에서 금리하락 시 적용되는 금리변동계수 1.5보다 작게 나타난다. 이는 금리리스크에 대응하여 보험사가 보유해야 하는 자기자본이 현재 수준의 60%와 73% 로 낮춰질 수 있음을 의미한다. 본 연구에서는 이러한 결과를 반영하여 수정 금리변동계수를 이자율 모형에 따라 금리수준별로 제시한다. 금리수준과 금리변동계수를 연동시킴으로써 금리리스크를 보다 합리적으로 측정하고 관리하는 방안을 제시하였다는 점에 본 연구의 의의가 있다.

범주형 자료를 포함한 다형질 임계개체모형에서 유전능력 추정 알고리즘 (Computing Algorithm for Genetic Evaluations on Several Linear and Categorical Traits in A Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권2호
    • /
    • pp.137-144
    • /
    • 2004
  • 불연속 범주형 자료에 대한 잠재변수가 존재한다는 가정하에 임계값을 추정하고 잠재변수를 생성하며 생성된 잠재변수 및 기타 연속변량에 대한 관측치를 포함하는 다변량 임계개체모형을 설정하고 유전능력을 예측하기 위한 방법을 제시하였다. 각각의 범주형 조사 자료의 특성을 갖는 형질에 있어서 임계점의 추정은 추정 가능한 임계점에 대한 1차 미분값(gradient)과 2차 미분값(Hessian)을 이용한 Newton 방법을 이용하면 추정가능하며 지역모수인 육종가의 추정은 PCG 방법으로 구현 가능하다. 이러한 이론은 Quaas(2001)가 제시한 하나의 이산형 자료와 하나의 연속형 자료의 2변량 동시 분석방법을 확장하여 전개한 것이며 이때 잠재변수 및 임계점의 추정은 기타 형질의 잔차 회귀계수 및 상관을 고려해야 한다. 본 연구를 위한 모의실험은 2개의 연속변량으로 체중과 유량을 고려하였고 또 다른 2개의 불연속 변량인 분만난이도와 출생시 생존유무를 고려하여 4형질 동시 분석을 실시하였다. 임계모형에 의한 육종가 추정치의 정확도는 4개의 구간으로 분류되어 기록된 분만난이도의 경우에 91${\sim}$92%의 정확도를 보였고 이항분포인 분만시 생존유무에 대하여는 87~89%의 정확도를 보였다. 반면에 이들 범주형 자료를 선형으로 간주하고 분석한 선형 동물개체 혼합모형에서는 72${\sim}$84% 및 59${\sim}$70%으로 비교적 낮은 추정의 정확도를 보였다. 따라서 범주형 자료의 유전분석은 선형 혼합모형 보다 임계형 혼합모형이 크게 타당할 것으로 사료되었다.

계층적 베이즈 모형을 이용한 대학등록금에 대한 부모님의 경제적 지원 영향 분석 (Effects of Financial College Tuition Support by Korean Parents using a Hierarchical Bayes Model)

  • 오만숙;오현숙;오민정
    • 응용통계연구
    • /
    • 제26권2호
    • /
    • pp.267-280
    • /
    • 2013
  • 최근 한국 사회에서 경제적, 정치적, 사회적 이슈가 되고 있는 대학 등록금의 경제적 부담에 영향을 미치는 요인들에 대한 분석을 위하여 통계청에서 실시한 '2010년도 사회조사'에서 수집된 자료를 기반으로 지역을 계층으로 하는 베이지안 계층모형을 이용한 분석을 수행하였다. 등록금의 70% 이상을 부모님이 지원하는가에 대한 이항 반응변수에 대하여 계층적 프로빗 모형을 설정한 후 설명변수들에 대한 요인분석을 실시하여 설명변수를 압축하고 마코브체인 몬테칼로 기법을 적용하여 모수를 추정하였다. 자료의 분석 결과, 많은 지역에서 소득과 정신적 스트레스 요인이 부모님의 등록금에 대한 경제적 지원과 유의한 관련이 있음을 보여주었다. 소득이 높은 부모일수록 자녀의 대학 등록금을 지원하며 부모로부터 경제적 지원을 받는 학생일수록 정신적 스트레스를 덜 받는 것으로 나타나 부모의 소득이 자녀의 정신건강에 유의한 영향을 미침을 보여 주었다. 반면에, 성별, 생활건강, 학교 만족도는 대부분의 지역에서 부모님의 등록금 지원과 유의한 관련이 없었다. 스트레스 또는 소득과 부모님의 지원에 대한 지역별 차이를 보면, 강원도 지역 학생들이 부모님의 지원이 낮을 경우 가장 정신적 스트레스를 많이 받는 것으로 나타났으며 소득이 많을수록 부모님의 지원 가능성이 높아지는 경향은 지방 행정도에 비하여 대도시에서 더 뚜렷하게 나타남을 알 수 있었다.

교통사고 추정방법 비교 연구: 경험적 베이즈 추정치 vs. 관측교통사고건수 (Comparative Study on the Estimation Methods of Traffic Crashes: Empirical Bayes Estimate vs. Observed Crash)

  • 신강원
    • 대한토목학회논문집
    • /
    • 제30권5D호
    • /
    • pp.453-459
    • /
    • 2010
  • 교통안전연구에서 한 지점 (또는 구간)의 기대교통사고건수를 신뢰성 높게 추정하는 것은 매우 중요하다. 기대교통사고건수를 추정하기 위해 현재 국내에서는 주로 관측교통사고건수를 사용하고 있으나 국외에서는 포아송-감마 혼합모형에 기반한 경험적 베이즈 추정치를 활용하고 있는 추세이다. 그간 많은 연구들이 경험적 베이즈 추정치를 이용해 기대교통사고건수 추정 및 교통안전개선사업의 평가를 시도 하였으나 전술한 2가지 추정방법의 추정오차를 비교연구한 문헌은 없는 실정인 바 본 연구는 2가지 추정방법의 추정오차를 모의실험을 통해 비교 분석하여 제시하였다. 모의 발생된 총 3,000,000개 지점의 교통사고 자료를 분석한 결과 기대교통사고건수를 경험적 베이즈 추정방법을 이용해 추정했을 경우 그 추정오차는 관측교통 사고건수만을 이용했을 때 발생하는 추정오차에 비해 항상 작은 것으로 나타나 국내의 교통안전연구 가이드라인에 경험적 베이지안 추정방법의 도입이 필요할 것으로 판단된다. 그러나 사전분포의 불확실성이 높아질수록 두 가지 추정방법의 추정오차의 차이는 감소하는 것으로 나타나, 기대교통사고건수 추정 시 추정된 음이항 모형에 대한 종합적인 검증을 수행한 후 신뢰성 있는 초모수의 추정치를 이용해 경험적 베이지안 방법을 적용하는 것이 바람직하다고 판단된다.