• 제목/요약/키워드: binomial data

검색결과 343건 처리시간 0.025초

Sampling Based Approach for Combining Results from Binomial Experiments

  • 조장식;김달호;강상길
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권1호
    • /
    • pp.1-9
    • /
    • 2001
  • In this paper, the problem of information related to I binomial experiments, each having a distinct probability of success ${\theta}_i$, i = 1,2, $\cdots$, I, is considered. Instead of using a standard exchangeable prior for ${\theta}\;=\;({\theta}_1,\;{\theta}_2,\;{\cdots},\;{\theta}_I)$, we con-sider a partition of the experiments and take the ${\theta}_i$'s belonging to the same partition subset to be exchangeable and the ${\theta}_i$'s belonging to distinct subsets to be independent. And we perform Gibbs sampler approach for Bayesian inference on $\theta$ conditional on a partition. Also we illustrate the methodology with a real data.

  • PDF

이항-퇴화 혼합분포의 최우추정법 (Maximum likelihood estimation for a mixture distribution)

  • 황선영;손승혜;오창혁
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.313-322
    • /
    • 2015
  • 본 연구에서는 하나의 균일분포 또는 퇴화분포와 두 개의 이항분포의 혼합분포 모형에 대하여 최우추정법을 소개하며, 제시된 모형에 대하여 시뮬레이션을 통해 최우추정량의 성질을 밝히며, 실험을 통해 얻은 강의 평가 자료에 대하여 퇴화분포를 가지는 혼합분포에 대하여 적용하여 보았다. 특히 퇴화분포는 한국의 문화 특성상 가운데 값을 선호하는 현상을 모형화하는데 유용하게 사용될 수 있음을 보였다.

영과잉을 고려한 중심상업지구 교통사고모형 개발에 관한 연구 (Safety Performance Functions for Central Business Districts Using a Zero-Inflated Model)

  • 이상혁;우용한
    • 한국도로학회논문집
    • /
    • 제18권4호
    • /
    • pp.83-92
    • /
    • 2016
  • PURPOSES : The purpose of this study was to develop safety performance functions (SPFs) that use zero-inflated negative binomial regression models for urban intersections in central business districts (CBDs), and to compare the statistical significance of developed models against that of regular negative binomial regression models. METHODS : To develop and analyze the SPFs of intersections in CBDs, data acquisition was conducted for dependent and independent variables in areas of study. We analyzed the SPFs using zero-inflated negative binomial regression model as well as regular negative binomial regression model. We then compared the results by analyzing the statistical significance of the models. RESULTS : SPFs were estimated for all accidents and injury accidents at intersections in CBDs in terms of variables such as AADT, Number of Lanes at Major Roads, Median Barriers, Right Turn with an Exclusive Turn Lane, Turning Guideline, and Front Signal. We also estimated the log-likelihood at convergence and the likelihood ratio of SPFs for comparing the zero-inflated model with the regular model. In he SPFs, estimated log-likelihood at convergence and the likelihood ratio of the zero-inflated model were at -836.736, 0.193 and -836.415, 0.195. Also estimated the log-likelihood at convergence and likelihood ratio of the regular model were at -843.547, 0.187 and -842.631, 0.189, respectively. These figures demonstrate that zero-inflated negative binomial regression models can better explain traffic accidents at intersections in CBDs. CONCLUSIONS : SPFs that use a zero-inflated negative binomial regression model demonstrate better statistical significance compared with those that use a regular negative binomial regression model.

이항형 모형을 이용한 응용 소프트웨어 의 신뢰성 평가에 관한 연구 (A Study on Reliability Evaluation of Application Software using Binomial-Type Model)

  • 조성건;이상철
    • 산업경영시스템학회지
    • /
    • 제15권25호
    • /
    • pp.53-62
    • /
    • 1992
  • Computer software users develop and utilize their application software by themselves since Processing methods are different by quantity and qualify of the information The developed model needs input data and error numbers generated during the testing phases. However. total error numbers of the existing model and each error time was needed as data for developing the new model. But, maximum likelihood estimation must be used to exponential model of binomial-type and estimating of parameters by using the searched data. Parameter estimation can be done with trial and error or simulation.

  • PDF

Development of an Overseas Real Estate Valuation Model Considering Changes in Population Structure

  • Gu, Seung-Hwan;Kim, Doo-Suk;Ping, Wang;Jang, Seong-Yong
    • 유통과학연구
    • /
    • 제12권3호
    • /
    • pp.65-73
    • /
    • 2014
  • Purpose - Aging and fewer economically active people have challenged the assumption of continuous population increases. A new real estate valuation methodology reflecting changes in population structure is thus needed. Research design, data, and methodology - The relationship between demographic change and changes in real estate prices is analyzed using ordinary least squares (OLS) to estimate the parameters, and a population structure change (PSC)-Binomial Option Model is developed to assess the volatility of the estimated parameters. Results based on Seoul and Shanghai data are compared. Results - Results of the DCF method indicate that investing in Seoul is better than investing in Shanghai, but the binomial option indicates the opposite. The PSC-binomial option model, reflecting changes in population structure, yields higher values (24.6 million won in Seoul and 43.3 million won in Shanghai) than those given by the binomial option model. Conclusions - This study indicates that applying changes in population structure to existing research, such as in the binomial option model, represents a more accurate real estate valuation method. Results demonstrate that the new model is more accurate than existing models such as the DCF or binomial option.

연관규칙 마이닝에서 랜덤화를 이용한 프라이버시 보호 기법에 관한 연구 (On the Privacy Preserving Mining Association Rules by using Randomization)

  • 강주성;조성훈;이옥연;홍도원
    • 정보처리학회논문지C
    • /
    • 제14C권5호
    • /
    • pp.439-452
    • /
    • 2007
  • 본 논문에서는 랜덤화 기법을 이용한 프라이버시 보존형 데이터 마이닝(PPDM) 기술에 대하여 논한다. 계산 효율성 때문에 실용화 되지 못하고 있는 안전한 다자간 계산(SMC) 기반 PPDM은 현재의 컴퓨팅 환경에서는 실용성 없는 다분히 이론적인 것이다. 그래서 우리는 실용적인 PPDM 기술에 집중하여 가장 널리 사용되고 있는 랜덤화 기법에 대한 연구 결과를 소개한다. 특히, 랜덤화를 이용한 실용적인 PPDM 분야에서 가장 중요한 프라이버시 측도 개념을 심도 있게 분석하였으며, 연관규칙 마이닝에서의 프라이버시 보호 기술에 초점을 맞춘다. Evfimievski 등이 제안한 select-a-size 범주에 속하는 새로운 랜덤화 작용소인 binomial-selector 개념을 제안하고, 적절한 파라미터를 찾기 위한 시뮬레이션 결과를 제시한다. 기존의 cut-and-paste 랜덤화 작용소는 아이템 집합이 큰 경우에는 매우 비효율적이며 복원된 지지도의 분산이 크다는 단점을 지니고 있다. 여기에서 제안하는 binomial-selector 랜덤화 작용소는 cut-and-paste 작용소가 갖는 단점들을 보완한다.

과대산포 가산자료의 새로운 표본선택모형 (A new sample selection model for overdispersed count data)

  • 조성은;조준;김형문
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.733-749
    • /
    • 2018
  • 어떠한 연구에서 관심의 대상이 되는 관찰치가 부분적으로 관측 가능할 때 표본선택의 문제가 일어난다. 이러한 자료를 분석하기 위해 헤크만은 표본선택 모형을 개발하였고 이변량 정규분표의 가정 하에 최대우도방법을 사용하여 모수를 추정하였다. 최근 이항자료와 포아송 자료에 대한 표본선택모형이 제안되었다. 이를 분포조정에 기초하여 과대산포 자료에 대한 모형으로 확장하고자 한다. 표본선택이 없는 과대산포 자료는 흔히 음이항 분포로 분석되어진다. 따라서 음이항 분포를 이용하고 분포조정을 도입한 과대산포 자료에 대한 새로운 모형을 제시하고자 한다. 실제 자료를 이용하여 분석을 하였다. 모의실험 결과 프로파일 우도함수를 이용하여 모수에 대해 추정한 결과는 안정적이다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

도시 및 지방 회전교차로 사고 발생 모형 (Urban and Rural Roundabout Accident Occurrence Models)

  • 백태헌;임진강;박병호
    • 한국도로학회논문집
    • /
    • 제17권5호
    • /
    • pp.39-46
    • /
    • 2015
  • PURPOSES: The operational characteristics of roundabouts are generally influenced by location as well as traffic volume. The goal of this study is to develop urban and rural roundabout accident models and to discuss safety improvement guidelines based on the model. METHODS : To analyze accidents, count data models are utilized in this study. This study used accident data from 2010 to 2013 for 56 roundabouts collected from the Traffic Accident Analysis System (TASS) of Road Traffic Authority. Poisson and negative binomial regression models were developed for this study using NLOGIT 4.0. RESULTS : The main results are as follows. First, the hypotheses that there are distributional differences in the number of accidents and injuries/fatalities among rural and urban roundabouts were accepted. Second, Poisson and negative binomial regression accident models, which were all statistically significant, were developed. Seven independent variables, which were statistically significant, were adopted. Third, the common variable of models was evaluated to be traffic volume. CONCLUSIONS : This study developed two negative binomial roundabout accident models and suggested some accident reduction strategies. The results are expected to give some implications to the safety improvement of roundabout.

Recurrence Formula for the Central Moments of Number of Successes with n Poisson Trials

  • Moon, Myung-Sang
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.385-391
    • /
    • 2003
  • A sequence of n Bernoulli trials which violates the constant success probability assumption is termed as "Poisson trials". In this paper, the recurrence formula for the r-th central moment of number of successes with n Poisson trials is derived. Romanovsky's method, based on the differentiation of characteristic function, is used in the derivation of recurrence formula for the central moments of conventional binomial distribution. Romanovsky's method is applied to that of Poisson trials in this paper. Some central moment calculation results are given to compare the central moments of Poisson trials with those of conventional binomial distribution.

  • PDF