• Title/Summary/Keyword: 다항 분포

Search Result 52, Processing Time 0.019 seconds

희박다항분포확률에 대한 국소최대우도 추정량

  • Baek, Jang-Seon
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.29-34
    • /
    • 2002
  • $p=(p_{}1,p_{2},{\cdots},p_{k})^{T}$의 확률벡터를 가진 다항분포로부터 관측된 칸 돗수(cell frequency) 벡터가 $N=(N_{1},N_{2},{\cdots},N_{k})^{T}$이며 ${\sum}{\limits}_{j=1}^{k}N_{j}=n$이라 하자. 총돗수 n이 칸의 총갯수 k에 비하여 상대적으로 매우 작을 때 이러한 이산형 자료를 희박다항분포자료(sparse multinomial data)라 한다. 이러한 희박다항분포자료의 칸들이 순서화 되어 있을 때 우리는 i번째 칸의 확률 $p_{i}$를 돗수 추정량 $N_{j}/n$ 들을 평활함으로써 추정 할 수 있다. Aerts, et al.(1997)과 Baek(1998) 등에 의해 제안된 국소최소제곱기준에 근거한 국소다항커널추정량은 희박점근일치성의 좋은 성질을 가짐에도 불구하고 확률추정지가 음수값을 가질 수 있는 단점을 내포하고 있다. 본 연구에서는 이러한 단점을 극복하기 위하여 국소최대우도 기준에 근거한 새로운 커널추정량을 제안하고, 그것의 점근적 성질을 연구하였다.

  • PDF

유사이항분포와 유사다항분포의 통계적 성질

  • An, Seong-Jin;Jeong, Yeon-Seon
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.111-119
    • /
    • 2004
  • 유사이항분포와 유사다항분포를 소개하고 베타분포와 Dirichlet 분포와의 관계를 밝힘으로써 심플렉스상에서 정의되는 성분데이터의 분석을 위한 새로운 방법을 제시하는 토대를 마련하고자 한다.

  • PDF

A comparative study of feature screening methods for ultrahigh dimensional multiclass classification (초고차원 다범주분류를 위한 변수선별 방법 비교 연구)

  • Lee, Kyungeun;Kim, Kyoung Hee;Shin, Seung Jun
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.5
    • /
    • pp.793-808
    • /
    • 2017
  • We compare various variable screening methods on multiclass classification problems when the data is ultrahigh-dimensional. Two different approaches were considered: (1) pairwise extension from binary classification via one versus one or one versus rest comparisons and (2) direct classification of multiclass responses. We conducted extensive simulation studies under different conditions: heavy tailed explanatory variables, correlated signal and noise variables, correlated joint distributions but uncorrelated marginals, and unbalanced response variables. We then analyzed real data to examine the performance of the methods. The results showed that model-free methods perform better for multiclass classification problems as well as binary ones.

Comparison of Goodness-of-Fit Tests using Grouping Strategies for Multinomial Logit Regression Model (다항 로짓 회귀모형에서의 그룹화 전략을 이용한 적합도 검정 방법 비교)

  • Song, Mi Kyung;Jung, Inkyung
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.6
    • /
    • pp.889-902
    • /
    • 2013
  • Several goodness-of-fit test statistics have been proposed for a multinomial logit regression model; however, the properties of the proposed tests were not adequately studied. This paper evaluates three different goodness-of-fit tests using grouping strategies, proposed by Fagerland et al. (2008), Bull (1994), and Pigeon and Heyse (1999). In addition, Pearson (1900)'s method is also examined as a reference. Simulation studies were conducted to evaluate the four methods in terms of null distribution and power. A real data example is presented to illustrate the methods.

다항지수 신뢰도 함수

  • Choi, Gyu-Sik
    • Proceedings of the Korea Society of Information Technology Applications Conference
    • /
    • 2007.05a
    • /
    • pp.103-108
    • /
    • 2007
  • 다항지수 신뢰도 함수(multinomial-exponential reliability function ; MERF) 는 소프트웨어의 고장/수정 공정을 세밀하게 수행하는 중에 개발되는 관계에 있다. 후에 MERF는 좀더 매우 단순화한 지수 신뢰도 함수(exponential reliability function ; EARF)로 근사화되는 공정을 거치게 된다. 이는 MERF의 특성을 대부분 가지고 있어서 두 개의 함수가 하나의 신뢰도 함수로 단일화되도록 한다. 신뢰도 모델 MERF/EARF는 소프트웨어 고장 공정을 NHPP로, 수정공정을 다항분포로 고려한다. 이 모텔은 두 개의 공정 모두가 통계적 독립인 것으로 간주한다. 본 논문에서는 모델의 이론적인 기준, 수학적 특성, 소프트웨어 신뢰도에의 응용을 검토한다. 이는 물리적 인 시스템을 검사하고 유지보수하는 선도적인 모델응용이다. 본 논문에는 소프트웨어 신뢰도 분석에 응용하는 하나의 수치 예를 포함한다.

  • PDF

Time-varying modeling of the composite LN-GPD (시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정)

  • Park, Sojin;Baek, Changryong
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.1
    • /
    • pp.109-122
    • /
    • 2018
  • The composite lognormal-generalized Pareto distribution (LN-GPD) is a mixture of right-truncated lognormal and GPD for a given threshold value. Scollnik (Scandinavian Actuarial Journal, 2007, 20-33, 2007) shows that the composite LN-GPD is adequate to describe body distribution and heavy-tailedness. This paper considers time-varying modeling of the LN-GPD based on local polynomial maximum likelihood estimation. Time-varying model provides significant detailed information of time dependent data, hence it can be applied to disciplines such as service engineering for staffing and resources management. Our work also extends to Beirlant and Goegebeur (Journal of Multivariate Analysis, 89, 97-118, 2004) in the sense of losing no data by including truncated lognormal distribution. Our proposed method is shown to perform adequately in simulation. Real data application to the service time of the Israel bank call center shows interesting findings on the staffing policy.

Testing of a discontinuity point in the log-variance function based on likelihood (가능도함수를 이용한 로그분산함수의 불연속점 검정)

  • Huh, Jib
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.1
    • /
    • pp.1-9
    • /
    • 2009
  • Let us consider that the variance function in regression model has a discontinuity/change point at unknown location. Yu and Jones (2004) proposed the local polynomial fit to estimate the log-variance function which break the positivity of the variance. Using the local polynomial fit, Huh (2008) estimate the discontinuity point of the log-variance function. We propose a test for the existence of a discontinuity point in the log-variance function with the estimated jump size in Huh (2008). The proposed method is based on the asymptotic distribution of the estimated jump size. Numerical works demonstrate the performance of the method.

  • PDF

An Analysis of Distributed Lag Effects of Expenditure by Type of R&D on Scientific Production: Focusing on the National Research Development Program (연구개발단계별 연구개발투자와 논문 성과 간의 시차효과 분석: 국가연구개발사업을 중심으로)

  • Pak, Cheol-Min;Ku, Bon-Chul
    • Journal of Korea Technology Innovation Society
    • /
    • v.19 no.4
    • /
    • pp.687-710
    • /
    • 2016
  • This study aims to empirically estimate distributed lag effects of expenditure by type of R&D on scientific publication in the national R&D program. To analyze the lag structure between them, we used a dataset comprised of panel data from 104 technologies categorized by 6T (IT, BT, NT, ST, ET, CT) from 2007 to 2014, and employed multiple regression analysis based on the polynomial distributed lag model. This is because it is highly likely to emerge multicollinearity, if a distributed lag model without special restrictions is applied to multiple regression analysis. The main results are as follows. In the case of basic research, its lag effects are relatively evenly distributed during four years. On the other hand, the applied research and experimental development have distributed lag effects for three years and two years respectively. Therefore, when it comes to analyzing performance of scientific publication, it is necessary to be performed with characteristics of the time lag by type of R&D.

양방향 분포 함수가 적용된 달의 3D 광학 모델

  • Yu, Jin-Hui
    • Bulletin of the Korean Space Science Society
    • /
    • 2011.04a
    • /
    • pp.31.3-31.3
    • /
    • 2011
  • 달의 양방향 분포 함수는 Hapke에 의하여 처음 이론적 모델이 만들어졌고, 이후 Foote에 의해 아폴로 11호의 달 토양 샘플 10084의 양방향 분포 함수가 측정된 바 있다. 이 연구에서는 실제 크기의 달의 표면에 Hapke의 양방향 분포 함수를 적용하여 광학 모델은 개발하였다. 달 표면의 산란특성 중 반 무한하고 매끄러운 지면에 적용되는 후방산란 효과와 산란각에 따른 위상 함수가 적용된 모델이 사용되었으며, 위상함수로는 Henyey-Greenstein 함수가 사용되었다. 달의 3D 모델에 사용된 매개 변수는 Foote가 측정한 Hapke의 변수를 따랐으며 달의 단일 산란 알베도는 w=0.33, 핫스팟의 넓이는 h=0.017, Legendre 다항 계수인 b와 c에는 각각 b=0.308, c=0.425의 값이 사용되었다. 구성된 달의 양방향 분포 함수를 이용한 통합적 광선 추적 수치 모사 결과, 달 반사광의 복사 휘도율은 1차 근사 해석적 방법을 이용한 계산 결과의 복사 휘도율과 측정 오차 범위 이내의 오차를 보였다.

  • PDF

On the Small Sample Distribution and its Consistency with the Large Sample Distribution of the Chi-Squared Test Statistic for a Two-Way Contigency Table with Fixed Margins (주변값이 주어진 이원분할표에 대한 카이제곱 검정통계량의 소표본 분포 및 대표본 분포와의 일치성 연구)

  • Park, Cheol-Yong;Choi, Jae-Sung;Kim, Yong-Gon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.11 no.1
    • /
    • pp.83-90
    • /
    • 2000
  • The chi-squared test statistic is usually employed for testing independence of two categorical variables in a two-way contingency table. It is well known that, under independence, the test statistic has an asymptotic chi-squared distribution under multinomial or product-multinomial models. For the case where both margins fixed, the sampling model of the contingency table is a multiple hypergeometric distribution and the chi-squared test statistic follows the same limiting distribution. In this paper, we study the difference between the small sample and large sample distributions of the chi-squared test statistic for the case with fixed margins. For a few small sample cases, the exact small sample distribution of the test statistic is directly computed. For a few large sample sizes, the small sample distribution of the statistic is generated via a Monte Carlo algorithm, and then is compared with the large sample distribution via chi-squared probability plots and Kolmogorov-Smirnov tests.

  • PDF