• 제목/요약/키워드: Goodness-of-fit Test

검색결과 426건 처리시간 0.022초

계량서지적 분석에서 지적구조 매핑을 위한 링크 삭감 알고리즘의 적합도 측정 (Measuring the Goodness of Fit of Link Reduction Algorithms for Mapping Intellectual Structures in Bibliometric Analysis)

  • 이재윤
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.233-254
    • /
    • 2022
  • 지적구조 분석을 위해 가중 네트워크를 시각화해야 하는 경우에 패스파인더 네트워크와 같은 링크 삭감 알고리즘이 널리 사용되고 있다. 이 연구에서는 네트워크 시각화를 위한 링크 삭감 알고리즘의 적합도를 측정하기 위한 지표로 NetRSQ를 제안하였다. NetRSQ는 개체간 연관성 데이터와 생성된 네트워크에서의 경로 길이 사이의 순위 상관도에 기반하여 네트워크의 적합도를 측정한다. NetRSQ의 타당성을 확인하기 위해서 몇 가지 네트워크 생성 방식에 대해 정성적으로 평가를 했었던 선행 연구의 데이터를 대상으로 시험적으로 NetRSQ를 측정해보았다. 그 결과 품질이 좋게 평가된 네트워크일수록 NetRSQ가 높게 측정됨을 확인하였다. 40가지 계량서지적 데이터에 대해서 4가지 링크 삭감 알고리즘을 적용한 결과에 대해서 NetRSQ로 품질을 측정하는 실험을 수행한 결과, 특정 알고리즘의 네트워크 표현 결과가 항상 좋은 품질을 보이는 것은 아니며, 반대로 항상 나쁜 품질을 보이는 것도 아님을 알 수 있었다. 따라서 이 연구에서 제안한 NetRSQ는 생성된 계량서지적 네트워크의 품질을 측정하여 최적의 기법을 선택하는 근거로 활용될 수 있을 것이다.

영 변환 모형 산포형태모수와 두 적합도 검정통계량 사이의 유사성 비교 (Similarity between the dispersion parameter in zero-altered model and the two goodness-of-fit statistics)

  • 윤유정;김홍기
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.493-504
    • /
    • 2017
  • 통계청 인구총조사의 출생아 수 자료는 우리가 쉽게 접할 수 있는 가산 자료이며 국가경쟁력 제고를 위한 정부의 출산정책 결정 및 그 기대효과 분석의 기반이 되는 자료이다. 출생아 수 자료 분석에 있어서 포아송 모형 등 가산 모형이 우월하다는 선행 연구결과에 의하여 가산 모형을 통한 자료 분석방법이 활용되고 있다. 이 때 가산 모형에서 가장 많이 사용하는 포아송 모형은 균등상포라는 제한적인 가정을 토대로 하기 때문에 출생아 수 자료 분석에 이 포아송 모형을 그대로 적용한다면 정보의 손실과 편향추정을 피할 수 없게 된다. 이러한 한계를 극복하기 위해 Ghosh 와 Kim (2007)은 영 과잉과 부족으로 인한 과대산포와 과소산포를 동시에 설명할 수 있는 영 변환 모형 (zero-altered model)을 제안하였다. 본 논문에서는 Ghosh 와 Kim (2007)의 영 변환 모형을 적용하여 실제 출생아수분포에서 영 변환 모형의 산포형태모수 ${\delta}$를 도출하고 그 역할에 대하여 분석한다. 그리고 관측분포에서의 산포형태모수 ${\delta}$와 이론적분포와의 차이를 비교하기 위한 적합도 검정통계량과의 유사성을 확인한다.

The Structural Equation Model of Intention to Discontinue Drinking Highly Caffeinated Beverage of Undergraduate Students

  • Lee, Kyu Eun;Kim, Yunsoo
    • Child Health Nursing Research
    • /
    • 제26권1호
    • /
    • pp.35-46
    • /
    • 2020
  • Purpose: The purpose of this study was to test a model for intention to discontinuation drinking high caffeinated beverages among undergraduate students. This model was based on the Ajzen's theory of planned behavior and Becker's health belief model. Methods: Participants consisted of 201 undergraduate students. Data were collected by questionnaires from March 11 to May 24, 2019. Collected data were analyzed using SPSS/WIN 22.0, AMOS 22.0 program. Results: The assessment of the model indicated an acceptable fit (normed x2=1.65, goodness-of-fit index [GFI]=.83, adjusted GFI=.79, comparative fit index [CFI]=.92, standardized root mean square residual [SRMR]=.05, Tucker-Lewis index [TLI]=.91, normed fit index [NFI]=.87, root mean square error of approximation [RMSEA]=.07). Perceived behavior control, subjective norm, the subjective attitude was found to have a significant direct effect on the intention to discontinuation of drinking a high caffeinated beverage. The variances of this model explained 45.3% of the variance in intention to discontinuation of drinking a high caffeinated beverage. Conclusion: These results suggest that a need to increase awareness of adverse effects and potential risks of high caffeinated beverage consumption in undergraduate students. Besides, the university and government should provide education and campaigns to prevent excessive high-caffeinated beverage consumption.

텅스텐 백열전구의 필라멘트 단선에 대한 가속수명시험 (An Accelerated Life Test for Burnout of Tungsten Filament of Incandescent Lamp)

  • 이재국;김진우;신재철;김명수
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2004년도 정기학술대회
    • /
    • pp.129-137
    • /
    • 2004
  • This paper presents an accelerated life test for burnout of tungsten filament of incandescent lamp. From failure analyses of field samples, it is shown that their root causes are local heating or hot sports in the filament caused by tungsten evaporation and wire sag. Finite element analysis is performed to evaluate the effect of vibration and impact for burnout, but any points of stress concentration or structural weakness are not found in the sample. To estimate the burnout life of lamp, an accelerated life test is planned by using quality function deployment and fractional factorial design, where voltage, vibration, and temperature are selected as accelerating variables. We assumed that Weibull lifetime distribution and a generalized linear model of life-stress relationship hold through goodness of fit test and test for common shape parameter of the distribution. Using accelerated life testing software, we estimated the common shape parameter of Weibull distribution, life-stress relationship, and accelerating factor.

  • PDF

A Modification of the W Test for Exponentiality

  • Kim, Nam-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제8권1호
    • /
    • pp.159-171
    • /
    • 2001
  • Shapiro and Wilk (1972) developed a test for exponentiality with origin and scale unknown. The procedure consists of comparing the generalized least squares estimate of scale with the estimate of scale given by the sample variance. However the test statistic is inconsistent ; that is, the power of the test will not approach 1 as the sample size increases. Hence we give a test based on the ratio of two asymptotically efficient estimates of scale. We also have conducted a power study to compare the test procedures, using Monte Carlo samples from a wide range of alternatives. It is found that the suggested statistics have higher power for the alternatives with the coefficient of variation greater that or equal to 1.

  • PDF

A Jarque-Bera type test for multivariate normality based on second-power skewness and kurtosis

  • Kim, Namhyun
    • Communications for Statistical Applications and Methods
    • /
    • 제28권5호
    • /
    • pp.463-475
    • /
    • 2021
  • Desgagné and de Micheaux (2018) proposed an alternative univariate normality test to the Jarque-Bera test. The proposed statistic is based on the sample second power skewness and kurtosis while the Jarque-Bera statistic uses sample Pearson's skewness and kurtosis that are the third and fourth standardized sample moments, respectively. In this paper, we generalize their statistic to a multivariate version based on orthogonalization or an empirical standardization of data. The proposed multivariate statistic follows chi-squared distribution approximately. A simulation study shows that the proposed statistic has good control of type I error even for a very small sample size when critical values from the approximate distribution are used. It has comparable power to the multivariate version of the Jarque-Bera test with exactly the same idea of the orthogonalization. It also shows much better power for some mixed normal alternatives.

일반화 감마 분포를 이용한 NHPP 소프트웨어 신뢰도 모형에 관한 연구 (NHPP Software Reliability Model based on Generalized Gamma Distribution)

  • 김희철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.27-36
    • /
    • 2005
  • 유한고장 속성을 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률은 일반적으로 상수, 흑은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 잔존 결함 1개당 고장 발생률이 단조증가(혹은, 단조감소) 속성을 가진 일반화 감마분포를 이용한 신뢰성 모형을 제안하였다. 일반화 감마분포를 이용한 유한 속성 비동질적 모형에 대한 모수추정은 고장 간격시간으로 구성된 실측자료를 이용하여 모수 추정을 수행하였다. 일반적 감마분포 형상모수의 제안을 위하여 특수한 형태를 적용하였다. 본 논문에서는 기존 모형의 분포를 적용하고 추가적인 소프트웨어 고장 해석을 위하여 감마 및 와이블 분포를 이용하였다. 일반화 감마 분포모형의 고장자료분석을 위하여 산술적 및 라플라스 검정, 적합도 검정, 편의 검정 등을 이용하였다.

  • PDF

지진 재현수준 예측에 대한 로그-로지스틱 분포와 일반화 극단값 분포의 비교 (Comparison of log-logistic and generalized extreme value distributions for predicted return level of earthquake)

  • 고낙경;하일도;장대흥
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.107-114
    • /
    • 2020
  • 자연 재해로부터 관측되는 자료를 대상으로 재현 수준 예측 등과 같은 자료 분석을 위해 일반화 극단값 분포(generalized extreme value)가 자주 사용되어 왔다. 표본 수가 충분히 큰 경우 연속적인 블록 최댓값들은 점근적으로 일반화 극단값 분포를 따른다. 하지만 소표본인 경우 이러한 사실은 성립되지 않을 수도 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 모형 적합도 검정 및 모형 선택을 통해 로그-로지스틱(log-logistic) 분포의 사용을 제안한다. 하나의 예증으로서 중국 지진 자료를 대상으로 하여 로그-로지스틱 분포를 이용하여 재현 기간별 재현 수준 예측 및 신뢰구간을 제시한다.

Influential Points in GLMs via Backwards Stepping

  • Jeong, Kwang-Mo;Oh, Hae-Young
    • Communications for Statistical Applications and Methods
    • /
    • 제9권1호
    • /
    • pp.197-212
    • /
    • 2002
  • When assessing goodness-of-fit of a model, a small subset of deviating observations can give rise to a significant lack of fit. It is therefore important to identify such observations and to assess their effects on various aspects of analysis. A Cook's distance measure is usually used to detect influential observation. But it sometimes is not fully effective in identifying truly influential set of observations because there may exist masking or swamping effects. In this paper we confine our attention to influential subset In GLMs such as logistic regression models and loglinear models. We modify a backwards stepping algorithm, which was originally suggested for detecting outlying cells in contingency tables, to detect influential observations in GLMs. The algorithm consists of two steps, the identification step and the testing step. In identification step we Identify influential observations based on influencial measures such as Cook's distances. On the other hand in testing step we test the subset of identified observations to be significant or not Finally we explain the proposed method through two types of dataset related to logistic regression model and loglinear model, respectively.

평균응력이 AZ31 마그네슘합금의 렌덤진전균열크기 확률분포에 미치는 영향 (Effect of Mean Stress on Probability Distribution of Random Grown Crack size in Magnesium Alloy AZ31)

  • 최선순;이억섭
    • 한국생산제조학회지
    • /
    • 제18권5호
    • /
    • pp.536-543
    • /
    • 2009
  • In this paper the mean stress effects on the probability distribution of the random grown crack size at a specified loading cycle are studied through the fatigue crack propagation tests, which are conducted on the specimens of magnesium alloy under four different stress ratios. Through 80 replicates the probability distributions of the grown crack size are obtained. The goodness-of-fit for probability distributions of the random grown crack size are investigated by Anderson-Darling test and the best fit for those probability distributions is found to be a 3-parameter Weibull distribution. The effects of the mean stress on the probability distribution of the random grown crack size are also estimated.

  • PDF