• Title/Summary/Keyword: Bayesian information criterion(BIC)

Search Result 40, Processing Time 0.03 seconds

Computational analysis of SARS-CoV-2, SARS-CoV, and MERS-CoV genome using MEGA

  • Sohpal, Vipan Kumar
    • Genomics & Informatics
    • /
    • v.18 no.3
    • /
    • pp.30.1-30.7
    • /
    • 2020
  • The novel coronavirus pandemic that has originated from China and spread throughout the world in three months. Genome of severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) predecessor, severe acute respiratory syndrome coronavirus (SARS-CoV) and Middle East respiratory syndrome coronavirus (MERS-CoV) play an important role in understanding the concept of genetic variation. In this paper, the genomic data accessed from National Center for Biotechnology Information (NCBI) through Molecular Evolutionary Genetic Analysis (MEGA) for statistical analysis. Firstly, the Bayesian information criterion (BIC) and Akaike information criterion (AICc) are used to evaluate the best substitution pattern. Secondly, the maximum likelihood method used to estimate of transition/transversions (R) through Kimura-2, Tamura-3, Hasegawa-Kishino-Yano, and Tamura-Nei nucleotide substitutions model. Thirdly and finally nucleotide frequencies computed based on genomic data of NCBI. The results indicate that general times reversible model has the lowest BIC and AICc score 347,394 and 347,287, respectively. The transition/transversions bias for nucleotide substitutions models varies from 0.56 to 0.59 in MEGA output. The average nitrogenous bases frequency of U, C, A, and G are 31.74, 19.48, 28.04, and 20.74, respectively in percentages. Overall the genomic data analysis of SARS-CoV-2, SARS-CoV, and MERS-CoV highlights the close genetic relationship.

A Smooth Estimation of Failure Rate Function (고장률 함수의 평활추정)

  • 나명환;이현우;김재주
    • Journal of Korean Society for Quality Management
    • /
    • v.25 no.3
    • /
    • pp.51-61
    • /
    • 1997
  • We introduce a method of estimating an unknown failure rate function based on sample data. We estimate failure rate function by a function s from a space of cubic splines constrained to be linear (or constant) in tails using maximum likelihood estimation. The number of knots are determined by Bayesian Information Criterion(BIC). Examples using simulated data are used to illustrate the performance of this method.

  • PDF

Application of Finite Mixture to Characterise Degraded Gmelina arborea Roxb Plantation in Omo Forest Reserve, Nigeria

  • Ogana, Friday Nwabueze
    • Journal of Forest and Environmental Science
    • /
    • v.34 no.6
    • /
    • pp.451-456
    • /
    • 2018
  • The use of single component distribution to describe the irregular stand structure of degraded forest often lead to bias. Such biasness can be overcome by the application of finite mixture distribution. Therefore, in this study, finite mixture distribution was used to characterise the irregular stand structure of the Gmelina arborea plantation in Omo forest reserve. Thirty plots, ten each from the three stands established in 1984, 1990 and 2005 were used. The data were pooled per stand and fitted. Four finite mixture distributions including normal mixture, lognormal mixture, gamma mixture and Weibull mixture were considered. The method of maximum likelihood was used to fit the finite mixture distributions to the data. Model assessment was based on negative loglikelihood value ($-{\Lambda}{\Lambda}$), Akaike information criterion (AIC), Bayesian information criterion (BIC) and root mean square error (RMSE). The results showed that the mixture distributions provide accurate and precise characterisation of the irregular diameter distribution of the degraded Gmelina arborea stands. The $-{\Lambda}{\Lambda}$, AIC, BIC and RMSE values ranged from -715.233 to -348.375, 703.926 to 1433.588, 718.598 to 1451.334 and 3.003 to 7.492, respectively. Their performances were relatively the same. This approach can be used to describe other irregular forest stand structures, especially the multi-species forest.

A Non-stationary frequency analysis for annual daily maximum rainfalls(ADMRs) using mixed Gumbel distribution of bayesian approach (Bayesian 기법의 혼합 Gumbel 분포를 활용한 연최대일강우량에 대한 비정상성 빈도해석)

  • Choi, Hong-Geun;Yoo, Min-Seok;Han, Young-Cheon;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.312-312
    • /
    • 2018
  • 우리나라의 기후 지형적 특성에 따라 연강수량의 50% 이상이 여름철에 내리며 이러한 짧은 기간에 집중적으로 내리는 강수패턴 조건하에서 수공구조물 설계시 대부분 극치빈도분석을 활용한다. 우리나라의 경우 단일 Gumbel 분포를 활용한 극치빈도분석을 많이 이용한다. 하지만, 최근 이상기후로 인하여 전세계적으로 강수패턴의 특징이 급격히 변하고 있으며, 우리나라의 강수패턴 또한 바뀌어가고 있다. 연강수량의 대부분은 태풍과 장마로 인한 강수량으로 이루어져 있고, 일반적으로 두 개의 모집단으로 이루어진 형태를 보인다. 앞선 연구에서 두 개 이상의 첨두를 가지는 형태의 연최대강수량 자료에 대해 8개의 지속시간별(1, 2, 3, 6, 9, 12, 18, 24hr)로 Bayesian 기법의 단일 Gumbel 분포형과 혼합 Gumbel분포형 기반의 극치빈도분석 결과를 비교하였고, 혼합 Gumbel 분포형이 이중첨두 부분의 거동을 효과적으로 모의하는 것을 확인하였다. 본 연구에서는 이상기후로 인한 강수량의 특징의 급격한 변화에 일정한 패턴이 있음을 가정하고 이중첨두의 연 최대일강수량 자료에 대해 혼합 Gumbel 분포형 기반 비정상성 빈도분석을 실시하였다. 정상성 빈도분석과의 비교를 위해 확률분포의 매개변수 산정시 우도함수를 Bayesian 기법을 통해 산정하여 각 분포형의 Bayesian information criterion(BIC) 값을 비교하였다. 비정상성일 경우의 BIC 값이 정상성일 경우 보다 작게 산정되었고, 강수패턴이 경향성을 가지는 것으로 판단할 수 있었다. 비정상성 혼합 Gumbel 분포형 모델은 최근 급격한 강수패턴의 변화에 대한 대응책으로서 활용성이 높을 것으로 기대된다.

  • PDF

Frequency Analysis of Snow depth Using Bayesian mixture distribution (Bayesian 혼합분포를 활용한 최심신적설량 빈도분석)

  • Kim, Ho Jun;Urnachimeg, Sumiya;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.136-136
    • /
    • 2020
  • 홍수와 가뭄은 우리나라에 대표적인 수재해로서 관련 연구도 활발히 진행되고 있다. 반면 겨울철에 발생하는 적설의 경우 발생빈도와 피해가 상대적으로 적었으며 관련 연구 또한 미비한 실정이다. 우리나라 일부 남부지방은 강우와 다르게 연중 눈이 내리지 않는 경우가 존재하며, 자료 중 '0'값을 가지게 된다. 이로 인해 최적분포형 선정 및 매개변수 추정에 어려움이 있으며, 특히 '0'값으로 인해 단일 확률분포를 이용한 빈도해석은 한계가 있다. 본 연구에서는 연중 눈이 내리지 않는 무적설량을 고려하기 위하여 두 가지 이상의 확률분포함수를 결합한 혼합분포함수를 개발하였다. Bayesian 기법을 이용하여 무강우의 기준이 되는 값(δ)을 매개변수로 고려하여 추정하였으며, 이에 따른 적설발생 평균확률(P을 Mixing Ratio로 고려하여 혼합분포함수를 제시하였다. 본 연구에서는 기상청 산하 관측소 중 20년 이상의 지점을 선정하여 최심신적설량을 활용하였으며, 빈도별 확률적설심을 산정하였다. 적합한 확률분포형 선정을 위해 먼저 Bayesian 기법으로 매개변수와 우도함수를 산정한 후 각 분포형의 BIC(bayesian information criterion)값을 비교하였다. 선정된 최적분포형에 대해 빈도분석을 실시하여 최심신적설량을 제시하였다. 추가적으로 무강우를 기존 기준인 '0'으로 고정하여 본 연구에서 제시한 결과 값과 비교하였다.

  • PDF

Spectral Properties of the Sound From the Mechanical Valve Employed in an Implantable Biventricular Assist Device (이식형 양심실 보조 장치에 사용된 기계식 판막의 음향 스펙트럼 특성)

  • 최민주;이서우;이혁수;민병구
    • Journal of Biomedical Engineering Research
    • /
    • v.22 no.5
    • /
    • pp.439-448
    • /
    • 2001
  • This paper considers the acoustical characteristics of the closing click sounds of the mechanical valves employed in an implantable biventricular assist device (BYAD) and their re1evance to the Physical states of the valved. Bj rk Shiley Convexo Concave tilting disk valve was chosen for the study and acoustic measurement was made for the BYAD operated in a mock circulatory system as well as implanted in an animal (sheep). In the BYAD operated in the mock circulatory system. three different states of the valve were examined, ie. normal. mechanically damaged. pseudo-thrombus attached. Microphone measurement for the BVAD implanted in the animal was carried out for five days at a regular time interval from one day after implantation. Characteristic spectrum of the sound from the valve was estimated using Multiple Signal Classification (MUSIC) in which the optimal order was determined according to Bayesian Information Criterion (BIC) . It was observed that the mechanical damage of the valve resulted in changes of the structure of the acoustic spectrum. In contrast. the thrombus formed on the valve did not change much the basic structure of the spectrum but brought about altering the spectral Peak frequencies and energies. Maximum spectral Peak (MSP) with the greatest energy was seen at 2 kHz for the normal valve and it was shifted to 3 kHz for the calve attaching the Pseudo-thrombus. Unlike the normal valve, strong spectral Peak appeared around 7 kHz in the sound from the valve mechanically damaged. In the case of the BYAD implanted in the animal. as the thrombus grew, acoustic energy was reduced relatively more in the low frequency components (〈 2 kHz) and the frequencies of the 1st, 2nd and 3rd MSP were increased little. The thrombus formation would result in reduction in both the variability of the 1st, 2nd and 3rd MSP and the value of the BIC optimal order.

  • PDF

Audio-Visual Content Analysis Based Clustering for Unsupervised Debate Indexing (비교사 토론 인덱싱을 위한 시청각 콘텐츠 분석 기반 클러스터링)

  • Keum, Ji-Soo;Lee, Hyon-Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.5
    • /
    • pp.244-251
    • /
    • 2008
  • In this research, we propose an unsupervised debate indexing method using audio and visual information. The proposed method combines clustering results of speech by BIC and visual by distance function. The combination of audio-visual information reduces the problem of individual use of speech and visual information. Also, an effective content based analysis is possible. We have performed various experiments to evaluate the proposed method according to use of audio-visual information for five types of debate data. From experimental results, we found that the effect of audio-visual integration outperforms individual use of speech and visual information for debate indexing.

Semi-Supervised Learning by Gaussian Mixtures (정규 혼합분포를 이용한 준지도 학습)

  • Choi, Byoung-Jeong;Chae, Youn-Seok;Choi, Woo-Young;Park, Chang-Yi;Koo, Ja-Yong
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.5
    • /
    • pp.825-833
    • /
    • 2008
  • Discriminant analysis based on Gaussian mixture models, an useful tool for multi-class classifications, can be extended to semi-supervised learning. We consider a model selection problem for a Gaussian mixture model in semi-supervised learning. More specifically, we adopt Bayesian information criterion to determine the number of subclasses in the mixture model. Through simulations, we illustrate the usefulness of the criterion.

Difference State Number of CHMM Model to Improve the Performance of SCCRS (한국어 음성/문자 공용인식기의 성능향상을 위한 가변 상태수 CHMM모델의 구성)

  • Suk Soo-Young;Kim Min-Jung;Kim Kwang-Soo;Jung Ho-Youl;Chung Hyun-Yeol
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.95-98
    • /
    • 2002
  • 문자인식 또는 음성인식을 위해 사용되어지는 CHMM(Continuous Hidden Markov Model)모델은 일반적으로 모델의 상태수를 일정한 수로 고정하는 고정 상태수 모델 구조를 가지고 있으나, 이는 개별적인 인식 단위의 특성을 고려하지 않은 경우로써 이를 고려한 가변 상태수 모델을 사용할 경우 인식률 향상을 기대할 수 있다. 개별적인 인식 단위에 적합한 모델 상태수를 결정하는 방법으로 파라미터 히스토그램 방법과, BIC(Bayesian Information Criterion)방법을 사용하는 것이 대표적이다. 이들 방법들은 개별적인 인식단위의 우도값만을 향상시키기 위한 방법으로 전체인식률과 직접적으로 비례하지는 않는다. 따라서, 본 논문에서는 고정 상태수를 갖는 모델 적용 방법과 인식단위별 상태수 변화에 따른 인식률을 비교하였으며, 이를 바탕으로 각 모델별 상태수를 달리하는 가변 상태수 CHMM모델 구성 방법을 제안한다. 제안된 가변상태수 모델의 유효성을 확인하기 위해 음성/문자 공용인식기 중 필기체 문자 인식에 적용한 결과 제안한 LM(Local Maximum)으로 구성된 가변 상태수 모델이 MLE와 BIC로 구성된 모델과 인식률 면에서는 거의 동일한 성능을 유지하면서 전체 상태수는 MLE 모델에 비해 $31\%$, BIC로 구성된 모델에 비해 $22\%$ 감소를 나타내어 제안한 모델의 유효성을 확인할 수 있었다.

  • PDF

Model selection for unstable AR process via the adaptive LASSO (비정상 자기회귀모형에서의 벌점화 추정 기법에 대한 연구)

  • Na, Okyoung
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.6
    • /
    • pp.909-922
    • /
    • 2019
  • In this paper, we study the adaptive least absolute shrinkage and selection operator (LASSO) for the unstable autoregressive (AR) model. To identify the existence of the unit root, we apply the adaptive LASSO to the augmented Dickey-Fuller regression model, not the original AR model. We illustrate our method with simulations and a real data analysis. Simulation results show that the adaptive LASSO obtained by minimizing the Bayesian information criterion selects the order of the autoregressive model as well as the degree of differencing with high accuracy.