• 제목/요약/키워드: Likelihood based inference

검색결과 82건 처리시간 0.029초

NHPP에 기초한 소프트웨어 신뢰도 모형에 대한 비교연구 (The Comparative Study for Software Reliability Models Based on NHPP)

  • 간광현;김희철;이병수
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.393-400
    • /
    • 2001
  • 본 논문에서는 비동질 포아송 프로세스(NHPP)에 기초한 소프트웨어 에러 현상에 대한 확률 모형을 고려하였다. 고장 패턴은 NHPP에 대한 강도함수와 평균값 함수로서 나타낼 수 있다. 따라서 본 논문에서는 기존의 모형인 Goel 이 제시한 일반화모형[2]과 Yamada, Ohba-Osaki 모형[11]을 재조명하고 이러한 모형과 연관되고 신뢰도 분포로 많이 사용되는 와이블 분포의 특수형태인 레일리(Rayleigh)분포와 겜벨(Gumbel)분포[5]를 이용한 모형을 제시하고, 또 효율적 모형을 위한 모형선택으로서 편차자승합(SSE)을 이용하여 비교하였다. 모수의 추정을 위해서 최우추정법(MLE)과 일반적인 수치해석적 방법인 이분법을 이용하였다. 수치적인 예에서는 실측자료인 NTDS 자료[4]를 이용하여 모수 및 신뢰도를 추정하였고 편차자승합을 이용한 모형비교의 결과를 나열하였다.

  • PDF

Non-Simultaneous Sampling Deactivation during the Parameter Approximation of a Topic Model

  • Jeong, Young-Seob;Jin, Sou-Young;Choi, Ho-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권1호
    • /
    • pp.81-98
    • /
    • 2013
  • Since Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet Allocation (LDA) were introduced, many revised or extended topic models have appeared. Due to the intractable likelihood of these models, training any topic model requires to use some approximation algorithm such as variational approximation, Laplace approximation, or Markov chain Monte Carlo (MCMC). Although these approximation algorithms perform well, training a topic model is still computationally expensive given the large amount of data it requires. In this paper, we propose a new method, called non-simultaneous sampling deactivation, for efficient approximation of parameters in a topic model. While each random variable is normally sampled or obtained by a single predefined burn-in period in the traditional approximation algorithms, our new method is based on the observation that the random variable nodes in one topic model have all different periods of convergence. During the iterative approximation process, the proposed method allows each random variable node to be terminated or deactivated when it is converged. Therefore, compared to the traditional approximation ways in which usually every node is deactivated concurrently, the proposed method achieves the inference efficiency in terms of time and memory. We do not propose a new approximation algorithm, but a new process applicable to the existing approximation algorithms. Through experiments, we show the time and memory efficiency of the method, and discuss about the tradeoff between the efficiency of the approximation process and the parameter consistency.

Identifying Copy Number Variants under Selection in Geographically Structured Populations Based on F-statistics

  • Song, Hae-Hiang;Hu, Hae-Jin;Seok, In-Hae;Chung, Yeun-Jun
    • Genomics & Informatics
    • /
    • 제10권2호
    • /
    • pp.81-87
    • /
    • 2012
  • Large-scale copy number variants (CNVs) in the human provide the raw material for delineating population differences, as natural selection may have affected at least some of the CNVs thus far discovered. Although the examination of relatively large numbers of specific ethnic groups has recently started in regard to inter-ethnic group differences in CNVs, identifying and understanding particular instances of natural selection have not been performed. The traditional $F_{ST}$ measure, obtained from differences in allele frequencies between populations, has been used to identify CNVs loci subject to geographically varying selection. Here, we review advances and the application of multinomial-Dirichlet likelihood methods of inference for identifying genome regions that have been subject to natural selection with the $F_{ST}$ estimates. The contents of presentation are not new; however, this review clarifies how the application of the methods to CNV data, which remains largely unexplored, is possible. A hierarchical Bayesian method, which is implemented via Markov Chain Monte Carlo, estimates locus-specific $F_{ST}$ and can identify outlying CNVs loci with large values of FST. By applying this Bayesian method to the publicly available CNV data, we identified the CNV loci that show signals of natural selection, which may elucidate the genetic basis of human disease and diversity.

일반 순서 통계량을 이용한 소프트웨어 신뢰확률 중첩모형에 관한 베이지안 접근에 관한 연구 (A Study on Bayesian Approach of Software Stochastic Reliability Superposition Model using General Order Statistics)

  • 이병수;김희철;백수기;정관희;윤주용
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2060-2071
    • /
    • 1999
  • 소프트웨어 시스템이 복잡해지면 고장의 원인이 하나의 강도함수에 의해서만 일어나지 않고 여러 원인이 중첩되어 발생할 수 있다. 이러한 복잡한 시스템에 의한 우도함수의 계산상의 어려움 때문에 반복표본을 이용하는 깁스 샘플링 기법이 고려되었다. 관찰된 고장시점은 중첩모형으로 표현이 가능한 잠재(latent)변수들을 이용하여 깁스 알고리즘을 적용하였다. 단순모형과 중첩모형의 비교를 위해 사후베이즈 요인과 상대오차의 합을 이용하여 모형선택을 시도하였다. 수치적인 예에서 GOS 속성을 가진 Goel-Okumoto 모형과 Weibull 모형을 선택하고 NHPP의 자료는 Lewis와 Shedler[25]에 의해 제시된 Thining 알고리즘을 이용하여 발생된 자료를 이용하고 사전분포는 상대적으로 확산분포(diffuse priors)를 이용한 모수추정과 사후베이즈요인과 상대오차를 이용한 모형선택을 한 결과 단순모형들 보다 중첩모형이 좋은 형으로 간주할 수 있음을 보여 주었다.

  • PDF

Sequence Diversity in MIC6 Gene among Toxoplasma gondii Isolates from Different Hosts and Geographical Locations

  • Li, Zhong-Yuan;Song, Hui-Qun;Chen, Jia;Zhu, Xing-Quan
    • Parasites, Hosts and Diseases
    • /
    • 제53권3호
    • /
    • pp.341-344
    • /
    • 2015
  • Toxoplasma gondii is an opportunistic protozoan parasite that can infect almost all warm-blooded animals including humans with a worldwide distribution. Micronemes play an important role in invasion process of T. gondii, associated with the attachment, motility, and host cell recognition. In this research, sequence diversity in microneme protein 6 (MIC6) gene among 16 T. gondii isolates from different hosts and geographical regions and 1 reference strain was examined. The results showed that the sequence of all the examined T. gondii strains was 1,050 bp in length, and their A + T content was between 45.7% and 46.1%. Sequence analysis presented 33 nucleotide mutation positions (0-1.1%), resulting in 23 amino acid substitutions (0-2.3%) aligned with T. gondii RH strain. Moreover, T. gondii strains representing the 3 classical genotypes (Type I, II, and III) were separated into different clusters based on the locus of MIC6 using phylogenetic analyses by Bayesian inference (BI), maximum parsimony (MP), and maximum likelihood (ML), but T. gondii strains belonging to ToxoDB #9 were separated into different clusters. Our results suggested that MIC6 gene is not a suitable marker for T. gondii population genetic studies.

Complete Mitochondrial Genome of a Troglobite Millipede Antrokoreana gracilipes (Diplopoda, Juliformia, Julida), and Juliformian Phylogeny

  • Woo, Hyung-Jik;Lee, Yong-Seok;Park, Shin-Ju;Lim, Jong-Tae;Jang, Kuem-Hee;Choi, Eun-Hwa;Choi, Yong-Gun;Hwang, Ui Wook
    • Molecules and Cells
    • /
    • 제23권2호
    • /
    • pp.182-191
    • /
    • 2007
  • The complete mitochondrial genome of a troglobite millipede Antrokoreana gracilipes (Verhoeff, 1938) (Dipolopoda, Juliformia, Julida) was sequenced and characterized. The genome (14,747 bp) contains 37 genes (2 ribosomal RNA genes, 22 transfer RNA genes and 13 protein-encoding genes) and two large non-coding regions (225 bp and 31 bp), as previously reported for two diplopods, Narceus annularus (order Spirobolida) and Thyropygus sp. (order Spirostreptida). The A + T content of the genome is 62.1%, and four tRNAs ($tRNA^{Ser(AGN)}$, $tRNA^{Cys}$, $tRNA^{Ile}$ and $tRNA^{Met}$) have unusual and unstable secondary structures. Whereas Narceus and Thyropygus have identical gene arrangements, the $tRNA^{Thr}$ and $tRNA^{Trp}$ of Antrokoreana differ from them in their orientations and/or positions. This suggests that the Spirobolida and Spirostreptida are more closely related to each other than to the Dipolopoda. Three scenarios are proposed to account for the unique gene arrangement of Antrokoreana. The data also imply that the Duplication and Nonrandom Loss (DNL) model is applicable to the order Julida. Bayesian inference (BI) and maximum likelihood (ML) analyses using amino acid sequences deduced from the 12 mitochondrial protein-encoding genes (excluding ATP8) support the view that the three juliformian members are monophyletic (BI 100%; ML 100%), that Thyropygus (Spirostreptida) and Narceus (Spirobolida) are clustered together (BI 100%; ML 83%), and that Antrokoreana (Julida) is a sister of the two. However, due to conflict with previous reports using cladistic approaches based on morphological characteristics, further studies are needed to confirm the close relationship between Spirostreptida and Spirobolida.

확률강우량 추정을 위한 확률분포함수의 매개변수 추정법에 대한 신뢰성 평가 (Reliability Evaluation of Parameter Estimation Methods of Probability Density Function for Estimating Probability Rainfalls)

  • 한정우;권현한;김태웅
    • 한국방재학회 논문집
    • /
    • 제9권6호
    • /
    • pp.143-151
    • /
    • 2009
  • 최근의 극한 수문사상은 홍수, 가뭄과 같은 심각한 재해를 발생시킨다. 많은 연구자들은 불확실한 미래의 확률강우량 및 유출량의 예측을 위해 많은 노력을 하고 있다. 본 연구에서는 불확실성이 낮은 확률강우량의 산정을 위하여 매개변수 추정법을 평가하였다. 인천, 강릉, 광주, 부산, 추풍령 관측소를 연구 대상 관측소로 선정하여 자료를 수집하였고, ARMA모형을 이용하여 합성강우자료를 구축하였다. 본 연구에서는 극치강우사상에 적합한 것으로 알려진 Gumbel 분포와 GEV 분포모형에 대한 매개변수를 최우도법과 베이지안 추론방법을 사용하여 추정하였으며, Bootstrap 방법을 이용하여 확률강우량의 신뢰구간 길이를 추정하였다. 매개변수 추정 방법별 산정된 확률강우량의 신뢰구간 길이를 비교함으로서 불확실성이 낮은 확률강우량을 산정할 수 있는 매개변수 추정방법을 선정하였다.

네트워크에서 루머 중심성 기반 질의를 통한 루머의 근원 추정 (Estimating the Rumor Source by Rumor Centrality Based Query in Networks)

  • 최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권7호
    • /
    • pp.275-288
    • /
    • 2019
  • 본 논문에서는 네트워크에서 충분히 많은 노드가 루머를 들었을 때 그 근원이 어디서부터 시작 되었는지를 추론하는 문제를 고려한다. 이것은 신기술의 확산, 인터넷에서의 컴퓨터 바이러스/스팸 감염, 인기 있는 주제의 tweeting 및 retweeting과 같은 많은 실제 환경에서 네트워크의 정보 확산이 빠르게 진행되고, 이 정보 중 일부는 다른 노드에게 악영향을 미칠 수 있기 때문에 매우 중요한 문제이다. 이 문제는 선행연구에 의해 감염된 노드의 수가 충분히 많으면 정규 트리의 경우에도 탐지 확률이 31%를 초과 할 수 없다는 것이 입증되었다. 이를 바탕으로 네트워크에 감염된 후보 노드에게 몇 가지 추가 질의를 하는 방법에 대해 조사하고 네트워크 관리자가 한정된 자산을 가지고 있을 때 각 노드에 대한 질의의 수를 어떻게 분배하는지에 대한 자산 할당 알고리즘을 제안한다. 마지막으로 제안한 방법에 대하여 다양한 시뮬레이션을 수행하였고 기존 선행 연구보다 우수한 성능을 확인하였다.

Sulzbacheromyces sinensis, an Unexpected Basidiolichen, was Newly Discovered from Korean Peninsula and Philippines, with a Phylogenetic Reconstruction of Genus Sulzbacheromyces

  • Liu, Dong;Wang, Xin Yu;Wang, Li Song;Maekawa, Nitaro;Hur, Jae-Seoun
    • Mycobiology
    • /
    • 제47권2호
    • /
    • pp.191-199
    • /
    • 2019
  • Most of lichens are formed by Ascomycota, less than 1% are lichenized Basidiomycota. The flora investigation of lichenized Ascomycota of South Korea has been well studied in the past three decades; however, prior to this study, none of basidiolichens was discovered. During the recent excursion, an unexpected clavarioid basidiolichen, Sulzbacheromyces sinensis was collected. Morphology and ecology has been recorded in detail. DNA was extracted, and ITS, 18S, 28S nuclear rDNA were generated. In order to further confirm the systematic position of the Korean specimens, maximum likelihood and Bayesian inference analysis including all the species of the order Lepidostromatales were conducted based on the ITS. As a result, the phylogenetic tree of the order Lepidostromatales was reconstructed, which differed from the previous studies. The inferred phylogenetic tree showed that species of Sulzbacheromyces in three different continents (Asia, South Africa and South America) were separated into three clades with support. In this study, the species worldwide distribution map of Lepidostromatales was illustrated, and S. sinensis had a widest distribution range (paleotropical extend to the Sino-Japanese) than other species (paleotropical or neotropical). Prior to this study, the range of distribution, southernmost and northernmost points and the fruiting time of S. sinensis were recorded, and the genus Sulzbacheromyces was firstly reported from Korean peninsula and Philippines.

퍼지 이론을 이용한 GIS기반 자료유도형 지질자료 통합의 이론과 응용 (GIS-based Data-driven Geological Data Integration using Fuzzy Logic: Theory and Application)

  • 박노욱;지광훈;;권병두
    • 자원환경지질
    • /
    • 제36권3호
    • /
    • pp.243-255
    • /
    • 2003
  • 유용광물자원탐사나 산사태 취약성 분석과 같은 지질학적 응용을 목적으로 GIS를 이용하여 다양한 지질자료를 통합하기 위한 수학적 모델이 개발되어 왔다. 여러 공간통합 방법 중에서 불확실한 정보를 효율적으로 다룰 수 있는 것으로 알려진 퍼지 이론을 이용한 지질정보의 통합에 대해서 논의하였다. 그동안 전문가의 의견에 의존하여 지질자료를 표현하는 목표 유도형 통합방법과 달리, 통합 목표와 지질자료 사이의 통계적 관계를 이용하는 자료 유도형 통합 방법을 제안하였다. 제안된 기법은 퍼지 소속함수로의 표현, 퍼지 연산자를 이용한 결합, 비퍼지화, 검증의 4단계로 구성된다. 자료 표현에는 우도비에 기반한 퍼지 소속함수를, 퍼지 소속함수들의 결합에는 퍼지 연산자 네트웍을, 통합결과의 상대적인 가능성값을 도시하기 위해 비퍼지화 단계를 각각 제안하였다. 최종적으로 통합 목표에 대한 의미있는 해석과 다양한 퍼지 연산자 네트웍의 정량적 비교를 위해 공간 분할에 기반한 검증 과정을 제안하였다. 지질학적 응용을 목적으로 제안한 방법론의 적용가능성, 실제 적용시의 제안점을 산사태 취약성 분석 적용연구를 통해 논의하였다. 적용연구 결과, 대상지역에서 산사태에 대한 취약한 지역을 구분하는데 제안기법이 효과적으로 이용될 수 있음을 확인할 수 있었으며, 검증을 통해 최종 퍼지 소속함수의 결합에 ${\gamma}$연산자를 사용한 경우가 최대, 최소 연산자를 사용한 경우에 비해 높은 예측능력을 나타내었다.