• 제목/요약/키워드: maximum entropy model

검색결과 135건 처리시간 0.028초

Families of Distributions Arising from Distributions of Ordered Data

  • Ahmadi, Mosayeb;Razmkhah, M.;Mohtashami Borzadaran, G.R.
    • Communications for Statistical Applications and Methods
    • /
    • 제22권2호
    • /
    • pp.105-120
    • /
    • 2015
  • A large family of distributions arising from distributions of ordered data is proposed which contains other models studied in the literature. This extension subsume many cases of weighted random variables such as order statistics, records, k-records and many others in variety. Such a distribution can be used for modeling data which are not identical in distribution. Some properties of the theoretical model such as moment, mean deviation, entropy criteria, symmetry and unimodality are derived. The proposed model also studies the problem of parameter estimation and derives maximum likelihood estimators in a weighted gamma distribution. Finally, it will be shown that the proposed model is the best among the previously introduced distributions for modeling a real data set.

기후 변화 적응을 위한 벡터매개질병의 생태 모델 및 심층 인공 신경망 기반 공간-시간적 발병 모델링 및 예측 (Spatio-Temporal Incidence Modeling and Prediction of the Vector-Borne Disease Using an Ecological Model and Deep Neural Network for Climate Change Adaption)

  • 김상윤;남기전;허성구;이선정;최지훈;박준규;유창규
    • Korean Chemical Engineering Research
    • /
    • 제58권2호
    • /
    • pp.197-208
    • /
    • 2020
  • 본 연구에서는 발병 횟수가 빠르게 증가하고 있는 벡터매개질병(vector-borne disease) 중 하나인 쯔쯔가무시증의 발병 특성을 공간적 그리고 시간적으로 분석하고 기후변화 시나리오에 따른 미래 발병 특성을 예측하였다. 쯔쯔가무시증의 공간적 분포와 발병률을 예측하기 위하여 환경 그리고 사회 변수의 공간적 특성을 이용하여 maximum entropy(MaxEnt) 생태 모델을 구성하고, 주요 변수의 쯔쯔가무시증 발병에 관한 상관관계를 분석하였다. 공간 특성 중 환경변수인 고도 및 기온이 주요한 변수로 분석되었으며, 이는 쯔쯔가무시증의 매개체인 털진드기의 생육 환경과 주요 관련이 있는 것으로 나타났다. 쯔쯔가무시증의 시간적 발병 횟수는 심층 인공 신경망 모델기반 예측을 하였으며, 특히 쯔쯔가무시증의 주요 특성인 지연 효과를 고려하여 모델을 구성하였다. 심층 인공 신경망을 이용한 예측 결과 여름철의 기온, 강우량, 그리고 습도가 털진드기의 활동에 주된 관련이 있으며 가을철의 쯔쯔가무시증 발병 횟수에 영향을 끼치는 것으로 확인 되었다. 또한, 기존 통계적 예측 모델과 비교하였을 때, 심층 인공 신경망 기반 예측 모델의 예측 정확성이 우수함을 확인하였다. 공간적 그리고 시간적 모델에 기후 변화 시나리오를 이용하여 2040년의 쯔쯔가무시증 발병 특성을 예측한 결과, 최대 발병률이 8% 증가, 발병률이 높은 지역이 9% 확대, 그리고 주된 발병 기간이 2개월 증가하였다. 본 연구 결과를 통해 쯔쯔가무시증의 공간적 및 시간적 발병 특성 분석을 통하여, 공중보건 측면에서 벡터매개 질병 발병 요인 규명을 통해 주민 건강을 위한 질병 관리 및 예측에 기여할 수 있을 것으로 기대한다.

How Can We Erase States Inside a Black Hole?

  • Hwang, Junha;Park, Hyosub;Yeom, Dong-han;Zoe, Heeseung
    • Journal of the Korean Physical Society
    • /
    • 제73권10호
    • /
    • pp.1420-1430
    • /
    • 2018
  • We investigate an entangled system, which is analogous to a composite system of a black hole and Hawking radiation. If Hawking radiation is well approximated by an outgoing particle generated from pair creation around the black hole, such a pair creation increases the total number of states. There should be a unitary mechanism to reduce the number of states inside the horizon for black hole evaporation. Because the infalling antiparticle has negative energy, as long as the infalling antiparticle finds its partner such that the two particles form a separable state, one can trace out such a zero energy system by maintaining unitarity. In this paper, based on some toy model calculations, we show that such a unitary tracing-out process is only possible before the Page time while it is impossible after the Page time. Hence, after the Page time, if we assume that the process is unitary and the Hawking pair forms a separable state, the internal number of states will monotonically increase, which is supported by the Almheiri-Marolf-Polchinski-Sully (AMPS) argument. In addition, the Hawking particles cannot generate randomness of the entire system; hence, the entanglement entropy cannot reach its maximum. Based on these results, we modify the correct form of the Page curve for the remnant picture. The most important conclusion is this: if we assume unitarity, semi-classical quantum field theory, and general relativity, then the black hole should violate the Bekenstein-Hawking entropy bound around the Page time at the latest; hence, the infinite production arguments for remnants might be applied for semi-classical black holes, which seems very problematic.

음성정보와 문법정보를 이용한 한국어 운율 경계의 자동 추정 (Automatic Detection of Korean Prosodic Boundaries U sing Acoustic and Grammatical Information)

  • 김선희;전재훈;홍혜진;정민화
    • 대한음성학회지:말소리
    • /
    • 제66호
    • /
    • pp.117-130
    • /
    • 2008
  • This paper presents a method for automatically detecting Korean prosodic boundaries using both acoustic and grammatical information for the performance improvement of speech information processing systems. While most of previous works are solely based on grammatical information, our method utilizes not only grammatical information constructed by a Maximum-Entropy-based grammar model using 10 grammatical features, but also acoustical information constructed by a GMM-based acoustic model using 14 acoustic features. Given that Korean prosodic structure has two intonationally defined prosodic units, intonation phrase (IP) and accentual phrase (AP), experimental results show that the detection rate of AP boundaries is 82.6%, which is higher than the labeler agreement rate in hand transcribing, and that the detection rate of IP boundaries is 88.7%, which is slightly lower than the labeler agreement rate.

  • PDF

LMS PHD에 의한 배경단파 파워 스펙트럼 추정 (Power Spectral Estimation of Background EEG with LMS PHD)

  • 정명진;최갑석
    • 대한의용생체공학회:의공학회지
    • /
    • 제9권1호
    • /
    • pp.101-108
    • /
    • 1988
  • In this paper the power spectrum of background EEG is estimated by the LMS PHD based on least mean square. At the power spectrum estimatiom, the stocastic process of background EEG is assumed to consist of the nonharmonic sinusoid and the white noise. In the LMS PHD the model parameters are obtained by the least mean square at optimal order which is obtained from the fact that the eigenvalue's fluctuation of autocorrelation matrix of the normal back-ground EEG is smaller at some order than at other order when the power spectrum of background EEG is esitmated by PHD. The optimal order of this model is the 6-th order when the eigenvalue's fluctuation of autocorrelation matrix of background EEG is considered. The estimation results are with compared the results from the Maximum Entropy Spectral Estimation and Pisarenko Harmonic Decomposition. From the comparison results. The LMS PHD is possible to estimate the power spectrum of background EEG.

  • PDF

최대 엔트로피 모델을 이용한 연속음성인식에서의 인식 신뢰도 측정 (CONFIDENCE MEAUSRING METHOD FOR CONTIUOUS SPEECH RECOGNITION USING MAXIMUM ENTROPY MODEL)

  • 정상근;정민우;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.200-204
    • /
    • 2004
  • 음성인식기술을 실제 생활에 적용할 때 발생하는 대표적인 문제로. 인식기의 낮은 인식률로 인한 오동작을 들 수 있다. 본 연구에서는, 텔레뱅킹 도메인에서의 HTK(Hidden Markov Model Toolkit) 연속 음성 인식 시스템과, 최대 엔트로피 기법에 기반한 사용자 발화에서의 핵심이 되는 단어(주로 고유 명사들)들에 대한 인식 신뢰도의 측정 방법을 제시한다. 음향특징과 언어특징들을 모두 고려하여 인식 신뢰도를 구하였으며 인식된 단어들에 대해 오인식 되었음을 약 86%의 정확도로 판단할 수 있음을 확인하였다. 본 인식신뢰도를 이용하여 차후에 음성인식의 확인대화(Clarification Dialog)모델을 개발하는데 활용하고자 한다.

  • PDF

Generation of Finite Inductive, Pseudo Random, Binary Sequences

  • Fisher, Paul;Aljohani, Nawaf;Baek, Jinsuk
    • Journal of Information Processing Systems
    • /
    • 제13권6호
    • /
    • pp.1554-1574
    • /
    • 2017
  • This paper introduces a new type of determining factor for Pseudo Random Strings (PRS). This classification depends upon a mathematical property called Finite Induction (FI). FI is similar to a Markov Model in that it presents a model of the sequence under consideration and determines the generating rules for this sequence. If these rules obey certain criteria, then we call the sequence generating these rules FI a PRS. We also consider the relationship of these kinds of PRS's to Good/deBruijn graphs and Linear Feedback Shift Registers (LFSR). We show that binary sequences from these special graphs have the FI property. We also show how such FI PRS's can be generated without consideration of the Hamiltonian cycles of the Good/deBruijn graphs. The FI PRS's also have maximum Shannon entropy, while sequences from LFSR's do not, nor are such sequences FI random.

An ensemble learning based Bayesian model updating approach for structural damage identification

  • Guangwei Lin;Yi Zhang;Enjian Cai;Taisen Zhao;Zhaoyan Li
    • Smart Structures and Systems
    • /
    • 제32권1호
    • /
    • pp.61-81
    • /
    • 2023
  • This study presents an ensemble learning based Bayesian model updating approach for structural damage diagnosis. In the developed framework, the structure is initially decomposed into a set of substructures. The autoregressive moving average (ARMAX) model is established first for structural damage localization based structural motion equation. The wavelet packet decomposition is utilized to extract the damage-sensitive node energy in different frequency bands for constructing structural surrogate models. Four methods, including Kriging predictor (KRG), radial basis function neural network (RBFNN), support vector regression (SVR), and multivariate adaptive regression splines (MARS), are selected as candidate structural surrogate models. These models are then resampled by bootstrapping and combined to obtain an ensemble model by probabilistic ensemble. Meanwhile, the maximum entropy principal is adopted to search for new design points for sample space updating, yielding a more robust ensemble model. Through the iterations, a framework of surrogate ensemble learning based model updating with high model construction efficiency and accuracy is proposed. The specificities of the method are discussed and investigated in a case study.

바이모달 이산정보에 대한 신뢰성해석 기법 비교 (Comparative Study of Reliability Analysis Methods for Discrete Bimodal Information)

  • 임우철;장준용;이태희
    • 대한기계학회논문집A
    • /
    • 제37권7호
    • /
    • pp.883-889
    • /
    • 2013
  • 응답의 분포는 변수의 분포에 따라 달라진다. 특히 변수의 분포가 두 개 이상의 모드를 가질 때, 대부분 응답의 분포 또한 두 개 이상의 모드를 갖는다. 이런 문제에 대해 기존의 신뢰성해석 기법은 변수를 하나의 모드를 갖는 특정 연속확률분포로 가정하고 신뢰성해석을 수행한다. 하지만 실제 문제에서 변수들은 이산정보이면서 두 개 이상의 모드를 갖는 경우가 많기 때문에 변수의 분포에 대한 가정을 하지 않고 두 개 이상의 모드를 고려한 신뢰성해석을 수행하는 것은 매우 중요하다. 본 연구에서는 두 개 이상의 모드를 갖는 분포를 추정할 수 있는 기법인 아카이케정보척도와 최대엔트로피법칙을 이용하여 신뢰성해석을 수행한다. 수학예제를 통해 두 기법의 특징을 파악하고 몬테카를로 시뮬레이션의 결과와 비교하여 정확도를 검증한다.

절 경계와 트리 거리를 사용한 2단계 부분 의미 분석 시스템 (A Two-Phase Shallow Semantic Parsing System Using Clause Boundary Information and Tree Distance)

  • 박경미;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.531-540
    • /
    • 2010
  • 본 논문은 최대 엔트로피 모형에 기반한 두 단계 부분 의미 분석 방법을 제안한다. 먼저, 의미 논항의 경계를 인식하고, 그 다음 단계에서 확인된 논항에 적절한 의미역을 할당한다. 두 단계 부분 의미 분석에서는 두 번째 단계인 논항 분류가 논항 확인 단계의 결과에 기반하여 수행되기 때문에 논항 확인의 성능이 매우 중요하다. 본 논문은 논항 확인의 성능을 향상시키기 위하여 논항 확인의 전처리 단계에 구문 지식을 통합한다. 구체적으로, 절 인식 결과로부터 술어의 인접절 및 상위절들을 확인하고, 구문 분석 결과로부터 술어의 부모 노드로부터 구문 구성 요소의 부모 노드까지의 트리 거리를 추출하여 전처리 단계에서 활용한다. 실험을 통해, 구문 지식을 활용하는 것이 부분 의미 분석 성능에 기여함과 제안하는 두 단계 방법이 한 단계 방법보다 우수한 성능을 낼 수 있음을 보인다.