• 제목/요약/키워드: markov chain monte carlo

검색결과 270건 처리시간 0.029초

가우시안 과정 분류에 대한 변분 베이지안 다항 프로빗 모형: 쥐 단백질 발현 데이터에의 적용 (Variational Bayesian multinomial probit model with Gaussian process classification on mice protein expression level data)

  • 손동현;황범석
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.115-127
    • /
    • 2023
  • 다항 프로빗 모형은 다중 분류와 선택 모형에서 흔히 사용하는 모형이다. 다항 프로빗 모형을 추정하기 위해 일반적으로 널리 사용하는 베이지안 접근법인 마르코프 연쇄 몬테카를로(MCMC) 방법은 계산 복잡도가 매우 높다는 문제점을 가지고 있다. 반면, 변분 베이즈 방법은 MCMC 방법보다 계산 복잡도는 낮으면서도 분류 성능적인 면에서 큰 차이가 나지 않아 더 효율적인 방법으로 알려져 있다. 본 연구에서는 가우시안 과정에 기반한 다항 프로빗 모형을 설명하고 해당 모형에 적용할 수 있는 변분 베이지안 근사법을 알아보고자 한다. 그리고 UCI에서 제공되는 쥐 단백질 발현 데이터에 가우시안 과정 분류에 대한 변분 베이지안 다항 프로빗 모형을 적용하여 그 성능을 확인하고 나이브 베이즈, K-최근접 이웃법, 서포트 벡터 머신 분류기의 성능과 비교한다.

Gas dynamics and star formation in NGC 6822

  • Park, Hye-Jin;Oh, Se-Heon;Wang, Jing;Zheng, Yun;Zhang, Hong-Xin;de Blok, W.J.G.
    • 천문학회보
    • /
    • 제46권2호
    • /
    • pp.70.2-71
    • /
    • 2021
  • We examine gas kinematics and star formation activities of NGC 6822, a gas-rich dwarf irregular galaxy in the Local Group at a distance of ~490 kpc. We perform profile decomposition of all the line-of-sight (LOS) HI velocity profiles of the high-resolution (42.4" × 12" spatial; 1.6 km/s spectral) HI data cube of the galaxy, taken with the Australian Telescope Compact Array (ATCA). To this end, we use a novel tool based on Bayesian Markov Chain Monte Carlo (MCMC) techniques, the so-called BAYGAUD, which allows us to decompose a velocity profile into an optimal number of Gaussian components in a quantitative manner. We group all the decomposed components into bulk-narrow, bulk-broad, and non-bulk gas components classified with respect to their velocity dispersions and the amounts of velocity offset from the global kinematics, respectively. Using the surface densities and velocity dispersions of the kinematically decomposed HI gas maps together with the rotation curve of NGC 6822, we derive Toomre-Q parameters for individual regions of the galaxy which quantify the level of local gravitational instability of the gaseous disk. We also measure the local star formation rate (SFR) of the corresponding regions in the galaxy by combining GALEX Far-ultraviolet (FUV) and WISE 22㎛ images. We then relate the gas and SFR surface densities in order to investigate the local Kennicutt-Schmidt (K-S) law of gravitationally unstable regions which are selected from the Toomre Q analysis. Of the three groups, the bulk-narrow, bulk-broad and non-bulk gas components, we find that the lower Toomre-Q values the bulk-narrow gas components have, the more consistent with the linear extension of the K-S law derived from molecular hydrogen (H2) observations.

  • PDF

Rare Disaster Events, Growth Volatility, and Financial Liberalization: International Evidence

  • Bongseok Choi
    • Journal of Korea Trade
    • /
    • 제27권2호
    • /
    • pp.96-114
    • /
    • 2023
  • Purpose - This paper elucidates a nexus between the occurrence of rare disaster events and the volatility of economic growth by distinguishing the likelihood of rare events from stochastic volatility. We provide new empirical facts based on a quarterly time series. In particular, we focus on the role of financial liberalization in spreading the economic crisis in developing countries. Design/methodology - We use quarterly data on consumption expenditure (real per capita consumption) from 44 countries, including advanced and developing countries, ending in the fourth quarter of 2020. We estimate the likelihood of rare event occurrences and stochastic volatility for countries using the Bayesian Markov chain Monte Carlo (MCMC) method developed by Barro and Jin (2021). We present our estimation results for the relationship between rare disaster events, stochastic volatility, and growth volatility. Findings - We find the global common disaster event, the COVID-19 pandemic, and thirteen country-specific disaster events. Consumption falls by about 7% on average in the first quarter of a disaster and by 4% in the long run. The occurrence of rare disaster events and the volatility of gross domestic product (GDP) growth are positively correlated (4.8%), whereas the rare events and GDP growth rate are negatively correlated (-12.1%). In particular, financial liberalization has played an important role in exacerbating the adverse impact of both rare disasters and financial market instability on growth volatility. Several case studies, including the case of South Korea, provide insights into the cause of major financial crises in small open developing countries, including the Asian currency crisis of 1998. Originality/value - This paper presents new empirical facts on the relationship between the occurrence of rare disaster events (or stochastic volatility) and growth volatility. Increasing data frequency allows for greater accuracy in assessing a country's specific risk. Our findings suggest that financial market and institutional stability can be vital for buffering against rare disaster shocks. It is necessary to preemptively strengthen the foundation for financial stability in developing countries and increase the quality of the information provided to markets.

Gas kinematics and star formation in NGC 6822

  • Park, Hye-Jin;Oh, Se-Heon;Wang, Jing;Zheng, Yun;Zhang, Hong-Xin;de Blok, W.J.G.
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.61.4-62
    • /
    • 2020
  • We present H I gas kinematics and star formation activities of NGC 6822, a dwarf galaxy located in the Local Volume at a distance of ~490 kpc. We perform profile decomposition of the line-of-sight velocity profiles of the high-resolution (~42.4" × 12") spatial; ~1.6 km/s spectral) H I data cube taken with the Australia Telescope Compact Array (ATCA). For this, we use a new tool, the so-called BAYGAUD (BAYesian GAUssian Decompositor) which is based on Bayesian Markov Chain Monte Carlo (MCMC) techniques, allowing us to decompose a line-of-sight velocity profile into an optimal number of Gaussian components in a quantitative manner. We classify the decomposed H I gas components of NGC 6822 into kinematically cold, warm or hot ones with respect to their velocity dispersion: 1) cold: < 4 km/s, 2) warm: 4 ~ 8 km/s, 3) hot: > 8 km/s. We then derive the Toomre-Q parameters of NGC 6822 using the kinematically decomposed H I gas maps. We also correlate their gas surface densities with the surface star formation rates derived using both GALEX far-ultraviolet and WISE 22 micron data to examine the impact of gas turbulence caused by stellar feedback on the Kennicutt-Schmidt (K-S) law. The kinematically cold component is likely to better follow the linear extension of the Kennicutt-Schmidt (K-S) law for molecular hydrogen (H2) at the low gas surface density regime where H I is not saturated.

  • PDF

상수도관망 디지털트윈 구현을 위한 해석 프로그램 매개변수 검보정 모형 개발 (Realization of water distribution system digital twin model using parameter calibration model)

  • 이재연;박재홍;이승엽
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.182-182
    • /
    • 2022
  • 4차산업 기술이 상수도 관망 분야에도 활발히 도입되며 스마트워터 구축에 기술적인 기반이 마련되고 있다. 이중 디지털트윈의 경우 컴퓨터에 현실 속 사물의 쌍둥이를 만들고, 현실에서 발생할 수 있는 상황을 컴퓨터로 시뮬레이션함으로써 결과를 미리 예측하는 기술로 정의된다. 즉, 디지털트윈의 핵심기술은 시각화와 시뮬레이션 모형의 연계로 실시간 상황 표출뿐만 아니라 시뮬레이션 모형 입력값의 미래 변화를 추정하여 해당 사물의 상태를 예측하는 것이라고 할 수 있다. 상수도 관망의 경우도 디지털트윈 모형 구축 시 정교한 시뮬레이션 모형과 연계를 통해 관측 데이터의 표출과 함께 미관측 지점의 데이터를 추정 및 표출하는 것이 중요하다. 본 연구에서는 디지털트윈 모형 구축에 가장 필수적이라고 할 수 있는 상수도 관망의 해석 프로그램 매개변수 검보정 모형을 소개한다. 대표적인 상수도 관망해석 프로그램인 EPANET2.2의경우 입력값으로 주로 수요량과 관로의 조도계수를 요구하며, 본 연구에서는 수요량은 알고 있는 것으로 가정하고 관로의 조도계수만 Markov-Chain Monte Carlo (MCMC)를 사용하여 검보정한다. 해당 모형은 (1) 실시간 조도계수 추정이 가능하면, (2) 동시에 누수 탐지가 가능하고, (3) 관로의 기능적 노후를 정의하여 향후 디지털트윈 모형 구현 시 관로 노후를 표출할 수 있는 기반을 구축한다. 우선 실시간 조도계수 추정은 데이터베이스와 연동하여 진행하며, MCMC 모형을 활용한 관로 별 조도계수의 분포에 따라 정상범위 내 변동이 발생하는지 여부를 판단한다. 이때 정상범위를 벗어난 변동이 발생하는 경우 잠재적 누수가 존재하는 것으로 가정하며, 콜모고로프-스미르노프(KS) 테스트를 통해 이를 판단한다. 기능적 노후는 관로의 통수능과 연관이 있으며, 추정한 조도계수에 따른 관로의 통수능을 산정하여 결과를 표출한다. 본 연구에서 제안한 모형은 향후 상수도 관망 디지털트윈 구현에 핵심 요소기술로 활용할 수 있을 것으로 기대한다.

  • PDF

A Search for Exoplanets around Northern Circumpolar Stars. IX. A Multi-Period Analysis of the M Giant HD 135438

  • Byeong-Cheol Lee;Jae-Rim Koo;Yeon-Ho Choi;Tae-Yang Bang;Beomdu Lim;Myeong-Gu Park;Gwanghui Jeong
    • 천문학회지
    • /
    • 제56권2호
    • /
    • pp.277-286
    • /
    • 2023
  • It is difficult to distinguish the pure signal produced by an orbiting planetary companion around giant stars from other possible sources, such as stellar spots, pulsations, or certain activities. Since 2003, we have obtained radial (RV) data from evolved stars using the high-resolution, fiber-fed Bohyunsan Observatory Echelle Spectrograph (BOES) at the Bohyunsan Optical Astronomy Observatory (BOAO). Here, we report the results of RV variations in the binary star HD 135438. We found two significant periods: 494.98 d with eccentricity of 0.23 and 8494.1 d with eccentricity of 0.83. Considering orbital stability, it is impossible to have two companions in such close orbits with high eccentricity. To determine the nature of the changes in the RV variability, we analyzed indicators of stellar spot and stellar chromospheric activity to find that there are no signals related to the significant period of 494.98 d. However, we calculated the upper limits of rotation period of the rotational velocity and found this to be 478-536 d. One possible interpretation is that this may be closely related to the rotational modulation of an orbital inclination at 67-90 degrees. The other signal corresponding to the period of 8494.1 d is probably associated with a stellar companion orbiting the giant star. A Markov Chain Monte Carlo (MCMC) simulation considering a single companion indicates that HD 135438 system hosts a stellar companion with 0.57+0.017 -0.017 M with an orbital period of 8498 d.

비정상성 가뭄빈도 해석 기법에 따른 가뭄 심도-지속기간-재현기간 곡선 유도에 관한 연구 (A Study on derivation of drought severity-duration-frequency curve through a non-stationary frequency analysis)

  • 정민수;박서연;장호원;이주헌
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.107-119
    • /
    • 2020
  • 본 연구는 한반도의 관측 강우자료를 기반으로 하여 과거의 가뭄 특성을 파악함과 동시에 RCP 8.5 기후변화 시나리오를 활용한 장래 발생 가능한 극치 가뭄에 대한 장기전망을 수행하였다. 정량적인 가뭄 분석을 위해 기상학적 가뭄지수인 표준강수지수(Standardized Precipitation Index, SPI)를 적용하였으며 일단위 강우 관측 자료 및 RCP 시나리오를 단일한 장기 시계열 자료로 구축하여 1, 3, 6, 9, 12개월 지속기간의 SPI 입력인자로 활용하였다. 한반도의 지역별 가뭄특성 분석을 위한 대상 강우관측소는 1954년 시점부터 강우 자료를 보유하고 있는 12개 관측 지점을 선정하였으며, 동일 지점의 10개 GCM(General Circulation Model)을 적용하였다. 기후변화에 따른 가뭄 특성 변화 분석을 위해 강우발생일수와 총강수량에 대한 12개 강우관측소별 추세 변동 분석 및 군집화를 수행하였다. 샘플링 기법을 활용한 비정상성 빈도분석을 위해 베이지안 기반의 DE(Differential Evolution)와 MCMC(Markov Chain Monte Carlo)를 결합한 DEMC 기법을 채택하였고, 비정상성 가뭄빈도해석을 통하여 12개 지점별 SDF(Severity-Duration-Frequency) 곡선을 유도하였다. 비정상성을 가정한 장기 수문자료를 보유한 지점들의 SDF 곡선 산정을 통해 미래의 가뭄에 대한 정량적인 전망을 수행하였다. 장기시계열 자료를 보유한 12개 지점의 군집분석을 수행한 결과 Zone 1-2, 2, 3-2에 해당하는 제주를 제외한 전주, 광주, 여순, 목포, 추풍령 등에서 장래에 가뭄발생 위험이 높은 것으로 분석되었다. 장래 발생 가능한 가뭄 위험성을 정량적으로 파악함으로써 미래 가뭄관리 정책에 충분히 활용될 수 있을 것으로 기대된다.

경남지역 수달(Lutra lutra)의 mitochondrial DNA D-loop지역과 microsatellite marker를 이용한 계통유전학적 유연관계 분석 (A Phylogenetic Analysis of Otters (Lutra lutra) Inhabiting in the Gyeongnam Area Using D-Loop Sequence of mtDNA and Microsatellite Markers)

  • 박문성;임현태;오기철;문영록;김종갑;전진태
    • 생명과학회지
    • /
    • 제21권3호
    • /
    • pp.385-392
    • /
    • 2011
  • 국내에 서식하는 수달의 경우 멸종 위기 I 급 종으로 지정되어 국가적인 차원에서 관리하고 있는 보호종이다. 수달의 유전자원 보호 및 체계적인 관리를 위한 기초자료로 활용하기 위해 경남지역에 서식하는 수달의 계통유전학적 유연관계를 mtDNA D-loop 지역의 염기서열분석과 MS marker 분석을 통하여 실시하였다. 그 결과 mtDNA D-loop 지역의 676 bp 부분만 보았을 때 5개의 SNP가 확인되었으며, 6개의 haplotype이 추정되었다. 진주 인근 지역과 거제도 인근 지역에서 수집한 시료는 지역 내 유전적 거리가 지역 간의 유전적 거리보다는 가까운 것을 확인 할 수 있었고, 진주와 거제도 지역 간의 유전적 거리는 확연히 구분이 되었다. MrBays의 Bayesian Markov chain Monte Carlo 분석법을 이용하여 추정한 phylogeny 분석결과 뚜렷한 2개 그룹(진주와 거제/창녕 그룹)으로 분류 되었다. Parsimonious median-joining network [5] 분석의 결과 또한 2개의 뚜렷한 그룹으로 분류되어 phylogeny 분석결과와 일치하는 결과를 보였다. MS marker를 이용하여 추정한 유전적 거리지수를 활용하여 추정한 consensus tree의 결과 또한 크게 2개의 그룹으로 분류 되며, 첫 번째 그룹에는 거제도지역 시료, 진주인근지역 시료 일부 그리고 창녕 우포늪에서 채취한 시료가 하나의 그룹으로 나뉘어 졌으며, 두 번째 그룹에는 진주인근 지역에서 채취한 시료만이 포함되어 하나의 그룹을 형성하여, mtDNA를 이용하여 분석한 것과 일부 다른 결과를 보였다. 이러한 결과의 차이는 모계를 추정하는 mtDNA와 상염색체 상의 MS marker의 특성에 기인한 것으로 보이나, 경상남도에 서식하는 수달을 크게 진주와 거제지역의 수달로 구분하는 것에는 유사한 결과를 보여 서식지 별 유전적 고정현상이 있음을 확인할 수 있었다. 하지만 좀 더 정확한 검증을 위해서는 수달의 full mtDNA 분석 및 국내에서 서식하는 수달에 적합한 MS marker발굴을 통한 대립유전자형을 분석하는 추가 연구가 필요하며, 전국 단위의 수달 시료를 확보하여 유전적 유연관계 분석을 실시한다면 한국 내 수달의 보전 및 보호에 도움이 될 것으로 사료되어 진다.

Survival Analysis for White Non-Hispanic Female Breast Cancer Patients

  • Khan, Hafiz Mohammad Rafiqullah;Saxena, Anshul;Gabbidon, Kemesha;Stewart, Tiffanie Shauna-Jeanne;Bhatt, Chintan
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권9호
    • /
    • pp.4049-4054
    • /
    • 2014
  • Background: Race and ethnicity are significant factors in predicting survival time of breast cancer patients. In this study, we applied advanced statistical methods to predict the survival of White non-Hispanic female breast cancer patients, who were diagnosed between the years 1973 and 2009 in the United States (U.S.). Materials and Methods: Demographic data from the Surveillance Epidemiology and End Results (SEER) database were used for the purpose of this study. Nine states were randomly selected from 12 U.S. cancer registries. A stratified random sampling method was used to select 2,000 female breast cancer patients from these nine states. We compared four types of advanced statistical probability models to identify the best-fit model for the White non-Hispanic female breast cancer survival data. Three model building criterion were used to measure and compare goodness of fit of the models. These include Akaike Information Criteria (AIC), Bayesian Information Criteria (BIC), and Deviance Information Criteria (DIC). In addition, we used a novel Bayesian method and the Markov Chain Monte Carlo technique to determine the posterior density function of the parameters. After evaluating the model parameters, we selected the model having the lowest DIC value. Using this Bayesian method, we derived the predictive survival density for future survival time and its related inferences. Results: The analytical sample of White non-Hispanic women included 2,000 breast cancer cases from the SEER database (1973-2009). The majority of cases were married (55.2%), the mean age of diagnosis was 63.61 years (SD = 14.24) and the mean survival time was 84 months (SD = 35.01). After comparing the four statistical models, results suggested that the exponentiated Weibull model (DIC= 19818.220) was a better fit for White non-Hispanic females' breast cancer survival data. This model predicted the survival times (in months) for White non-Hispanic women after implementation of precise estimates of the model parameters. Conclusions: By using modern model building criteria, we determined that the data best fit the exponentiated Weibull model. We incorporated precise estimates of the parameter into the predictive model and evaluated the survival inference for the White non-Hispanic female population. This method of analysis will assist researchers in making scientific and clinical conclusions when assessing survival time of breast cancer patients.

Bayesian MCMC를 이용한 저수량 점 빈도분석: II. 적용과 비교분석 (At-site Low Flow Frequency Analysis Using Bayesian MCMC: II. Application and Comparative Studies)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권1호
    • /
    • pp.49-63
    • /
    • 2008
  • 본 연구에서는 Bayesian MCMC 방법과 2차 근사식을 이용한 최우추정(Maximum Likelihood Estimation, MLE)방법 방법을 이용하여 낙동강 유역의 본류지점인 낙동, 왜관, 고령교, 진동지점에 대한 점 빈도분석을 수행하고 그 결과로써 불확실성을 포함한 빈도곡선을 작성하였다. 통계적 실험을 통한 두 가지 추정방법의 분석을 위하여 먼저 자료의 길이가 100인 8개의 합성 유량자료 셋을 생성하여 비교 연구를 수행하였으며, 이를 자료길이 36인 실측 유량 자료의 추정결과와 비교하였다. Bayesian MCMC 방법에 의한 평균값과 2차 근사식을 이용한 취우추정방법에 의한 모드에서의 2모수 Weibull 분포의 모수 추정값은 비슷한 결과를 보였으나, 불확실성을 나타내는 하한값과 상한값의 차이는 Bayesian MCMC 방법이 2차 근사식을 이용한 취우추정방법보다 불확실성을 감소시켜 나타내는 것을 알 수 있었다. 또한 실측 유량자료를 이용한 결과, 2차 근사식을 이용한 취우추정방법의 경우 자료의 길이가 감소됨에 따라 불확실성의 범위가 합성유량자료를 사용한 경우에 비해 상대적으로 증가되지만, Bayesian MCMC 방법의 경우에는 자료의 길이에 대한 영향이 거의 없다는 결론을 얻을 수 있었다. 그러므로 저수량 빈도분석을 수행하기 위해 충분한 자료를 확보할 수 없는 국내의 상황을 감안할 때, 위와 같은 결론으로부터 Bayesian MCMC 방법이 불확실성을 표현하는데 있어서 2차 근사식을 이용한 최우추정방법에 비해 합리적일 수 있다는 결론을 얻을 수 있었다.