• Title/Summary/Keyword: Hierarchical Bayesian analysis

검색결과 80건 처리시간 0.905초

Phrase-based Topic and Sentiment Detection and Tracking Model using Incremental HDP

  • Chen, YongHeng;Lin, YaoJin;Zuo, WanLi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권12호
    • /
    • pp.5905-5926
    • /
    • 2017
  • Sentiments can profoundly affect individual behavior as well as decision-making. Confronted with the ever-increasing amount of review information available online, it is desirable to provide an effective sentiment model to both detect and organize the available information to improve understanding, and to present the information in a more constructive way for consumers. This study developed a unified phrase-based topic and sentiment detection model, combined with a tracking model using incremental hierarchical dirichlet allocation (PTSM_IHDP). This model was proposed to discover the evolutionary trend of topic-based sentiments from online reviews. PTSM_IHDP model firstly assumed that each review document has been composed by a series of independent phrases, which can be represented as both topic information and sentiment information. PTSM_IHDP model secondly depended on an improved time-dependency non-parametric Bayesian model, integrating incremental hierarchical dirichlet allocation, to estimate the optimal number of topics by incrementally building an up-to-date model. To evaluate the effectiveness of our model, we tested our model on a collected dataset, and compared the result with the predictions of traditional models. The results demonstrate the effectiveness and advantages of our model compared to several state-of-the-art methods.

한국지역 집중호우에 대한 반환주기의 베이지안 모형 분석 (A Hierarchical Bayesian Modeling of Temporal Trends in Return Levels for Extreme Precipitations)

  • 김용구
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.137-149
    • /
    • 2015
  • 본 논문에서는 비정상 극치 강수 자료에 대해 계층적 베이지안 모형을 적용하여 시간에 따른 모수의 변화를 추정하며, 미래 확률 강수량에 대한 극단값 분포를 예측하고 더 나아가 반환기간에 대한 경향과 예측 값을 얻고자 한다. 이전의 고전적 통계 방법을 통한 강수 자료의 모수 추정연구의 경우, 자료의 정상성 가정 하에 고정된 모수를 추정하는 방법으로, 최근 나타난 비정상 강수 사상과 같이 강수량이 가지는 분포의 모수적 변화가 예상되는 경우 해석상 문제가 발생한다. 이러한 문제점을 해결하기 위해 모형의 관심모수에 시간에 따른 자기 상관 선형 회귀 함수를 적합한 계층적 베이지안 모형을 고려한다. 제안된 모형의 효율성을 확인하기 위해서 1973년부터 2011년까지 39년 동안의 우리나라 여러지역의 기상 관측소에서 관측된 일일 강우량 자료가 사용하여 대표적인 극단값 분포인 Generalized Extreme Value(GEV) 분포에 적합시키고, 계층적 베이지안 모형을 이용하여 이들 분포의 모수들에 자기상관 시간모형을 소개한 후 우리나라 여러지역에 대한 반환기간에 대한 시간에 따른 경향을 확인하였다.

포아송-로그정규분포 모형에 관한 연구 (A Study on Poisson-lognormal Model)

  • 김용철
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.189-196
    • /
    • 2000
  • 포아송 분포에서 일반적으로 공액 사전 분포를 이용하여 사후확률의 수학적 계산이 간편하도록 한다. 그러나 모수 집합의 제한적 조건 때문에 비공액 사전 분포를 이용할 수 도 있다. 비공액 사전분포의 사용은 사후분포의 형태가 일상적인 분포집합의 형태를 갖지 않으므로 모형의 가정에 따라서 복잡한 구조를 갖을 수 도 있다. 특히 포아송-로그정규분포 모형에서의 모수 추정문제를 몬테 칼로방법을 이용하여 추정하고자 할 때 필요한 완전한 조건부 분포의 형태는 잘 알려진 분포의 형태를 갖지 않는다. 본 논문에서는 계층적 구조를 갖는 포아송-로그정규분포 모형에 대하여 고찰하고 추정에 있어서 잠재적 변수를 활용하여 필요한 난수발생이 쉽도록 하는 방법에 대하여 알아보았다.

  • PDF

Bayes Computations for the Reliability in a Bivariate Exponential Model

  • In Suk Lee;Jang Sik Cho;Sang Gil Kang;Jeong Hwan Ko
    • Communications for Statistical Applications and Methods
    • /
    • 제5권1호
    • /
    • pp.145-153
    • /
    • 1998
  • In this paper, a hierarchical Bayesian analysis of a bivariate exponential model is discussed using Gibbs sampler. Parameters and reliability estimators are obtained. A numerical study is provided.

  • PDF

왜도 타원형 분포를 이용한 준모수적 계층적 선택 모형 (Semiparametric Bayesian Hierarchical Selection Models with Skewed Elliptical Distribution)

  • 정윤식;장정훈
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.101-115
    • /
    • 2003
  • 본 논문에서는 Chen, Dey와 Shao(1999), Branco와 Dey(2001)가 제안한 왜도가 있는 두터운 꼬리를 가지는 오차 분포와 디리슈레 과정 사전분포를 이용한 베이지안 메타분석 (meta-analysis)을 하고자 한다. 베이지안 메타분석을 위하여 가중함수를 고려한 계층적 선택 모형을 이용한다. 이때의 오차항은 왜도가 있는 비정규 분포로 가정한다. 이를 위하여 우선 왜도 타원형 분포의 일반적인 족을 소개한다 이 분포족중 왜도 정규분포와 왜도 t 분포를 오차항 분포로 이용한 베이지안 계층적 선택 모형을 고려하며, 이 때 발생하는 복잡한 베이지안 계산은 MCMC 방법으로 해결한다. 마지막으로, 실제 자료(Johnson, 1993)인 두 가지의 충치예방약의 효과에 대한 차이를 비교하기 위해 얻어진 12개의 연구 자료를 이용하여 본 연구에서 제시된 베이지안 방법을 이용하여 메타분석을 한다.

해수면의 비정상성 검토 및 계층적 Bayesian 모형을 이용한 비정상성 빈도해석 기법 개발 (Analysis on Nonstationarity in Mean Sea Level and Nonstationary Frequency Analysis based on Hierarchical Bayesian Model)

  • 김용탁;오랑치맥 솜야;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.451-451
    • /
    • 2015
  • 최근 1900년부터 1990년 사이 해수면은 매년 평균 1.2mm 상승했지만 1990년부터는 매년 평균 3mm씩 높아지고 있으며, 이에 1990년부터 현재까지 해수면 수위의 상승속도가 이전 90년 동안 측정된 수치보다 2.5배 빠르다는 연구결과가 발표되었다. 해수면 상승으로 인한 피해는 범람과 침식을 야기할 수 있으며 해일 및 폭풍으로 인한 피해를 증가시킴으로 물질적 피해와 인명 피해를 유발할 수 있다. 이러한 이유로 해수면 상승에 따른 과학적인 분석과 신뢰성 있는 전망을 통하여 해수면 상승에 따른 대응과 대비가 필요하다. 이에 본 연구에서는 비정상성 빈도해석 방법을 통하여 미래의 해수면 상승을 고려할 수 있는 비정상성 빈도해석 기법을 개발하였다. 본 연구에서는 극치사상을 추출하기 위해 국립해양조사원 (Korea Hydrographic and Oceanographic Administration, KHOA)에서 관리한 45개 조위관측소의 시 조위 자료를 이용하였다. 45개 조위관측소의 한 시간 단위 자료로부터 연최대 및 연평균 조위계열 (annual average and annual maximum sea level series)을 추출하였다. 본 연구에서는 한반도 해안을 동해안, 서해안, 남해안, 제주 권역으로 구분하고 빈도 해석의 신뢰성을 만족하기 위해 자료 구축기간이 20년 이상이며, 각 해안을 나타낼 수 있는 지점을 선정하였다. 비정상성 빈도해석은 Gumbel 극치분포를 적용하였으며, 계층적 Bayesian 기법을 결합하여 매개변수들에 대한 사후분포를 추정하였다. 본 연구에서는 대부분의 지점에서 비정상성 빈도해석 결과와 정상성 빈도해석 결과와 상당한 차이를 보여주고 있으며, 이는 주로 정상성 가정에 기인하는 문제점으로 판단된다. 향후 기후변화에 따른 연안지역의 홍수 및 사회기반시설의 위험도를 평가하기 위해서는 비정상성을 고려한 빈도해석 절차의 수립과 적용이 필요할 것으로 판단된다.

  • PDF

An analysis of the potential impact of various ozone regulatory standards on mortality

  • Kim, Yong-Ku
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권1호
    • /
    • pp.125-136
    • /
    • 2011
  • Ground-level ozone, an air pollutant that is monitored by the Environmental Protection Agency (EPA), damages human health by irritating the respiratory system, reducing lung function, damaging lung cells, and aggravating asthma and other chronic conditions. In March 2008, the EPA strengthened ozone standards by lowering acceptable limits from 84 parts per billion to 75 parts per billion. Here epidemiologic data is used to study the effects of ozone regulation on human health and assessed how various regulatory standards for ozone may affect nonaccidental mortality, including respiratory-related deaths during ozone season. The assessment uses statistical methods based on hierarchical Bayesian models to predict the potential effects of the different regulatory standards. It also analyzes the variability of the results and ho they are impacted by different modeling assumptions. We focused on the technical an statistical approach to assessing relationship between new ozone regulations and mortality while other researches have detailed the relationship between ozone and human mortality. We shows a statistical correlation between ozone regulations and mortality, with lower limits of acceptable ozone linked to a decrease in deaths, and projects that mortality is expected to decrease by reducing ozone regulatory standards.

동적 베이스망 기반의 걸음걸이 분석 (Dynamic Bayesian Network-Based Gait Analysis)

  • 김찬영;신봉기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.354-362
    • /
    • 2010
  • 본 연구는 동적 베이스 망을 이용하여, 사람의 보행 동작을 보행 방향과 보행 자세로 분리하여 계층적으로 분석하는 방법을 제안한다. DBN의 일종인 FHMM을 기본 바탕으로 하여, 걸음걸이 동작 특성을 고려하여 순환 고리형 상태 공간 구조로 '보행 동작 디코더'(Gait Motion Decoder, GMD)를 설계한다. 기존 연구에는 보행자의 식별에만 치중을 하고 보행 방향의 변화, 관찰 각도에 제한적이거나 보행 동작에 대한 분석이 없었다. 반면에 본 연구에서는 동작과 자세를 적극적으로 표현하여 임의 방향의 보행, 방향의 변화, 보행 자세까지 인식할 수 있도록 하였다. 실험 결과 동작과 자세의 관점에서 걸음걸이 방향을 분석한 결과 96.5%의 방향 인식률을 기록하였다. 본 연구는 보행 동작을 방향과 보행 자세로 계층적으로 분석하는 최초의 방법 및 시도이며 향후 상황별 휴먼 동작 분석에 크게 활용할 수 있을 것이다.

한국지역 집중호우에 대한 반환주기의 베이지안 모형 분석 (A Bayesian Analysis of Return Level for Extreme Precipitation in Korea)

  • 이정진;김남희;권혜지;김용구
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.947-958
    • /
    • 2014
  • 집중호우의 특성을 이해하는 것은 수문관리 및 재해방재 등에서 매우 중요하다. 특히 반환주기는 이러한 집중호우의 특성을 나타내는 측정치로 자주 사용된다. 본 논문에서는 베이지안 계층적 모형을 이용하여 강우의 반환주기에 대한 공간구조를 분석하였다. 먼저 국내 62개 지점에서 측정한 강우 강도을 기초로 하여 연간 일일 최대강우량과 특정한 수준을 초과하는 강우량에 대해서 generalized extreme value(GEV)와 generalized Pareto distribution(GPD)를 각각 가정하여 추정하였다. 집중호우 반환주기에 대한 공간구조는 이 GEV 분포와 GPD 분포의 모수에 공간구조를 가지는 다변량 정규분포를 이용하여 설명하였다. 제안된 모형을 국내 76개 지역에서 39년간 측정된 일별 강우량 관측자료에 적용하였다.

극치자료계열의 Scaling 특성과 Bayesian GLM Model을 이용한 지역빈도해석 (A Bayesian GLM Model Based Regional Frequency Analysis Using Scaling Properties of Extreme Rainfalls)

  • 김진영;권현한;이병석
    • 대한토목학회논문집
    • /
    • 제37권1호
    • /
    • pp.29-41
    • /
    • 2017
  • 확률강수량 산정은 하천관리, 수공구조물 설계 및 위험도 분석에 있어 중요한 기초적인 자료 중 하나이다. 실무에서는 대표지속시간에 대해서 지점빈도해석을 통해 확률강수량을 추정하고 이를 지속시간에 대해서 회귀분석을 실시하여 IDF (intensity-duration-frequency) 곡선을 작성한다. 이들 IDF곡선을 활용하여 기타 지속시간에 대해서는 내삽 또는 외삽으로 보간 하여 확률강수량 추정이 이루어지고 있다. 우리나라의 경우 상대적으로 자료 연한이 짧은 점을 고려한다면, 보다 정확하고 신뢰성 있는 확률강수량 산정 기법의 필요성이 대두되고 있다. 이러한 이유로 본 연구에서는 Bayesian GLM 모형을 통하여 자료의 확률분포 매개변수의 Scaling 특성을 고려할 수 있는 지역빈도해석 모형을 개발하였다. 모형 적용결과 개별지점에서 효과적인 매개변수 추정뿐만 아니라, 유역전체의 특성을 대표하는 매개변수 추정이 가능하였다. 본 연구결과를 통해 도출된 IDF 곡선은 향후 다양한 수자원분야의 기초자료로 활용될 수 있을 것으로 기대되며, 미계측유역 또는 지속시간별 자료가 불충분한 지역에 대해서도 활용이 가능할 것으로 판단된다.