• 제목/요약/키워드: 마코프 체인

검색결과 114건 처리시간 0.022초

고준위 방사성 폐기물 처분장 확률론적 안전성평가 신뢰도 제고를 위한 입력 파라미터 연속 베이지안 업데이팅 모듈 개발 (Sequential Bayesian Updating Module of Input Parameter Distributions for More Reliable Probabilistic Safety Assessment of HLW Radioactive Repository)

  • 이연명;조동건
    • 방사성폐기물학회지
    • /
    • 제18권2호
    • /
    • pp.179-194
    • /
    • 2020
  • 기존의 확률론적 안전성 평가의 신뢰도 제고를 위하여 잘 알려진 입력 파라미터의 일반적인 분포에 새롭게 측정된 신뢰도 있는 데이터를 결합하여 사후분포를 구할 수 있는 베이지안 업데이팅 방법론을 제안하였다. 마코프체인 몬테 칼로 샘플링 기법의 알고리듬을 통한 GoldSim 모듈도 개발하였다. 복수의 입력 파라미터의 사전분포에 대해 연속적으로 사후분포를 구해낼 수 있는 베이지안 업데이팅이 가능하도록 개발된 이 모듈을 GoldSim 템플릿 형태의 기존의 GSTSPA 프로그램으로 이행하여 보다 신뢰도 있는 확률론적 방사성폐기물 처분 시스템 안전성 평가가 가능하도록 하였다. 이는 기존에 존재하는 사전분포의 일반적인 형태는 취하되 새롭게 얻어지는 실제 측정치나 전문가들의 의견을 기존의 분포에 적용하여 보다 더 높은 믿음을 갖는 입력 파라미터의 사후분포를 얻을 수 있게 한다. 균열암반 내 핵종 이동에 관련된 몇 개의 입력 파라미터의 사전분포의 세차례의 연속적 업데이팅을 통해 프로그램의 유용성도 예시하였다. 이 연구를 통하여 처분시스템과 같이 장기적 평가가 필요하고 넓은 모델링 지역을 가지며 측정된 입력자료가 부족한 경우 보다 더 믿음직한 방법으로 안전성 평가를 수행할 수 있는 것을 보였다.

적대적 멀티 에이전트 환경에서 효율적인 강화 학습을 위한 정책 모델링 (Policy Modeling for Efficient Reinforcement Learning in Adversarial Multi-Agent Environments)

  • 권기덕;김인철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 멀티 에이전트 강화 학습에서 해결해야 할 중요한 문제는 자신의 작업 성능에 영향을 미칠 수 있는 다른 에이전트들이 존재하는 동적 환경에서 한 에이전트가 시행착오적 상호작용을 통해 어떻게 자신의 최적 행동 정책을 학습할 수 있느냐 하는 것이다. 멀티 에이전트 강화 학습을 위한 기존 연구들은 대부분 단일 에이전트 MDP 기반의 강화 학습기법들을 큰 변화 없이 그대로 적용하거나 비록 다른 에이전트에 관한 별도의 모델을 이용하더라도 다른 에이전트에 관해 요구되는 정보나 가정이 현실적이지 못하다는 한계점을 가지고 있다. 본 논문에서는 멀티 에이전트 강화 학습기술에 기초가 되는 기본 개념들을 정형화하고 이들을 기초로 기존 연구들의 특징과 한계점을 비교한다. 그리고 새로운 행동 정책 모델을 소개한 뒤, 이것을 이용한 강화 학습 방법을 설명한다. 본 논문에서 제안하는 멀티 에이전트 강화학습 방법은 상대 모델을 이용하는 기존의 멀티 에이전트 강화 학습 연구들에서 주로 시도되었던 상대 에이전트의 Q 평가 함수 모델 대신 상대 에이전트의 행동 정책 모델을 학습하며, 표현력은 풍부하나 학습에 시간과 노력이 많이 요구되는 유한 상태 오토마타나 마코프 체인과 같은 행동 정책 모델들에 비해 비교적 간단한 형태의 행동 정책 모델을 이용함으로써 학습의 효율성을 높였다. 또한, 본 논문에서는 대표적인 적대적 멀티 에이전트 환경인 고양이와 쥐게임을 소개하고, 이 게임을 테스베드삼아 비교 실험들을 수행하고 그 결과를 설명함으로써 본 논문에서 제안하는 정책 모델 기반의 멀티 에이전트 강화 학습의 효과를 분석해본다.

베이지안 선택 모형을 이용한 영화흥행 예측 (Predicting Financial Success of a Movie Using Bayesian Choice Model)

  • 이경재;장우진
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1851-1856
    • /
    • 2006
  • 영화는 대표적인 경험재로 가치판단이 주관적이고 제품 수명주기가 매우 짧아 예측의 불확실성이 높기 때문에 이를 정량적인 방법으로 모형화하기는 쉽지 않다. 이러한 한계점에도 불구하고 한 영화의 상업적 성공을 예측하는 것은 영화 제작자나 배급사, 극장 등 모든 주체에게 수익과 직결되는 중요한 문제이기 때문에 지금까지 다양한 통계 모형이 제시되었다. 그러나 이들 모형의 대부분은 영화흥행에는 영향을 미치나 측정할 수 없는 효과를 반영하지 못한다거나, 추정 모수의 효과가 모든 영화에 대해서 같다는 동일성 가정으로 인해 영화간 이질성을 고려하지 못하고 있다. 따라서, 본 연구에서는 추정 모수의 사전분포를 모호사전분포로 정의함으로써 변수들의 불확실성을 반영할 수 있고, 영화간 이질성을 고려할 수 있는 베이지안 선택 모형을 제안하였다. 모수의 사후분포는 마코프체인 몬테카를로 기법인 깁스 샘플러를 이용하여 추정하였다. 또한, 감독, 배우, 장르 등의 영화 별 속성 변수뿐만 아니라, 입소문에 의한 영화관람 결정 등의 구전효과와 경쟁영화의 개봉으로 인한 효과를 반영할 수 있는 변수를 추가하여 모형의 정확성을 높였다. 2005년과 2006년 상반기에 상영된 영화를 바탕으로 모형을 구축하고 인공신경망 모형과 비교한 결과, 전체적인 예측 정확도에서는 인공신경망 모형과 비슷한 결과를 보이나 상업적으로 성공한 영화를 예측하는 데에는 베이지안 선택모형이 보다 더 우수한 것으로 나타났다. 또한, 개봉 주의 경쟁심화 정도 및 개봉 첫 주의 스크린 수 등이 영화 흥행에 가장 중요한 변수로 나타났으며, 영화 개봉 전 그 영화에 대한 기대치가 높을수록 흥행 성적 또한 좋음을 알 수 있었다. 배우의 힘 및 계절성, 영화 평점 등은 이질성을 고려하지 않은 전체수준에서는 통계적으로 유의하지 않은 것으로 나타났으나, 그룹 간 이질성을 반영한 모형에서는 어느 정도 흥행한 영화를 만들기 위해서는 고려되어야 할 요소로 나타났다.렇지 않을 경우 적절한 벤치마킹 대상을 도출할 때까지 추가적인 분석과정을 반복한다. 제안한 방법을 통하여 조직은 기술적 생산 가능성 외에도 다양한 조직 운영 관점에서 적절한 벤치마킹 대상을 선정할 수 있으며, 이에 따른 목표를 수립할 수 있을 것으로 기대한다. 또한 더 나아가 global efficiency 관점에서 효율적 조직이 되기 위하여 단계적인 벤치마킹 대상 선정과 이에 따른 목표를 수립하는데도 유용하리라 판단된다.$1.20{\pm}0.37L$, 72시간에 $1.33{\pm}0.33L$로 유의한 차이를 보였으므로(F=6.153, P=0.004), 술 후 폐환기능 회복에 효과가 있다. 4) 실험군과 대조군의 수술 후 노력성 폐활량은 수술 후 72시간에서 실험군이 $1.90{\pm}0.61L$, 대조군이 $1.51{\pm}0.38L$로 유의한 차이를 보였다(t=2.620, P=0.013). 5) 실험군과 대조군의 수술 후 일초 노력성 호기량은 수술 후 24시간에서 $1.33{\pm}0.56L,\;1.00{\ge}0.28L$로 유의한 차이를 보였고(t=2.530, P=0.017), 술 후 72시간에서 $1.72{\pm}0.65L,\;1.33{\pm}0.3L$로 유의한 차이를 보였다(t=2.540, P=0.016). 6) 대상자의 술 후 폐환기능에 영향을 미치는 요인은 성별로 나타났다. 이에 따른 폐환기능의 차이를 보면, 실험군의 술 후 노력성 폐활량이 48시간에 남자($1.78{\pm}0.61L$)가 여자($1.27{\pm}0.45L$)보다 더 높게 나타났으며 (t=2.170, P=0.042), 72시간에도 역시 남자($2.16{\pm}0.56L$)가 여자($1.50{\pm}0.47L$)보다 더

  • PDF

건전성 예측을 위한 모델변수 추정방법의 비교 (A Comparison Study of Model Parameter Estimation Methods for Prognostics)

  • 안다운;김남호;최주호
    • 한국전산구조공학회논문집
    • /
    • 제25권4호
    • /
    • pp.355-362
    • /
    • 2012
  • 건전성 예측은 구조물의 고장이 발생될 때까지 남은 시간인 잔존유효수명을 예측하는 것으로, 이는 안전 및 정비 계획과 직접적으로 연관되기 때문에 매우 중요하다. 건전성 예측방법에는 물리모델 기반방법, 데이터 기반방법과 두 방법의 장점을 통합하는 방법이 있으며, 본 연구에서는 잔존수명 예측의 정확도가 모델변수 추정과 직접적으로 관련되는 물리모델 기반 건전성 예측에 초점을 맞춘다. 물리모델기반 건전성 예측에서는 모델변수 추정을 통해 시스템 상태의 장기 예측이 가능하지만, 대부분의 실제 구조물들의 상태모델은 여러 개의 모델변수를 포함함은 물론이고, 그 변수들이 서로 상관되어 있기 때문에 모델변수를 추정하는 일은 간단한 문제가 아니다. 본 연구에서는 물리모델 기반 건전성 예측을 위한 세 가지 변수 추정방법들의 차이를 논한다. 이 세 가지 방법들은 파티클 필터, 전반적인 베이지안 접근법, 그리고 순차적인 베이지안 접근법으로 모두 베이지안 추론이라는 하나의 이론적 바탕에 기반하지만, 샘플링 방법이나 갱신 절차 등에서 차이가 있다. 균열성장을 표현하는 Paris 모델의 변수 추정을 통해 세 가지 방법의 차이점이 논해지고, 건전성 예측 메트릭을 이용하여 정량적 차이를 표현한다. 파티클 필터방법이 건전성 예측 메트릭 측면에서 가장 높은 성능을 나타내었지만, 전반적인 베이지안 방법은 파티클 필터방법과 근소한 차이를 보이면서도 데이터가 집단으로 존재할 때에는 가장 효율적인 방법으로 나타났다.