• Title/Summary/Keyword: 보상 확률

Search Result 114, Processing Time 0.03 seconds

Probabilistic risk assessment for the improvement in power quality (전력품질 향상을 위한 확률론적 위험도 평가 방안)

  • Han, Jong-Hoon;Jang, Gil-Soo
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.131_132
    • /
    • 2009
  • 순간전압강하에 대한 다양한 전력품질 보상기기에 대한 투자 여부를 결정하기 위해서는 장비에 대한 기술적이고 경제적인 분석이 필요하다. 전력품질 보상기기에 대한 수명비용을 분석하기 위해 반복 수행에 있어 강력한 모델인 몬테카를로 시뮬레이션을 이용하여 확률론적 위험도 평가를 수행하였으며, 확정모델의 분석 결과와 비교하였다. 확률론적 분석을 통하여 불확실성을 반영한 보다 현실적인 위험도 평가 결과를 얻을 수 있다.

  • PDF

Evaluating a successor representation-based reinforcement learning algorithm in the 2-stage Markov decision task (2-stage 마르코프 의사결정 상황에서 Successor Representation 기반 강화학습 알고리즘 성능 평가)

  • Kim, So-Hyeon;Lee, Jee Hang
    • Annual Conference of KIPS
    • /
    • 2021.11a
    • /
    • pp.910-913
    • /
    • 2021
  • Successor representation (SR) 은 두뇌 내 해마의 공간 세포가 인지맵을 구성하여 환경을 학습하고, 이를 활용하여 변화하는 환경에서 유연하게 최적 전략을 수립하는 기전을 모사한 강화학습 방법이다. 특히, 학습한 환경 정보를 활용, 환경 구조 안에서 목표가 변화할 때 강인하게 대응하여 일반 model-free 강화학습에 비해 빠르게 보상 변화에 적응하고 최적 전략을 찾는 것으로 알려져 있다. 본 논문에서는 SR 기반 강화학습 알고리즘이 보상의 변화와 더불어 환경 구조, 특히 환경의 상태 천이 확률이 변화하여 보상의 변화를 유발하는 상황에서 어떠한 성능을 보이는 지 확인하였다. 벤치마크 알고리즘으로 SR 의 특성을 목적 기반 강화학습으로 통합한 SR-Dyna 를 사용하였고, 환경 상태 천이 불확실성과 보상 변화가 동시에 나타나는 2-stage 마르코프 의사결정 과제를 실험 환경으로 사용하였다. 시뮬레이션 결과, SR-Dyna 는 환경 내 상태 천이 확률 변화에 따른 보상 변화에는 적절히 대응하지 못하는 결과를 보였다. 본 결과를 통해 두뇌의 강화학습과 알고리즘 강화학습의 차이를 이해하여, 환경 변화에 강인한 강화학습 알고리즘 설계를 기대할 수 있다.

Noise-Biased Compensation of Minimum Statistics Method using a Nonlinear Function and A Priori Speech Absence Probability for Speech Enhancement (음질향상을 위해 비선형 함수와 사전 음성부재확률을 이용한 최소통계법의 잡음전력편의 보상방법)

  • Lee, Soo-Jeong;Lee, Gang-Seong;Kim, Sun-Hyob
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.1
    • /
    • pp.77-83
    • /
    • 2009
  • This paper proposes a new noise-biased compensation of minimum statistics(MS) method using a nonlinear function and a priori speech absence probability(SAP) for speech enhancement in non-stationary noisy environments. The minimum statistics(MS) method is well known technique for noise power estimation in non-stationary noisy environments. It tends to bias the noise estimate below that of true noise level. The proposed method is combined with an adaptive parameter based on a sigmoid function and a priori speech absence probability (SAP) for biased compensation. Specifically. we apply the adaptive parameter according to the a posteriori SNR. In addition, when the a priori SAP equals unity, the adaptive biased compensation factor separately increases ${\delta}_{max}$ each frequency bin, and vice versa. We evaluate the estimation of noise power capability in highly non-stationary and various noise environments, the improvement in the segmental signal-to-noise ratio (SNR), and the Itakura-Saito Distortion Measure (ISDM) integrated into a spectral subtraction (SS). The results shows that our proposed method is superior to the conventional MS approach.

Improved Time Delay Difference Estimation for Target Tracking using Doppler Information (도플러 효과의 보상을 통한 시간지연 차의 추정)

  • 염석원;윤동헌;윤동욱;고한석
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.8
    • /
    • pp.25-33
    • /
    • 1998
  • 본 논문에서는 한 쌍의 센서를 이용하여 미지의 수중 음향 신호의 시간지연의 차 (Time Delay Difference)를 추정하고 탐지하는 알고리즘을 다루고 있다. 전형적인 시간지연 차의 최적화 추정 기법은 두 신호의 상관관계(Cross Correlation)에 의한 ML(Maximum likelihood)추정으로 구할 수 있지만, 실제 수중 음향 환경 하에서 시간 지연뿐만 아니라 표 적의 이동에 의하여 발생하는 도플러 효과로 신호의 주파수도 변하게 된다. 이러한 신호 주 파수의 올바른 고려 없이 단순히 두 신호의 시간지연만을 추정하는 방법은 불가피한 에러를 생성하게 된다. 본 논문에서는 시시각각 변하는 시간지연의 차를 구하기 위한 준 최적화 기 법인 확률분포 함수의 Recursive Filter에 시간 지연 차와 도플러효과의 2차원 확률분포 함 수를 적용한 추정 알고리즘을 제안한다. 관측된 신호의 리샘플링(Resampling)을 통하여 도 플러 효과를 보상한 후 2차원 Conditional likelihood를 구하고 Projection과 Correction 과정 을 통하여 시간지연과 도플러 효과에 대한 사후확률을 구한다. 그리고 이러한 알고리즘을 가상 시나리오에 대한 모의실험을 통하여 평가한다.

  • PDF

Evaluating SR-Based Reinforcement Learning Algorithm Under the Highly Uncertain Decision Task (불확실성이 높은 의사결정 환경에서 SR 기반 강화학습 알고리즘의 성능 분석)

  • Kim, So Hyeon;Lee, Jee Hang
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.8
    • /
    • pp.331-338
    • /
    • 2022
  • Successor representation (SR) is a model of human reinforcement learning (RL) mimicking the underlying mechanism of hippocampal cells constructing cognitive maps. SR utilizes these learned features to adaptively respond to the frequent reward changes. In this paper, we evaluated the performance of SR under the context where changes in latent variables of environments trigger the reward structure changes. For a benchmark test, we adopted SR-Dyna, an integration of SR into goal-driven Dyna RL algorithm in the 2-stage Markov Decision Task (MDT) in which we can intentionally manipulate the latent variables - state transition uncertainty and goal-condition. To precisely investigate the characteristics of SR, we conducted the experiments while controlling each latent variable that affects the changes in reward structure. Evaluation results showed that SR-Dyna could learn to respond to the reward changes in relation to the changes in latent variables, but could not learn rapidly in that situation. This brings about the necessity to build more robust RL models that can rapidly learn to respond to the frequent changes in the environment in which latent variables and reward structure change at the same time.

Power Control for D2D Communication in the Cellular System: Compensation for Channel Estimation Error (셀룰라 시스템에서 D2D 통신 전력제어: 채널 추정에러 보상 방안)

  • Oh, Changyoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.127-128
    • /
    • 2018
  • 본 논문에서는 채널추정에러가 존재하는 셀룰라시스템 환경에서 D2D 통신을 위한 전력제어 알고리즘 운용방안을 제안한다. 전력제어의 목적은 요구하는 SIR 값을 유지하는 것이다. 하지만, 채널 추정에러 환경에서의 SIR 성능은 확률적 분포를 가지게 된다. 이러한 확률적 SIR 성능 분포를 고려하여, 채널추정에러를 보상하는 가변적인 SIR 적용과 재전송 기법을 복합하여 D2D 통신을 위한 전력제어 기법을 제안하도록 한다.

  • PDF

A study on the call processing of DS-CDMA system using the simulcasting scheme (Simulcasting 기법을 적용한 DS-CDMA 시스템의 호처리에 관한 연구)

  • 노재호;권종형;정현민;강창언
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.22 no.12
    • /
    • pp.2664-2673
    • /
    • 1997
  • The signal fading distortion has effect on the capacity of cellular mobile communication systems. The short term fading is solved by signal processing techniques depending on the radio communication methods, but another distortion compensation techniques are necessary to combat long term fading. in this paper, we have simulated the call processing in DS-CDMA system using distributed antennas to overcome the long term fading. From the simulation results, we have conformed that the blocking probability of a new call andthe forced probability of handoff-request-call have decreased by increasing the number of distributed antennas.

  • PDF

Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation (PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용)

  • Kim Wooil;Ko Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.1
    • /
    • pp.58-68
    • /
    • 2005
  • In this paper, we propose a scheme to improve discriminative property in the feature compensation method for robust speech recognition under noisy environments. The estimation of noisy speech model used in existing feature compensation methods do not guarantee the computation of posterior probabilities which discriminate reliably among the Gaussian components. Estimation of Posterior probabilities is a crucial step in determining the discriminative factor of the Gaussian models, which in turn determines the intelligibility of the restored speech signals. The proposed scheme employs minimum classification error (MCE) training for estimating the parameters of the noisy speech model. For applying the MCE training, we propose to identify and determine the 'competing components' that are expected to affect the discriminative ability. The proposed method is applied to feature compensation based on parallel combined mixture model (PCMM). The performance is examined over Aurora 2.0 database and over the speech recorded inside a car during real driving conditions. The experimental results show improved recognition performance in both simulated environments and real-life conditions. The result verifies the effectiveness of the proposed scheme for increasing the performance of robust speech recognition systems.

Study on Performance Variation of Machine Vision according to Velocity of an Object and Precision Improvement by Linear Compensation (측정물의 속도에 따른 머신비젼의 성능변화와 선형보상에 의한 정밀도 향상)

  • Choi, Hee-Nam;Kang, Bong-Soo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.19 no.12
    • /
    • pp.903-909
    • /
    • 2018
  • In this paper, performance analysis of machine vision techniques is presented to improve the convenience and speed of automatic inspection in the industrial field when machine vision is applied to the image not taken in the stationary state, but in the moving state on a conveyer. When the length of cylindrical rods used for automobiles was measured using the edge detection method, the conveying speed increased, and the uncertainty of the boundary between the background and the part image increased, which resulted in a shorter image of the object taken. This paper proposes a linear compensation method to predict the biased errors of the length measurements after examining the pattern of biased and random errors, respectively, with 6 different types of specimens and 7 velocity stages. The length measurement corrected by the linear compensation method had the same accuracy as the stationary state within the speed range of 30 cm/s and could enhance the application capability in automatic inspections.

Detection and Time Delay Estimation of Unknown Target (미지표적의 식별과 시간지연 차의 추적연구)

  • 염석원
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.499-502
    • /
    • 1998
  • 본 논문에서는 한 쌍의 수동소나를 이용하여 미지의 잠항물체의 존재 유무를 확인하고 각 센서에 도달하는 시간지연의 차를 평가하는 Detection과 Tracking 알고리즘을 연구한다. 이 과정에서 이동하는 표적의 속력에 의한 도플러효과를 보상하는 2차원 확률분포 함수를 적용함으로 보다 정확한 결과를 도출한다. 관측신호의 Cross-Correlation과 Bayesian Method를 이용하여 계산한 시간지연과 도플러효과 비의 이차원 Likelihood 함수로부터 사후확률 (Posterior Probability)을 구하여 발견 평가와 추적을 수행한다.

  • PDF