• 제목/요약/키워드: generalized advantage estimation

검색결과 10건 처리시간 0.025초

Basis pursuit denoising을 사용한 두 수신기 간 시간 지연 추정 알고리즘 (Time delay estimation between two receivers using basis pursuit denoising)

  • 임준석;정명준
    • 한국음향학회지
    • /
    • 제36권4호
    • /
    • pp.285-291
    • /
    • 2017
  • 두 개 수신기에 들어오는 신호 간의 시간 지연 값을 추정하기 위한 방법들이 연구되고 있다. 그중에서 채널 추정 기법을 기반으로 한 방법의 경우는 두 수신기의 입력 신호간의 상대적인 지연을 채널의 임펄스 응답처럼 추정하는 방법이다. 이 경우에는 해당 채널의 특성이 희소 채널의 특성을 가지고 있다. 기존의 방법들은 채널의 희소성을 이용하지 못하고 있는 방법이 대부분이다. 본 논문에서는 채널의 희소성을 이용하기 위하여 희소 신호 최적화 방법의 하나인 BPD(Basis Pursuit Denoising) 최적화 기법을 사용한 시간 지연 추정 방법을 제안한다. 제안한 방법을 기존의 일반 상호 상관(Generalized Cross Correlation, GCC) 방법과 적응 소유치 분해법 및 희소 신호 추정법의 일종인 RZA-LMS(Reweighted Zero-Attracting Least Mean Square)들과 비교하여, 백색 가우시안 신호원과 유색 신호원 및 해양 포유류 신호원에 대해서 비교 실험을 하였다. 그 결과 갑자기 추정성능이 열화되는 문턱 현상이 늦게 나타나거나 훨씬 줄어드는 것을 보였다.

PGA: An Efficient Adaptive Traffic Signal Timing Optimization Scheme Using Actor-Critic Reinforcement Learning Algorithm

  • Shen, Si;Shen, Guojiang;Shen, Yang;Liu, Duanyang;Yang, Xi;Kong, Xiangjie
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권11호
    • /
    • pp.4268-4289
    • /
    • 2020
  • Advanced traffic signal timing method plays very important role in reducing road congestion and air pollution. Reinforcement learning is considered as superior approach to build traffic light timing scheme by many recent studies. It fulfills real adaptive control by the means of taking real-time traffic information as state, and adjusting traffic light scheme as action. However, existing works behave inefficient in complex intersections and they are lack of feasibility because most of them adopt traffic light scheme whose phase sequence is flexible. To address these issues, a novel adaptive traffic signal timing scheme is proposed. It's based on actor-critic reinforcement learning algorithm, and advanced techniques proximal policy optimization and generalized advantage estimation are integrated. In particular, a new kind of reward function and a simplified form of state representation are carefully defined, and they facilitate to improve the learning efficiency and reduce the computational complexity, respectively. Meanwhile, a fixed phase sequence signal scheme is derived, and constraint on the variations of successive phase durations is introduced, which enhances its feasibility and robustness in field applications. The proposed scheme is verified through field-data-based experiments in both medium and high traffic density scenarios. Simulation results exhibit remarkable improvement in traffic performance as well as the learning efficiency comparing with the existing reinforcement learning-based methods such as 3DQN and DDQN.

대중교통 카드(RF Card) 자료를 활용한 수도권 도시철도 운영기관 간 수입금 정산 방법론에 대한 연구 (Allocating Revenues to Metropolitan Railroad Operators Using Public Transportation Card Data)

  • 신성일;이창주;김찬성
    • 대한교통학회지
    • /
    • 제28권2호
    • /
    • pp.7-19
    • /
    • 2010
  • 도시철도가 가지고 있는 쾌적성, 편리성 그리고 정시성의 장점은 도시철도의 등장 이후 그 이용률을 어느 수준까지 꾸준히 증가시켜왔다. 이에 따라 지자체를 비롯한 수도권은 지하철의 새로운 도입을 포함한 도시철도의 연장을 점차 증가시켜왔으며, 현재 수도권의 경우 2010년 현재 총 5개의 운영 기관이 총 14개 노선을 운영 중에 있다. 이러한 도시철도의 장점은 2004년 서울시 통합 대중교통개편과 2007년 수도권 통합 환승할인요금제 시행 이후 편리성과 연계성 측면에서 더욱 더 부각되고 있다. 하지만 이러한 대중교통 통합요금제의 시행은 그 동안 도시철도 운영기관 간의 수입금 정산 문제를 버스와 도시철도 문제로까지 확대시켜 좀 더 정확하고 복잡한 정산 방식의 필요성을 불러일으켰다. 이에 본 연구에서는 수도권 통합 환승할인요금제 시행 이후 대중교통 운영기관 간 수입금 정산 문제를 다루었다. 구체적으로는 대중교통체계 개편 이후 본격적으로 도입된 대중교통 카드(RF Card) 자료로부터 수도권 도시철도 이용자료(O/D) 구축을 시작으로 일반화 비용 추정, 수입금 정산 알고리즘 제안, 끝으로 이를 반영한 사례 연구 순으로 연구를 진행하였다. 여기서 본 연구에서의 O/D 추출과정의 정확성 검증을 위해 일정기간 동안의 (주)한국스마트카드사에서 철도 운영기관에 지급한 수입금과 본 연구에서 도출된 철도부문의 O/D(수입금)를 비교 분석하였다. 또한 일반화 비용 추정을 위해 설문조사와 환승역 실태 조사를 시행하였고, 본 연구에서 구축한 유사 경로 검증을 위해 실제 도시철도 이용자의 통행경로를 조사하였다. 본 연구에서 제시한 방법론을 통해 현재 수도권 도시철도 운영기관 간 수입금 정산 문제뿐만이 아니라 향후 도입될 경전철 및 민자 철도의 수입금 정산 문제도 해결될 것으로 기대된다.

The Marshall-Olkin generalized gamma distribution

  • Barriga, Gladys D.C.;Cordeiro, Gauss M.;Dey, Dipak K.;Cancho, Vicente G.;Louzada, Francisco;Suzuki, Adriano K.
    • Communications for Statistical Applications and Methods
    • /
    • 제25권3호
    • /
    • pp.245-261
    • /
    • 2018
  • Attempts have been made to define new classes of distributions that provide more flexibility for modelling skewed data in practice. In this work we define a new extension of the generalized gamma distribution (Stacy, The Annals of Mathematical Statistics, 33, 1187-1192, 1962) for Marshall-Olkin generalized gamma (MOGG) distribution, based on the generator pioneered by Marshall and Olkin (Biometrika, 84, 641-652, 1997). This new lifetime model is very flexible including twenty one special models. The main advantage of the new family relies on the fact that practitioners will have a quite flexible distribution to fit real data from several fields, such as engineering, hydrology and survival analysis. Further, we also define a MOGG mixture model, a modification of the MOGG distribution for analyzing lifetime data in presence of cure fraction. This proposed model can be seen as a model of competing causes, where the parameter associated with the Marshall-Olkin distribution controls the activation mechanism of the latent risks (Cooner et al., Statistical Methods in Medical Research, 15, 307-324, 2006). The asymptotic properties of the maximum likelihood estimation approach of the parameters of the model are evaluated by means of simulation studies. The proposed distribution is fitted to two real data sets, one arising from measuring the strength of fibers and the other on melanoma data.

근사 공분산 행렬을 이용한 빠른 입사각 추정 알고리듬 (Fast DOA Estimation Algorithm using Pseudo Covariance Matrix)

  • 김정태;문성훈;한동석;조명제;김정구
    • 대한전자공학회논문지TC
    • /
    • 제40권1호
    • /
    • pp.15-23
    • /
    • 2003
  • 본 논문에서는 입사 신호의 근사 공분산 행렬을 이용하여 신호의 입사각을 빠르게 추정하는 입사각 추정 알고리듬을 제안한다. MUSIC(MUltiple Signal Classification) 알고리듬과 같은 기존의 부분공간 입사각 추정 알고리듬은 입력 공분산 행렬을 구하기 위해서 다수의 표본 신호를 필요로 하며, 입력 공분산 행렬을 획득하기 위한 표본 신호의 수신시간 동안 입사각 추정이 수행될 수 없으므로 빠른 신호처리가 불가능하다. 또한 코히어런트 신호가 입사하는 경우에 코히어런트 신호간의 간섭으로 신호의 입사각을 정확하게 추정할 수 없다. 제안한 입사각 추정 알고리듬은 빔 형성기를 이용하여 매 표본 신호의 공간적인 빔 형성을 먼저 수행하여 신호간의 간섭을 제거한 후에 센서의 출력 값을 이용하여 방위각 응답(bearing response)과 방향 스펙트럼(directional spectrum)을 구한다. 방위각 응답으로 대략적인 신호의 입사각을 추정한 후에 방향 스펙트럼을 이용하여 정착하게 신호의 입사각을 추정한다. 제안 입사각 추정 알고리듬은 공분산 행렬을 구하기 위하여 그 순간의 각 어레이 소자에 입사되는 표본 신호만을 사용하고 방위각 응답을 구하기 위해서 몇 순간 동안의 표본 신호만 필요로 하므로 기존 입사각 추정 알고리듬에 비하여 크게 향상된 입사각 추정 속도를 갖는다.

소지역 실업자수 추정을 위한 로지스틱 선형혼합모형 기반 EBLUP 타입 추정량 평가 (Evaluation of EBLUP-Type Estimator Based on a Logistic Linear Mixed Model for Small Area Unemployment)

  • 김서영;권순필
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.891-908
    • /
    • 2010
  • 근래 소지역 추정(small area estimation)에 관한 연구는 비교적 활발하게 이루어진 편인데 비해, 우리나라의 국가통계 작성에 실제 활용된 사례는 거의 없는 실정이다. 이는 소지역 추정이 갖는 많은 장점에도 불구하고 공식통계 활용 여부를 판단하기가 그만큼 어렵기 때문이다. 본 연구는 소지역 추정방법에 의해 우리나라 시군구 실업자 통계를 생산하는 방법을 모색하고자 한다. 시군구 실업자수 추정은 로지스틱 선형혼합모형에 의한 EBLUP 타입(EBLUP-type) 추정량을 사용하였다. 실제자료분석과 모의실험 결과에 대해 다양한 평가 방법을 적용하고, 추정량의 특성을 비교 분석하였다. 그 결과 본 연구에서 적용한 로지스틱 선형혼합모형 기반 EBLUP 타입 추정량은 우리나라 시군구 실업자수 추정에 활용 가능성이 높은 것으로 평가되었다.

Quantitative Comparison of Probabilistic Multi-source Spatial Data Integration Models for Landslide Hazard Assessment

  • Park No-Wook;Chi Kwang-Hoon;Chung Chang-Jo F.;Kwon Byung-Doo
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.622-625
    • /
    • 2004
  • This paper presents multi-source spatial data integration models based on probability theory for landslide hazard assessment. Four probabilistic models such as empirical likelihood ratio estimation, logistic regression, generalized additive and predictive discriminant models are proposed and applied. The models proposed here are theoretically based on statistical relationships between landslide occurrences and input spatial data sets. Those models especially have the advantage of direct use of continuous data without any information loss. A case study from the Gangneung area, Korea was carried out to quantitatively assess those four models and to discuss operational issues.

  • PDF

Signal parameter estimation through hierarchical conjugate gradient least squares applied to tensor decomposition

  • Liu, Long;Wang, Ling;Xie, Jian;Wang, Yuexian;Zhang, Zhaolin
    • ETRI Journal
    • /
    • 제42권6호
    • /
    • pp.922-931
    • /
    • 2020
  • A hierarchical iterative algorithm for the canonical polyadic decomposition (CPD) of tensors is proposed by improving the traditional conjugate gradient least squares (CGLS) method. Methods based on algebraic operations are investigated with the objective of estimating the direction of arrival (DoA) and polarization parameters of signals impinging on an array with electromagnetic (EM) vector-sensors. The proposed algorithm adopts a hierarchical iterative strategy, which enables the algorithm to obtain a fast recovery for the highly collinear factor matrix. Moreover, considering the same accuracy threshold, the proposed algorithm can achieve faster convergence compared with the alternating least squares (ALS) algorithm wherein the highly collinear factor matrix is absent. The results reveal that the proposed algorithm can achieve better performance under the condition of fewer snapshots, compared with the ALS-based algorithm and the algorithm based on generalized eigenvalue decomposition (GEVD). Furthermore, with regard to an array with a small number of sensors, the observed advantage in estimating the DoA and polarization parameters of the signal is notable.

Gradient방법과 일반화최소자승법을 이용한 관측교통량기반 O/D 추정방법에 관한 예측력 비교평가 연구 (Comparative study on the O/D estimation using Gradient method and Generalized Least Square method)

  • 이승재;김종형
    • 대한교통학회지
    • /
    • 제18권2호
    • /
    • pp.41-52
    • /
    • 2000
  • 우리나라와 같은 개도국은 교통상황이 급변하고, 교통환경이 안정화되지 않은 사정을 고려해보면 비용과 시간이 다소 제약을 받고 있는 상황에 있어서 교통계획을 수립해야 하는 경우가 빈번히 발생한다고 볼 수 있다. 이러한 상황에서 O/D조사(가구방문조사, 노측면접조사 등)를 충실히 행하기에는 많은 어려움이 따르고, 그 결과 또한 만족할 만한 O/D를 구하기에는 현실적으로 매우 힘든 상황이라고 판단된다. 위와 같은 현실적인 문제점과 배경에 힘입어 최근 들어 국내외적으로 교통량을 기반으로 하여 O/D를 추정하는 기법개발에 관한 연구가 활발히 진행되고 있는 추세이다. 그러나, 현실적인 규모의 교통망상에 적용될 수 있는 연구는 많았지만, 그러한 접근법들의 장·단점을 비교 분석한 연구는 많지 않았다. 따라서 본 연구는 기존의 관측교통량을 이용한 O/D추정모형을 교통계획적 측면에서 정적(static)기법을 중심으로 살펴보고, 이러한 관측교통량으로 O/D를 추정하는 모형 중에서 대규모 교통망에서 현실적으로 이용가능성이 높다고 판단되는 2단계모형(bi-level(GLS))과 gradient방법을 중심으로 그 가능성과 타당성을 검토하였다. 연구방법은 2단계모형방법 (GLS방법)과 gradient 방법을 가상교통망에 적용하여 모형의 적정성을 평가한 후, 그 결과를 비교·분석하여 그 예측력을 살펴보았다.

  • PDF

입자군집최적화 알고리듬을 이용한 효율적인 TOPMODEL의 불확실도 분석 (Efficient Uncertainty Analysis of TOPMODEL Using Particle Swarm Optimization)

  • 조희대;김동균;이강희
    • 한국수자원학회논문집
    • /
    • 제47권3호
    • /
    • pp.285-295
    • /
    • 2014
  • 멀티모달 최적화 알고리듬의 일종인 ISPSO와 불확실도 분석기법인 GLUE를 결합한 ISPSO-GLUE 기법을 TOPMODEL의 불확실도 분석에 적용하였으며, 그 결과를 GLUE 기법과 비교하였다. 두 기법 모두 같은 횟수만큼 모형을 실행하였을 때 ISPSO-GLUE 기법의 누적성능이 더 좋아지는 시점을 발견할 수 있었으며, 그 이후로도 ISPSO-GLUE 기법은 GLUE 기법과는 달리 점진적인 성능의 향상을 보여 주었다. 두 기법이 비슷한 모양과 양상의 95% 불확실도 구간을 생성하였다. 하지만 ISPSO-GLUE 기법이 약5.4배 더 많은 관측치를 포함하는 것으로 나타났으며 GLUE 기법에 비해 훨씬 적은횟수의 모형실행으로도 좋은 성능의 불확실도 구간을 얻을 수 있는 것으로 나타났다. ISPSO-GLUE 기법과 비교했을 때GLUE 기법이 최대 첨두유량의 감쇠곡선 부분에서 불확실도를 과대평가하였다. 이 시간대에 대해서는 GLUE의 경우 불확실도 를 줄이기 위해 더 많은 행동모형들을 찾을 필요가 있다. ISPSO-GLUE 기법이 정량적인 성능평가에서 훨씬 많은 관측치를 포함할 수 있었다는 것은 이 기법의 가능성을 잘 보여 주었다고 할 수 있으며, 특히 계산적으로 값비싼 수문모형에서는 보다 큰 성능의 차이를 보일 것으로 기대된다.