Addressing function approximation error in actor-critic methods,

· 2018

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Augmented Lagrangian Multiplier Network for State-wise Safety in Reinforcement Learning

cs.LG · 2026-05-01 · unverdicted · novelty 7.0

ALaM stabilizes state-wise multiplier networks in safe RL via quadratic penalties and supervised regression on dual targets, guaranteeing multiplier convergence and optimal constrained policies when combined with SAC.

citing papers explorer

Showing 1 of 1 citing paper.

Augmented Lagrangian Multiplier Network for State-wise Safety in Reinforcement Learning cs.LG · 2026-05-01 · unverdicted · none · ref 26
ALaM stabilizes state-wise multiplier networks in safe RL via quadratic penalties and supervised regression on dual targets, guaranteeing multiplier convergence and optimal constrained policies when combined with SAC.

Addressing function approximation error in actor-critic methods,

fields

years

verdicts

representative citing papers

citing papers explorer