SB-TRPO: Towards Safe Reinforcement Learning with Hard Constraints

· 2025 · cs.LG · arXiv 2512.23770

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open full Pith review browse 1 citing papers arXiv PDF

abstract

In safety-critical domains, reinforcement learning (RL) agents must often satisfy strict, zero-cost safety constraints while accomplishing tasks. Existing model-free methods frequently either fail to achieve near-zero safety violations or become overly conservative. We introduce Safety-Biased Trust Region Policy Optimisation (SB-TRPO), a principled algorithm for hard-constrained RL that dynamically balances cost reduction with reward improvement. At each step, SB-TRPO updates via a dynamic convex combination of the reward and cost natural policy gradients, ensuring a fixed fraction of optimal cost reduction while using remaining update capacity for reward improvement. Our method comes with formal guarantees of local progress on safety, while still improving reward whenever gradients are suitably aligned. Experiments on standard and challenging Safety Gymnasium tasks demonstrate that SB-TRPO consistently achieves the best balance of safety and task performance in the hard-constrained regime.

representative citing papers

Ratio-Variance Regularized Policy Optimization

cs.LG · 2026-05-26 · unverdicted · novelty 5.0

R²VPO uses ratio-variance regularization as a distributional soft brake on policy updates, claiming better performance than PPO on math reasoning and robotic control without hard clipping.

citing papers explorer

Showing 1 of 1 citing paper.

Ratio-Variance Regularized Policy Optimization cs.LG · 2026-05-26 · unverdicted · none · ref 5 · internal anchor
R²VPO uses ratio-variance regularization as a distributional soft brake on policy updates, claiming better performance than PPO on math reasoning and robotic control without hard clipping.

SB-TRPO: Towards Safe Reinforcement Learning with Hard Constraints

fields

years

verdicts

representative citing papers

citing papers explorer