Recovery rl: Safe reinforcement learning with learned recovery zones

· 2021

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Do We Really Need Immediate Resets? Rethinking Collision Handling for Efficient Robot Navigation

cs.RO · 2026-05-04 · unverdicted · novelty 6.0

MCB decouples per-collision termination from global resets in DRL navigation training, yielding faster early-stage success-rate gains in simulation and deployable policies on real robots.

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

cs.RO · 2025-10-13 · unverdicted · novelty 6.0

A separate regulator module adaptively scales actions in RL to reduce constraint violations while preserving exploration, yielding up to 126x fewer violations and over 10x higher returns on Safety Gym tasks.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Do We Really Need Immediate Resets? Rethinking Collision Handling for Efficient Robot Navigation cs.RO · 2026-05-04 · unverdicted · none · ref 21
MCB decouples per-collision termination from global resets in DRL navigation training, yielding faster early-stage success-rate gains in simulation and deployable policies on real robots.
Constraint-Aware Reinforcement Learning via Adaptive Action Scaling cs.RO · 2025-10-13 · unverdicted · none · ref 23
A separate regulator module adaptively scales actions in RL to reduce constraint violations while preserving exploration, yielding up to 126x fewer violations and over 10x higher returns on Safety Gym tasks.

Recovery rl: Safe reinforcement learning with learned recovery zones

fields

years

verdicts

representative citing papers

citing papers explorer