Bridging hamilton-jacobi safety analysis and reinforcement learning

Johannink, T · 2019 · arXiv 2019.87941

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Value Functions for Temporal Logic: Optimal Policies and Safety Filters

cs.RO · 2026-05-01 · unverdicted · novelty 6.0

Non-Markovian policies from decomposed temporal logic value functions are proven optimal for nested Until, Globally, and Globally-Until specifications and extend Q-function safety filters to complex tasks.

Autopilot-Preserving Residual Q-Learning with HJB-Inspired Finite-Action Risk Filtering for Fixed-Wing UAV Command Supervision

cs.RO · 2026-05-31 · unverdicted · novelty 5.0

An autopilot-preserving residual Q-learning supervisor with HJB-inspired finite-action risk filtering reduces mean RMS path-tracking error from 338.617 m to 44.809 m (86.77% reduction) in fixed simulation benchmarks.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Value Functions for Temporal Logic: Optimal Policies and Safety Filters cs.RO · 2026-05-01 · unverdicted · none · ref 3
Non-Markovian policies from decomposed temporal logic value functions are proven optimal for nested Until, Globally, and Globally-Until specifications and extend Q-function safety filters to complex tasks.
Autopilot-Preserving Residual Q-Learning with HJB-Inspired Finite-Action Risk Filtering for Fixed-Wing UAV Command Supervision cs.RO · 2026-05-31 · unverdicted · none · ref 12
An autopilot-preserving residual Q-learning supervisor with HJB-inspired finite-action risk filtering reduces mean RMS path-tracking error from 338.617 m to 44.809 m (86.77% reduction) in fixed simulation benchmarks.

Bridging hamilton-jacobi safety analysis and reinforcement learning

fields

years

verdicts

representative citing papers

citing papers explorer