Q-learning and Pontryagin’s minimum principle

Prashant Mehta, Sean Meyn · 2009

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Offline Constrained Reinforcement Learning under Partial Data Coverage

stat.ML · 2025-05-23 · unverdicted · novelty 7.0

PDOCRL is an oracle-efficient primal-dual method for offline constrained RL under general function approximation that returns near-optimal policies with O(eps^{-2}) samples under partial optimal-policy coverage and a stronger realizability condition.

citing papers explorer

Showing 1 of 1 citing paper.

Offline Constrained Reinforcement Learning under Partial Data Coverage stat.ML · 2025-05-23 · unverdicted · none · ref 12
PDOCRL is an oracle-efficient primal-dual method for offline constrained RL under general function approximation that returns near-optimal policies with O(eps^{-2}) samples under partial optimal-policy coverage and a stronger realizability condition.

Q-learning and Pontryagin’s minimum principle

fields

years

verdicts

representative citing papers

citing papers explorer