Safe and Efficient: A Primal-Dual Method for Offline Convex CMDPs under Partial Data Coverage

Haobo Zhang, Xiyue Peng, Honghao Wei, Xin Liu · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Offline Constrained Reinforcement Learning under Partial Data Coverage

stat.ML · 2025-05-23 · unverdicted · novelty 7.0

PDOCRL is an oracle-efficient primal-dual method for offline constrained RL under general function approximation that returns near-optimal policies with O(eps^{-2}) samples under partial optimal-policy coverage and a stronger realizability condition.

citing papers explorer

Showing 1 of 1 citing paper.

Offline Constrained Reinforcement Learning under Partial Data Coverage stat.ML · 2025-05-23 · unverdicted · none · ref 23
PDOCRL is an oracle-efficient primal-dual method for offline constrained RL under general function approximation that returns near-optimal policies with O(eps^{-2}) samples under partial optimal-policy coverage and a stronger realizability condition.

Safe and Efficient: A Primal-Dual Method for Offline Convex CMDPs under Partial Data Coverage

fields

years

verdicts

representative citing papers

citing papers explorer