arXiv preprint arXiv:2206.14057 , year=

Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-free RL , author= · arXiv 2206.14057

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

cs.LG · 2026-05-02 · unverdicted · novelty 6.0

An actor-critic RL algorithm for low-rank MDPs achieves improved sample efficiency using solely a policy evaluation oracle.

Showing 1 of 1 citing paper.

Breaking the Computational Barrier: Provably Efficient Actor-Critic for Low-Rank MDPs cs.LG · 2026-05-02 · unverdicted · none · ref 69
An actor-critic RL algorithm for low-rank MDPs achieves improved sample efficiency using solely a policy evaluation oracle.