A Deeper Look at Planning as Learning from Replay

Vanseijen, Harm, Sutton, Rich · 2015

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

browse 5 citing papers

citation-role summary

background 2

citation-polarity summary

background 2

representative citing papers

Offline Two-Player Zero-Sum Markov Games with KL Regularization

cs.LG · 2026-05-13 · unverdicted · novelty 8.0

KL regularization enables Õ(1/n) convergence for offline Nash equilibria in zero-sum Markov games under unilateral concentrability via the ROSE framework and SOS-MD algorithm.

Almost Sure Convergence Rates of Stochastic Approximation and Reinforcement Learning via a Poisson-Moreau Drift

cs.LG · 2026-05-08 · unverdicted · novelty 7.0

Establishes almost sure convergence rates arbitrarily close to o(n^{1-2η}) for power-law rates η in (1/2,1) and o(n^{-1}) for harmonic rates in contractive stochastic approximation with Markovian noise.

AstroAlertBench: Evaluating the Accuracy, Reasoning, and Honesty of Multimodal LLMs in Astronomical Classification

astro-ph.IM · 2026-05-07 · unverdicted · novelty 7.0

AstroAlertBench evaluates multimodal LLMs on astronomical classification accuracy, reasoning, and honesty using real ZTF alerts, revealing that high accuracy often diverges from self-assessed reasoning quality.

Fast Rates in $\alpha$-Potential Games via Regularized Mirror Descent

cs.GT · 2026-04-30 · unverdicted · novelty 7.0 · 2 refs

Proposes OPMD algorithm achieving accelerated O(1/n) rates for offline Nash equilibrium learning in alpha-potential games via reference-anchored data coverage.

Pessimism-Free Offline Learning in General-Sum Games via KL Regularization

cs.LG · 2026-04-30 · unverdicted · novelty 7.0 · 2 refs

KL regularization enables pessimism-free offline learning in general-sum games, recovering regularized Nash equilibria at accelerated rate O(1/n) via GANE and converging to coarse correlated equilibria at standard rate O(1/sqrt(n)+1/T) via GAMD.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Offline Two-Player Zero-Sum Markov Games with KL Regularization cs.LG · 2026-05-13 · unverdicted · none · ref 51
KL regularization enables Õ(1/n) convergence for offline Nash equilibria in zero-sum Markov games under unilateral concentrability via the ROSE framework and SOS-MD algorithm.
Almost Sure Convergence Rates of Stochastic Approximation and Reinforcement Learning via a Poisson-Moreau Drift cs.LG · 2026-05-08 · unverdicted · none · ref 11
Establishes almost sure convergence rates arbitrarily close to o(n^{1-2η}) for power-law rates η in (1/2,1) and o(n^{-1}) for harmonic rates in contractive stochastic approximation with Markovian noise.

A Deeper Look at Planning as Learning from Replay

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer