Distributional reinforce- ment learning with quantile regression

Will Dabney, Mark Rowland, Marc Bellemare, Rémi Munos · 2018

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

citation-role summary

background 2

citation-polarity summary

background 2

representative citing papers

A Finite-Iteration Theory for Asynchronous Categorical Distributional Temporal-Difference Learning

cs.LG · 2026-05-07 · unverdicted · novelty 7.0

Finite-iteration guarantees are established for asynchronous scalar categorical TD in Cramér geometry and multivariate signed-categorical TD in MMD geometry under i.i.d., Markovian, and episodic sampling.

Quantile Geometry Regularization for Distributional Reinforcement Learning

cs.LG · 2026-05-05 · unverdicted · novelty 6.0

RQIQN introduces a Wasserstein DRO-based correction to Bellman quantile targets that enlarges distributional spread without altering risk-neutral averages.

citing papers explorer

Showing 2 of 2 citing papers.

A Finite-Iteration Theory for Asynchronous Categorical Distributional Temporal-Difference Learning cs.LG · 2026-05-07 · unverdicted · none · ref 15
Finite-iteration guarantees are established for asynchronous scalar categorical TD in Cramér geometry and multivariate signed-categorical TD in MMD geometry under i.i.d., Markovian, and episodic sampling.
Quantile Geometry Regularization for Distributional Reinforcement Learning cs.LG · 2026-05-05 · unverdicted · none · ref 2
RQIQN introduces a Wasserstein DRO-based correction to Bellman quantile targets that enlarges distributional spread without altering risk-neutral averages.

Distributional reinforce- ment learning with quantile regression

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer