Policy evaluation and temporal-difference learning in con- tinuous time and space: A martingale approach.Journal of Machine Learning Research, 23(154):1–55, 2022

Yanwei Jia, Xun Yu Zhou · 2022

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Deep Policy Iteration for High-Dimensional Mean-Field Games with Regenerative Reformulation

math.NA · 2026-04-29 · unverdicted · novelty 6.0 · 2 refs

A deep policy iteration method reformulates finite-horizon mean-field games as regenerative problems with deterministic cycles, using particle systems and one-step updates to handle dimensions up to 10,000 efficiently.

citing papers explorer

Showing 1 of 1 citing paper.

Deep Policy Iteration for High-Dimensional Mean-Field Games with Regenerative Reformulation math.NA · 2026-04-29 · unverdicted · none · ref 27 · 2 links
A deep policy iteration method reformulates finite-horizon mean-field games as regenerative problems with deterministic cycles, using particle systems and one-step updates to handle dimensions up to 10,000 efficiently.

Policy evaluation and temporal-difference learning in con- tinuous time and space: A martingale approach.Journal of Machine Learning Research, 23(154):1–55, 2022

fields

years

verdicts

representative citing papers

citing papers explorer