Anytime psro for two-player zero-sum games.arXiv preprint arXiv:2201.07700,

Stephen McAleer, Kevin Wang, John Lanier, Marc Lanctot, Pierre Baldi, Tuomas Sandholm, Roy Fox · arXiv 2201.07700

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

cs.LG · 2026-03-07 · unverdicted · novelty 7.0

NePPO learns a player-independent potential function via a novel objective whose minimization yields an approximate Nash equilibrium for general-sum multi-agent games.

citing papers explorer

Showing 1 of 1 citing paper.

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning cs.LG · 2026-03-07 · unverdicted · none · ref 11
NePPO learns a player-independent potential function via a novel objective whose minimization yields an approximate Nash equilibrium for general-sum multi-agent games.

Anytime psro for two-player zero-sum games.arXiv preprint arXiv:2201.07700,

fields

years

verdicts

representative citing papers

citing papers explorer