Monotonic value function factorisation for deep multi-agent reinforcement learning

· 2020

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

browse 3 citing papers

representative citing papers

Equivariant Multi-agent Reinforcement Learning for Multimodal Vehicle-to-Infrastructure Systems

cs.LG · 2026-04-08 · unverdicted · novelty 7.0

A self-supervised multimodal alignment step plus equivariant GNN-based MARL yields over twofold sensing accuracy and 50% performance gains in decentralized V2I rate maximization.

Bridging MARL to SARL: An Order-Independent Multi-Agent Transformer via Latent Consensus

cs.LG · 2026-04-15 · conditional · novelty 6.0

CMAT uses a transformer decoder to produce a high-level consensus vector in latent space, enabling simultaneous order-independent actions by all agents and optimization via single-agent PPO, with superior results on StarCraft II, Multi-Agent MuJoCo, and Google Research Football.

Learning Incentive Structures for Cooperative Resilience in Multi-Agent Systems under Social Dilemmas

cs.MA · 2026-01-29 · unverdicted · novelty 5.0

A method infers resilience-promoting reward functions via trajectory scoring and integrates them into MARL, with hybrid incentives shown to reduce collapse in disrupted resource environments.

citing papers explorer

Showing 3 of 3 citing papers.

Equivariant Multi-agent Reinforcement Learning for Multimodal Vehicle-to-Infrastructure Systems cs.LG · 2026-04-08 · unverdicted · none · ref 52
A self-supervised multimodal alignment step plus equivariant GNN-based MARL yields over twofold sensing accuracy and 50% performance gains in decentralized V2I rate maximization.
Bridging MARL to SARL: An Order-Independent Multi-Agent Transformer via Latent Consensus cs.LG · 2026-04-15 · conditional · none · ref 3
CMAT uses a transformer decoder to produce a high-level consensus vector in latent space, enabling simultaneous order-independent actions by all agents and optimization via single-agent PPO, with superior results on StarCraft II, Multi-Agent MuJoCo, and Google Research Football.
Learning Incentive Structures for Cooperative Resilience in Multi-Agent Systems under Social Dilemmas cs.MA · 2026-01-29 · unverdicted · none · ref 5
A method infers resilience-promoting reward functions via trajectory scoring and integrates them into MARL, with hybrid incentives shown to reduce collapse in disrupted resource environments.

Monotonic value function factorisation for deep multi-agent reinforcement learning

fields

years

verdicts

representative citing papers

citing papers explorer