Multi-agent deep reinforcement learning: A survey.Artificial Intelligence Review, 55(2):895–943, 2022

Sven Gronauer, Klaus Diepold · 2022 · DOI 10.1007/s10462-021-09996-w

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

open at publisher browse 4 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Delayed Repression and Emergent Instability in Adaptive Multi-Agent Systems

cs.MA · 2026-05-28 · unverdicted · novelty 6.0

Institutional delays trigger instability in multi-agent systems through delayed repression, with simulations identifying reactivity to lagged signals as the destabilizing factor rather than learning.

TRACER: Turn-level Regret Matching with Inner Reinforcement Credit for Cooperative Multi-LLM Reasoning

cs.AI · 2026-05-27 · unverdicted · novelty 6.0

TRACER combines a controller-regret layer using regret matching for speak/skip decisions with a generation-credit layer using GSPO rewards to enable learned collaboration in multi-LLM reasoning.

Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies

cs.RO · 2026-06-04 · unverdicted · novelty 5.0

MA-AC-MPC extends actor-critic MPC to multi-agent reinforcement learning and reports higher success rates than MLP baselines in pursuit-evasion simulation and hardware drone-rover landing.

AI Safety Landscape for Large Language Models: Taxonomy, State-of-the-art, and Future Directions

cs.AI · 2024-08-23 · unverdicted · novelty 4.0

The paper introduces a taxonomy of AI safety for LLMs organized into Trustworthy AI, Responsible AI, and Safe AI perspectives, accompanied by a review of state-of-the-art methods, challenges, and future directions.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Delayed Repression and Emergent Instability in Adaptive Multi-Agent Systems cs.MA · 2026-05-28 · unverdicted · none · ref 8
Institutional delays trigger instability in multi-agent systems through delayed repression, with simulations identifying reactivity to lagged signals as the destabilizing factor rather than learning.

Multi-agent deep reinforcement learning: A survey.Artificial Intelligence Review, 55(2):895–943, 2022

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer