On the fundamental limitations of decentralized learnable reward shaping in cooperative multi-agent reinforcement learning.CoRR, abs/2511.00034, 2025

Aditya Akella · 2025 · arXiv 2511.00034

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Joint Optimization of Multi-agent Memory System

cs.MA · 2026-03-13 · unverdicted · novelty 6.0

CoMAM jointly optimizes agents in multi-agent LLM memory systems via end-to-end RL and adaptive credit assignment to improve collaboration and performance.

citing papers explorer

Showing 1 of 1 citing paper.

Joint Optimization of Multi-agent Memory System cs.MA · 2026-03-13 · unverdicted · none · ref 1
CoMAM jointly optimizes agents in multi-agent LLM memory systems via end-to-end RL and adaptive credit assignment to improve collaboration and performance.

On the fundamental limitations of decentralized learnable reward shaping in cooperative multi-agent reinforcement learning.CoRR, abs/2511.00034, 2025

fields

years

verdicts

representative citing papers

citing papers explorer