Robust deep reinforcement learning against adversarial perturbations on state observations

Zhang, H · 2000 · arXiv 2101.08452

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

read on arXiv browse 4 citing papers

citation-role summary

method 1

citation-polarity summary

use method 1

representative citing papers

Taming the Curses of Multiagency in Robust Markov Games with Large State Space through Linear Function Approximation

cs.LG · 2026-05-04 · unverdicted · novelty 8.0

The work gives the first algorithms for general robust Markov games with linear function approximation whose sample complexity breaks the curse of multiagency for large state spaces in both generative and online settings.

Robust Adversarial Policy Optimization Under Dynamics Uncertainty

cs.LG · 2026-04-13 · unverdicted · novelty 7.0

RAPO uses a dual robust RL formulation with trajectory-level adversarial networks and model-level Boltzmann reweighting over dynamics ensembles to improve policy resilience and out-of-distribution generalization while keeping the problem tractable.

Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning

cs.LG · 2025-02-05 · unverdicted · novelty 6.0

Wolfpack attack framework disrupts MARL cooperation by targeting initial and assisting agents; WALL trains robust policies against it with reported experimental gains.

Interaction-Breaking Adversarial Learning Framework for Robust Multi-Agent Reinforcement Learning

cs.LG · 2026-05-18

citing papers explorer

Showing 4 of 4 citing papers.

Taming the Curses of Multiagency in Robust Markov Games with Large State Space through Linear Function Approximation cs.LG · 2026-05-04 · unverdicted · none · ref 25
The work gives the first algorithms for general robust Markov games with linear function approximation whose sample complexity breaks the curse of multiagency for large state spaces in both generative and online settings.
Robust Adversarial Policy Optimization Under Dynamics Uncertainty cs.LG · 2026-04-13 · unverdicted · none · ref 15
RAPO uses a dual robust RL formulation with trajectory-level adversarial networks and model-level Boltzmann reweighting over dynamics ensembles to improve policy resilience and out-of-distribution generalization while keeping the problem tractable.
Wolfpack Adversarial Attack for Robust Multi-Agent Reinforcement Learning cs.LG · 2025-02-05 · unverdicted · none · ref 22
Wolfpack attack framework disrupts MARL cooperation by targeting initial and assisting agents; WALL trains robust policies against it with reported experimental gains.
Interaction-Breaking Adversarial Learning Framework for Robust Multi-Agent Reinforcement Learning cs.LG · 2026-05-18 · unreviewed · ref 16

Robust deep reinforcement learning against adversarial perturbations on state observations

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer