To Survive, I Must Defect

Zhen Sun et al · 2025 · arXiv 2511.16278

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Analyzing Defensive Misdirection Against Model-Guided Automated Attacks on Agentic AI Systems

cs.CR · 2026-06-18 · unverdicted · novelty 5.0

Detect-and-misdirect defenses bound asymptotic attacker success rates in model-guided jailbreaks on agentic AI, unlike detect-and-block which permit near-certain success with sufficient queries.

citing papers explorer

Showing 1 of 1 citing paper.

Analyzing Defensive Misdirection Against Model-Guided Automated Attacks on Agentic AI Systems cs.CR · 2026-06-18 · unverdicted · none · ref 21
Detect-and-misdirect defenses bound asymptotic attacker success rates in model-guided jailbreaks on agentic AI, unlike detect-and-block which permit near-certain success with sufficient queries.

To Survive, I Must Defect

fields

years

verdicts

representative citing papers

citing papers explorer