Retraining requires no GPU— only cached activations and the XGBoost fit (<30s on CPU for 20,000+ turns)

Retraining Pipeline:Periodically (e

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection

cs.CR · 2026-04-30 · unverdicted · novelty 6.0

Adversarial restlessness in LLM activations allows five scalar features to detect multi-turn prompt injections at 93.8% accuracy on synthetic data, with cross-model replication but source-dependent generalization to real-world chats.

citing papers explorer

Showing 1 of 1 citing paper.

Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection cs.CR · 2026-04-30 · unverdicted · none · ref 7
Adversarial restlessness in LLM activations allows five scalar features to detect multi-turn prompt injections at 93.8% accuracy on synthetic data, with cross-model replication but source-dependent generalization to real-world chats.

Retraining requires no GPU— only cached activations and the XGBoost fit (<30s on CPU for 20,000+ turns)

fields

years

verdicts

representative citing papers

citing papers explorer