Defending against insertion-based textual backdoor attacks via attribution,

· 2023 · arXiv 2305.02394

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

SCOUT: A Defense Against Data Poisoning Attacks in Fine-Tuned Language Models

cs.CR · 2025-12-10 · unverdicted · novelty 6.0

SCOUT uses token saliency analysis to detect both standard and contextually-plausible backdoor attacks in language models while maintaining clean accuracy.

citing papers explorer

Showing 1 of 1 citing paper.

SCOUT: A Defense Against Data Poisoning Attacks in Fine-Tuned Language Models cs.CR · 2025-12-10 · unverdicted · none · ref 20
SCOUT uses token saliency analysis to detect both standard and contextually-plausible backdoor attacks in language models while maintaining clean accuracy.

Defending against insertion-based textual backdoor attacks via attribution,

fields

years

verdicts

representative citing papers

citing papers explorer