Neural attention distillation: Erasing backdoor triggers from deep neural networks

· 2021 · arXiv 2101.05930

6 Pith papers cite this work. Polarity classification is still indexing.

6 Pith papers citing it

representative citing papers

FlowHijack: A Dynamics-Aware Backdoor Attack on Flow-Matching Vision-Language-Action Models

cs.CV · 2026-03-30 · unverdicted · novelty 8.0

FlowHijack is the first dynamics-aware backdoor attack on flow-matching VLAs that achieves high success rates with stealthy triggers while preserving benign performance and making malicious actions kinematically indistinguishable from normal ones.

BadSNN: Backdoor Attacks on Spiking Neural Networks via Adversarial Spiking Neuron

cs.CR · 2026-02-06 · unverdicted · novelty 7.0

BadSNN injects backdoors into spiking neural networks by adversarially tuning LIF neuron hyperparameters and optimizing triggers, achieving higher attack success than prior data-poisoning methods while remaining robust to common defenses.

Can Protective Watermarking Safeguard the Copyright of 3D Gaussian Splatting?

cs.CV · 2025-11-27 · conditional · novelty 7.0

GSPure removes watermarks from 3D Gaussian Splatting by isolating watermark Gaussians via view-dependent contributions and feature clustering, cutting watermark PSNR by up to 16.34 dB with under 1 dB scene quality loss.

Detecting Trojaned DNNs via Spectral Regression Analysis

cs.CR · 2026-05-20 · unverdicted · novelty 6.0

MIST detects Trojaned DNN updates by measuring spectral deviations in pre-activation representations against a benign fine-tuning reference, achieving high accuracy across datasets and attacks after a single update.

Defusing the Trigger: Plug-and-Play Defense for Backdoored LLMs via Tail-Risk Intrinsic Geometric Smoothing

cs.CR · 2026-04-27 · unverdicted · novelty 6.0

TIGS detects backdoor-induced attention collapse in LLMs and applies content-aware tail-risk screening plus intrinsic geometric smoothing to suppress attacks while preserving normal performance.

Forgetting to Witness: Efficient Federated Unlearning and Its Visible Evaluation

cs.LG · 2026-04-06 · unverdicted · novelty 5.0

A complete pipeline for federated unlearning via knowledge distillation for efficient removal and a GAN-integrated classifier for visual evaluation of forgetting capacity.

citing papers explorer

Showing 6 of 6 citing papers.

FlowHijack: A Dynamics-Aware Backdoor Attack on Flow-Matching Vision-Language-Action Models cs.CV · 2026-03-30 · unverdicted · none · ref 17
FlowHijack is the first dynamics-aware backdoor attack on flow-matching VLAs that achieves high success rates with stealthy triggers while preserving benign performance and making malicious actions kinematically indistinguishable from normal ones.
BadSNN: Backdoor Attacks on Spiking Neural Networks via Adversarial Spiking Neuron cs.CR · 2026-02-06 · unverdicted · none · ref 49
BadSNN injects backdoors into spiking neural networks by adversarially tuning LIF neuron hyperparameters and optimizing triggers, achieving higher attack success than prior data-poisoning methods while remaining robust to common defenses.
Can Protective Watermarking Safeguard the Copyright of 3D Gaussian Splatting? cs.CV · 2025-11-27 · conditional · none · ref 2
GSPure removes watermarks from 3D Gaussian Splatting by isolating watermark Gaussians via view-dependent contributions and feature clustering, cutting watermark PSNR by up to 16.34 dB with under 1 dB scene quality loss.
Detecting Trojaned DNNs via Spectral Regression Analysis cs.CR · 2026-05-20 · unverdicted · none · ref 40
MIST detects Trojaned DNN updates by measuring spectral deviations in pre-activation representations against a benign fine-tuning reference, achieving high accuracy across datasets and attacks after a single update.
Defusing the Trigger: Plug-and-Play Defense for Backdoored LLMs via Tail-Risk Intrinsic Geometric Smoothing cs.CR · 2026-04-27 · unverdicted · none · ref 20
TIGS detects backdoor-induced attention collapse in LLMs and applies content-aware tail-risk screening plus intrinsic geometric smoothing to suppress attacks while preserving normal performance.
Forgetting to Witness: Efficient Federated Unlearning and Its Visible Evaluation cs.LG · 2026-04-06 · unverdicted · none · ref 51
A complete pipeline for federated unlearning via knowledge distillation for efficient removal and a GAN-integrated classifier for visual evaluation of forgetting capacity.

Neural attention distillation: Erasing backdoor triggers from deep neural networks

fields

years

verdicts

representative citing papers

citing papers explorer