Peft-as-an-attack! jailbreaking language models during federated parameter-efficient fine-tuning

Shenghui Li, Edith C-H Ngai, Fanghua Ye, Thiemo V oigt · 2024 · arXiv 2411.19335

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

citation-role summary

baseline 1

citation-polarity summary

baseline 1

representative citing papers

Palette: A Modular, Controllable, and Efficient Framework for On-demand Authorized Safety Alignment Relaxation in LLMs

cs.AI · 2026-05-22 · unverdicted · novelty 5.0

Palette identifies refusal directions via multi-objective search, internalizes them through lightweight adaptation, and supports on-demand multi-domain authorization via independent learning and parameter merging.

Graph Representation Learning Augmented Model Manipulation on Federated Fine-Tuning of LLMs

cs.LG · 2026-05-08 · unverdicted · novelty 5.0

Graph representation learning plus iterative augmented Lagrangian optimization creates stronger, harder-to-detect model manipulation attacks on federated LLM fine-tuning, cutting global accuracy by up to 26%.

citing papers explorer

Showing 0 of 0 citing papers after filters.

No citing papers match the current filters.

Peft-as-an-attack! jailbreaking language models during federated parameter-efficient fine-tuning

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer