Exploiting Vulnerabilities:

**Drive-by Downloads**:

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

TROJail: Trajectory-Level Optimization for Multi-Turn Large Language Model Jailbreaks with Process Rewards

cs.AI · 2025-12-08 · conditional · novelty 7.0

TROJail improves multi-turn LLM jailbreak success rates by framing attacks as trajectory optimization in RL and adding process rewards that penalize early refusals while steering semantic relevance to the target harm.

citing papers explorer

Showing 1 of 1 citing paper.

TROJail: Trajectory-Level Optimization for Multi-Turn Large Language Model Jailbreaks with Process Rewards cs.AI · 2025-12-08 · conditional · none · ref 9
TROJail improves multi-turn LLM jailbreak success rates by framing attacks as trajectory optimization in RL and adding process rewards that penalize early refusals while steering semantic relevance to the target harm.

Exploiting Vulnerabilities:

fields

years

verdicts

representative citing papers

citing papers explorer