Do not give instructions for acquiring, manufacturing, or using illegal drugs, controlled substances, or prohibited weapons

Zhengyue Zhao, Yingzi Ma, Somesh Jha, Marco Pavone, Patrick McDaniel, Chaowei Xiao · 2025 · arXiv 2507.11500

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

LPG: Balancing Efficiency and Policy Reasoning in Latent Policy Guardrails

cs.CR · 2026-05-17 · conditional · novelty 6.0

LPG compresses policy deliberation into 10 latent tokens to reach 84.5% safety accuracy and 11x speedup over explicit reasoning baselines on guardrail benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

LPG: Balancing Efficiency and Policy Reasoning in Latent Policy Guardrails cs.CR · 2026-05-17 · conditional · none · ref 39
LPG compresses policy deliberation into 10 latent tokens to reach 84.5% safety accuracy and 11x speedup over explicit reasoning baselines on guardrail benchmarks.

Do not give instructions for acquiring, manufacturing, or using illegal drugs, controlled substances, or prohibited weapons

fields

years

verdicts

representative citing papers

citing papers explorer