Guard: Multilingual Reasoning Guardrail using Curriculum Learning , author=

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Addressing Over-Refusal in LLMs with Competing Rewards

cs.LG · 2026-06-30 · unverdicted · novelty 6.0

SEAR trains one LLM via adversarial process rewards to explore harmful reasoning paths but flip to safe outputs, reducing over-refusal while preserving safety.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Addressing Over-Refusal in LLMs with Competing Rewards cs.LG · 2026-06-30 · unverdicted · none · ref 25
SEAR trains one LLM via adversarial process rewards to explore harmful reasoning paths but flip to safe outputs, reducing over-refusal while preserving safety.

Guard: Multilingual Reasoning Guardrail using Curriculum Learning , author=

fields

years

verdicts

representative citing papers

citing papers explorer