Is Safety Standard Same for Everyone? User-Specific Safety Evaluation of Large Language Models

In, Yeonjun, Kim, Wonjoong, Yoon, Kanghoon, Kim, Sungchul, Tanjim, Mehrab, Park, Sangwu · 2025 · DOI 10.18653/v1/2025.findings-emnlp.353

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Reasoning Structure Matters for Safety Alignment of Reasoning Models

cs.AI · 2026-04-21 · unverdicted · novelty 6.0

Changing the internal reasoning structure of large reasoning models through simple supervised fine-tuning on 1K examples produces strong safety alignment that generalizes across tasks and languages.

citing papers explorer

Showing 1 of 1 citing paper.

Reasoning Structure Matters for Safety Alignment of Reasoning Models cs.AI · 2026-04-21 · unverdicted · none · ref 53
Changing the internal reasoning structure of large reasoning models through simple supervised fine-tuning on 1K examples produces strong safety alignment that generalizes across tasks and languages.

Is Safety Standard Same for Everyone? User-Specific Safety Evaluation of Large Language Models

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer