Cage: A framework for culturally adaptive red-teaming benchmark generation.arXiv preprint arXiv:2602.20170,

Kim, C · 2026 · arXiv 2602.20170

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

ROK-FORTRESS: Measuring the Effect of Geopolitical Transcreation for National Security and Public Safety

cs.CL · 2026-05-13 · unverdicted · novelty 7.0

ROK-FORTRESS shows Korean-language prompts increase LLM safety suppression compared with English, while Korean geopolitical grounding often reduces that suppression, indicating translation-only evaluations miss language-context interactions.

Culturally-Adapted Red-Teaming Across East and Southeast Asian Contexts: A Methodological and Comparative Analysis

cs.CL · 2026-06-08 · unverdicted · novelty 6.0

Culturally-adapted red-teaming prompts raise ASR by a mean of 9.3 pp over direct translations across 16 language-model pairs in four Asian languages, with DT scoring mean cultural depth of 0.17 versus up to 2.51 for CA.

citing papers explorer

Showing 2 of 2 citing papers after filters.

ROK-FORTRESS: Measuring the Effect of Geopolitical Transcreation for National Security and Public Safety cs.CL · 2026-05-13 · unverdicted · none · ref 11
ROK-FORTRESS shows Korean-language prompts increase LLM safety suppression compared with English, while Korean geopolitical grounding often reduces that suppression, indicating translation-only evaluations miss language-context interactions.
Culturally-Adapted Red-Teaming Across East and Southeast Asian Contexts: A Methodological and Comparative Analysis cs.CL · 2026-06-08 · unverdicted · none · ref 5
Culturally-adapted red-teaming prompts raise ASR by a mean of 9.3 pp over direct translations across 16 language-model pairs in four Asian languages, with DT scoring mean cultural depth of 0.17 versus up to 2.51 for CA.

Cage: A framework for culturally adaptive red-teaming benchmark generation.arXiv preprint arXiv:2602.20170,

fields

years

verdicts

representative citing papers

citing papers explorer