arXiv preprint arXiv:2502.07346 , year=

Benchmax: A comprehensive multilingual evaluation suite for large language models , author= · 2025 · arXiv 2502.07346

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

A Data-Efficient Path to Multilingual LLMs: Language Expansion via Post-training PARAM$\Delta$ Integration into Upcycled MoE

cs.CL · 2026-05-18 · unverdicted · novelty 7.0

PARAMΔ upcycles dense models to MoE for per-language experts and grafts post-training deltas to enable data-efficient language expansion while preserving original capabilities.

English is Not All You Need: Systematically Exploring the Role of Multilinguality in LLM Post-Training

cs.CL · 2026-04-14 · unverdicted · novelty 6.0

Systematic experiments demonstrate that multilingual coverage in LLM post-training improves results for all languages and tasks compared to English-only, with low-resource languages gaining most and zero-shot transfer emerging at high diversity.

Language as a Latent Variable for Reasoning Optimization

cs.CL · 2026-04-23 · unverdicted · novelty 5.0

Treating language as a latent variable via polyGRPO RL improves Qwen2.5-7B-Instruct by 6.72% on English reasoning benchmarks and 6.89% on multilingual ones, with cross-task gains on commonsense reasoning from math-only training.

citing papers explorer

Showing 3 of 3 citing papers.

A Data-Efficient Path to Multilingual LLMs: Language Expansion via Post-training PARAM$\Delta$ Integration into Upcycled MoE cs.CL · 2026-05-18 · unverdicted · none · ref 26
PARAMΔ upcycles dense models to MoE for per-language experts and grafts post-training deltas to enable data-efficient language expansion while preserving original capabilities.
English is Not All You Need: Systematically Exploring the Role of Multilinguality in LLM Post-Training cs.CL · 2026-04-14 · unverdicted · none · ref 4
Systematic experiments demonstrate that multilingual coverage in LLM post-training improves results for all languages and tasks compared to English-only, with low-resource languages gaining most and zero-shot transfer emerging at high diversity.
Language as a Latent Variable for Reasoning Optimization cs.CL · 2026-04-23 · unverdicted · none · ref 15
Treating language as a latent variable via polyGRPO RL improves Qwen2.5-7B-Instruct by 6.72% on English reasoning benchmarks and 6.89% on multilingual ones, with cross-task gains on commonsense reasoning from math-only training.

arXiv preprint arXiv:2502.07346 , year=

fields

years

verdicts

representative citing papers

citing papers explorer