Enhancing large language model reasoning via selective critical token ﬁne-tuning

Zhiwen Ruan, Yixia Li, He Zhu, Yun Chen, Peng Li, Yang Liu, Guanhua Chen · arXiv 2510.10974

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Beyond Entropy: Learning from Token-Level Distributional Deviations for LLM Reasoning

cs.AI · 2026-06-18 · unverdicted · novelty 7.0

ICT framework applies JS divergence to token logits to select critical tokens for selective RLVR updates, claiming 4.58% average pass@4 gains on Qwen2.5 models across seven reasoning benchmarks.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Beyond Entropy: Learning from Token-Level Distributional Deviations for LLM Reasoning cs.AI · 2026-06-18 · unverdicted · none · ref 20
ICT framework applies JS divergence to token logits to select critical tokens for selective RLVR updates, claiming 4.58% average pass@4 gains on Qwen2.5 models across seven reasoning benchmarks.

Enhancing large language model reasoning via selective critical token ﬁne-tuning

fields

years

verdicts

representative citing papers

citing papers explorer