LLM-oriented token-adaptive knowledge distillation, 2025

Xurong Xie, Zhucun Xue, Jiafu Wu, Jian Li, Yabiao Wang, Xiaobin Hu, Yong Liu, Jiangning Zhang · 2025 · arXiv 2510.11615

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

On the Position Bias of On-Policy Distillation

cs.LG · 2026-06-21 · unverdicted · novelty 6.0

Position bias in on-policy distillation degrades later-token supervision; IW-OPD weights tokens by accumulated discrepancy, yielding faster convergence and up to 6.9 point gains on AIME-2025.

Counteraction-Aware Multi-Teacher On-Policy Distillation for General Capability Recovery with Domain Preservation

cs.AI · 2026-05-26 · unverdicted · novelty 5.0

CaMOPD recovers general capabilities in domain-specialized LLMs via alternating training and gap-based sample selection in multi-teacher on-policy distillation while preserving domain behavior.

citing papers explorer

Showing 2 of 2 citing papers.

On the Position Bias of On-Policy Distillation cs.LG · 2026-06-21 · unverdicted · none · ref 41
Position bias in on-policy distillation degrades later-token supervision; IW-OPD weights tokens by accumulated discrepancy, yielding faster convergence and up to 6.9 point gains on AIME-2025.
Counteraction-Aware Multi-Teacher On-Policy Distillation for General Capability Recovery with Domain Preservation cs.AI · 2026-05-26 · unverdicted · none · ref 4
CaMOPD recovers general capabilities in domain-specialized LLMs via alternating training and gap-based sample selection in multi-teacher on-policy distillation while preserving domain behavior.

LLM-oriented token-adaptive knowledge distillation, 2025

fields

years

verdicts

representative citing papers

citing papers explorer