International Conference on Learning Representations , year =

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Correcting Stochastic Update Bias in Preconditioned Language Model Optimizers

cs.LG · 2026-05-20 · unverdicted · novelty 6.0

A bias-correction framework for stochastic preconditioned optimizers (AdamW, Sophia, Shampoo) using cross-fitted microbatches and delta-method inversion correction yields 0.07-0.15 nat loss reductions on Qwen2.5-0.5B pretraining.

citing papers explorer

Showing 1 of 1 citing paper.

Correcting Stochastic Update Bias in Preconditioned Language Model Optimizers cs.LG · 2026-05-20 · unverdicted · none · ref 23
A bias-correction framework for stochastic preconditioned optimizers (AdamW, Sophia, Shampoo) using cross-fitted microbatches and delta-method inversion correction yields 0.07-0.15 nat loss reductions on Qwen2.5-0.5B pretraining.

International Conference on Learning Representations , year =

fields

years

verdicts

representative citing papers

citing papers explorer