Adasgd: Bridging the gap between sgd and adam

Jiaxuan Wang, Jenna Wiens · 2006 · arXiv 2006.16541

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

MGUP: A Momentum-Gradient Alignment Update Policy for Stochastic Optimization

cs.LG · 2026-06-16 · unverdicted · novelty 5.0

MGUP augments momentum optimizers with selective larger steps on a fixed proportion of parameters per iteration, claiming convergence guarantees for MGUP-AdamW and superior empirical performance on pretraining and fine-tuning.

citing papers explorer

Showing 1 of 1 citing paper.

MGUP: A Momentum-Gradient Alignment Update Policy for Stochastic Optimization cs.LG · 2026-06-16 · unverdicted · none · ref 26
MGUP augments momentum optimizers with selective larger steps on a fixed proportion of parameters per iteration, claiming convergence guarantees for MGUP-AdamW and superior empirical performance on pretraining and fine-tuning.

Adasgd: Bridging the gap between sgd and adam

fields

years

verdicts

representative citing papers

citing papers explorer