time- resolved

LaProp: Separating momentum, adaptivity in Adam , author= · 2002 · arXiv 2002.04839

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

On the Provable Suboptimality of Momentum SGD in Nonstationary Stochastic Optimization

stat.ML · 2026-01-18 · conditional · novelty 7.0

Momentum SGD incurs a provable drift-amplification penalty in nonstationary stochastic optimization that makes it worse than vanilla SGD in drift-dominated regimes, confirmed by finite-time upper bounds and minimax lower bounds under gradient-variation constraints.

Mastering Diverse Domains through World Models

cs.AI · 2023-01-10 · unverdicted · novelty 7.0

DreamerV3 uses world models and robustness techniques to solve over 150 tasks across domains with a single configuration, including Minecraft diamond collection from scratch.

Double Preconditioning (DoPr): Optimization for Test-Time Performance, not Validation Loss

cs.LG · 2026-06-04 · unverdicted · novelty 6.0

Double preconditioning (DoPr) improves downstream task performance in test-time feedback settings without consistent gains in validation loss.

citing papers explorer

Showing 1 of 1 citing paper after filters.

On the Provable Suboptimality of Momentum SGD in Nonstationary Stochastic Optimization stat.ML · 2026-01-18 · conditional · none · ref 21
Momentum SGD incurs a provable drift-amplification penalty in nonstationary stochastic optimization that makes it worse than vanilla SGD in drift-dominated regimes, confirmed by finite-time upper bounds and minimax lower bounds under gradient-variation constraints.

time- resolved

fields

years

verdicts

representative citing papers

citing papers explorer