Closing the gap be- tween the upper bound and lower bound of adam’s iteration complexity.Advances in Neural Information Processing Systems, 36, 2024a

Bohan Wang, Jingwen Fu, Huishuai Zhang, Nanning Zheng, Wei Chen · arXiv 2403.15146

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

cs.LG · 2026-03-03 · unverdicted · novelty 8.0 · 2 refs

Adam achieves a δ^{-1/2} high-probability convergence rate while SGD requires at least δ^{-1} due to second-moment normalization, established via stopping-time/martingale analysis under bounded variance.

Convergence of difference inclusions via a diameter criterion

math.OC · 2026-05-14 · unverdicted · novelty 7.0

A diameter criterion tied to a potential function certifies convergence of difference inclusions, enabling discrete proofs for first-order optimization methods with diminishing steps.

citing papers explorer

Showing 2 of 2 citing papers.

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails cs.LG · 2026-03-03 · unverdicted · none · ref 11 · 2 links
Adam achieves a δ^{-1/2} high-probability convergence rate while SGD requires at least δ^{-1} due to second-moment normalization, established via stopping-time/martingale analysis under bounded variance.
Convergence of difference inclusions via a diameter criterion math.OC · 2026-05-14 · unverdicted · none · ref 117
A diameter criterion tied to a potential function certifies convergence of difference inclusions, enabling discrete proofs for first-order optimization methods with diminishing steps.

Closing the gap be- tween the upper bound and lower bound of adam’s iteration complexity.Advances in Neural Information Processing Systems, 36, 2024a

fields

years

verdicts

representative citing papers

citing papers explorer