Gradient descent on two-layer nets: Margin maximization and simplicity bias

Kaifeng Lyu, Zhiyuan Li, Runzhe Wang, Sanjeev Arora · 2021

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Gradient flow dynamics of shallow ReLU networks for square loss and orthogonal inputs

stat.ML · 2022-06-02 · unverdicted · novelty 6.0

For orthogonal inputs, gradient flow on shallow ReLU nets with MSE loss at small init converges to zero loss, exhibits min-variation-norm bias, initial alignment, and saddle-to-saddle dynamics.

citing papers explorer

Showing 1 of 1 citing paper.

Gradient flow dynamics of shallow ReLU networks for square loss and orthogonal inputs stat.ML · 2022-06-02 · unverdicted · none · ref 28
For orthogonal inputs, gradient flow on shallow ReLU nets with MSE loss at small init converges to zero loss, exhibits min-variation-norm bias, initial alignment, and saddle-to-saddle dynamics.

Gradient descent on two-layer nets: Margin maximization and simplicity bias

fields

years

verdicts

representative citing papers

citing papers explorer