Layer-wise linear mode connectivity.arXiv preprint arXiv:2307.06966, 2023

Linara Adilova, Maksym Andriushchenko, Michael Kamp, Asja Fischer, Martin Jaggi · 2023 · arXiv 2307.06966

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Scaling Linear Mode Connectivity and Merging to Billion Parameter Pretrained Transformers

cs.LG · 2026-06-22 · unverdicted · novelty 5.0

A bidirectional optimization method using parameterized transformations enables near-zero loss barriers for linear mode connectivity in medium-scale language models and small barriers in billion-parameter transformers.

citing papers explorer

Showing 1 of 1 citing paper.

Scaling Linear Mode Connectivity and Merging to Billion Parameter Pretrained Transformers cs.LG · 2026-06-22 · unverdicted · none · ref 28
A bidirectional optimization method using parameterized transformations enables near-zero loss barriers for linear mode connectivity in medium-scale language models and small barriers in billion-parameter transformers.

Layer-wise linear mode connectivity.arXiv preprint arXiv:2307.06966, 2023

fields

years

verdicts

representative citing papers

citing papers explorer