Modulora: finetuning 2-bit llms on consumer gpus by integrating with modular quantizers

Yin, J · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

WinQ: Accelerating Quantization-Aware Training of Language Models Around Saddle Points

cs.LG · 2026-05-17 · unverdicted · novelty 6.0

WinQ accelerates quantization-aware training up to 4x and improves sub-4-bit accuracy up to 8.8% by weight interpolation resets and noise-regularized gradients that increase Hessian eigenvalue magnitudes around saddle points.

citing papers explorer

Showing 1 of 1 citing paper.

WinQ: Accelerating Quantization-Aware Training of Language Models Around Saddle Points cs.LG · 2026-05-17 · unverdicted · none · ref 37
WinQ accelerates quantization-aware training up to 4x and improves sub-4-bit accuracy up to 8.8% by weight interpolation resets and noise-regularized gradients that increase Hessian eigenvalue magnitudes around saddle points.

Modulora: finetuning 2-bit llms on consumer gpus by integrating with modular quantizers

fields

years

verdicts

representative citing papers

citing papers explorer