Lqer: Low-rank quantization error reconstruction for llms.arXiv preprint arXiv:2402.02446, 2024a

11 Cheng Zhang, Jianyi Cheng, George A Constantinides, Yiren Zhao · 2048 · arXiv 2402.02446

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

A3 : an Analytical Low-Rank Approximation Framework for Attention

cs.CL · 2025-05-19 · conditional · novelty 6.0

A3 splits Transformer layers into QK, OV, and MLP components and derives analytical low-rank approximations that reduce hidden dimensions while minimizing each component's functional loss, yielding better perplexity than prior low-rank methods on LLaMA models.

citing papers explorer

Showing 1 of 1 citing paper.

A3 : an Analytical Low-Rank Approximation Framework for Attention cs.CL · 2025-05-19 · conditional · none · ref 19
A3 splits Transformer layers into QK, OV, and MLP components and derives analytical low-rank approximations that reduce hidden dimensions while minimizing each component's functional loss, yielding better perplexity than prior low-rank methods on LLaMA models.

Lqer: Low-rank quantization error reconstruction for llms.arXiv preprint arXiv:2402.02446, 2024a

fields

years

verdicts

representative citing papers

citing papers explorer