PaLM: Scaling language modeling with pathways.Journal of Machine Learning Research, 24(240): 1–113, 2023

Aakanksha Chowdhery, Sharan Narang, Jacob Devlin, Maarten Bosma, Gaurav Mishra, Adam Roberts, Paul Barham, Hyung Won Chung, Charles Sutton, Sebastian Gehrmann, et al · 2023

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

LoRA vs. Full Fine-Tuning: A Theoretical Perspective

cs.LG · 2026-05-18 · unverdicted · novelty 5.0

In linear regression, LoRA can achieve lower excess risk than full fine-tuning when the pretraining-downstream difference is low-rank, and small LoRA ranks can improve generalization by acting as regularization.

citing papers explorer

Showing 1 of 1 citing paper.

LoRA vs. Full Fine-Tuning: A Theoretical Perspective cs.LG · 2026-05-18 · unverdicted · none · ref 6
In linear regression, LoRA can achieve lower excess risk than full fine-tuning when the pretraining-downstream difference is low-rank, and small LoRA ranks can improve generalization by acting as regularization.

PaLM: Scaling language modeling with pathways.Journal of Machine Learning Research, 24(240): 1–113, 2023

fields

years

verdicts

representative citing papers

citing papers explorer