Towards Efficient Language Giants: A Comprehensive Survey on Structural Optimizations and Compression Techniques for Large Language Models

“Towards Efficient Language Giants: A Comprehensive Survey on Structural Optimizations, Compression Techniques for Large Language Models · 2026 · arXiv 2026.108900

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Push Puppet Networks: Structured Bayesian Pruning Algorithm for Language Model Compression

stat.AP · 2026-06-26 · unverdicted · novelty 5.0

Push puppet networks learn a hierarchical penalty function during training to enable structured pruning of LLMs to arbitrary target sizes with reported speedups over SparseGPT and Wanda at high pruning ratios.

citing papers explorer

Showing 1 of 1 citing paper.

Push Puppet Networks: Structured Bayesian Pruning Algorithm for Language Model Compression stat.AP · 2026-06-26 · unverdicted · none · ref 1
Push puppet networks learn a hierarchical penalty function during training to enable structured pruning of LLMs to arbitrary target sizes with reported speedups over SparseGPT and Wanda at high pruning ratios.

Towards Efficient Language Giants: A Comprehensive Survey on Structural Optimizations and Compression Techniques for Large Language Models

fields

years

verdicts

representative citing papers

citing papers explorer