Sparvar: Exploring sparsity in visual autoregressive modeling for training-free acceleration

· 2026 · arXiv 2602.04361

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

HACK++: Towards More Effective Head-Aware Key-Value Compression for Efficient Visual Autoregressive Modeling

cs.CV · 2026-06-06 · unverdicted · novelty 7.0

HACK++ is a head-aware KV cache compression framework for VAR models that decouples current-scale attention from historical cache under adaptive per-head budgets to achieve near-lossless generation at 30% attention and 10% cache budgets.

HeatKV: Head-tuned KV-cache Compression for Visual Autoregressive Modeling

cs.CV · 2026-05-14 · conditional · novelty 7.0 · 2 refs

HeatKV doubles KV-cache compression ratios over prior methods for VAR models by creating static head-specific pruning schedules from attention rankings on a calibration set, while preserving image quality on Infinity-2B.

citing papers explorer

Showing 1 of 1 citing paper after filters.

HeatKV: Head-tuned KV-cache Compression for Visual Autoregressive Modeling cs.CV · 2026-05-14 · conditional · none · ref 38 · 2 links
HeatKV doubles KV-cache compression ratios over prior methods for VAR models by creating static head-specific pruning schedules from attention rankings on a calibration set, while preserving image quality on Infinity-2B.

Sparvar: Exploring sparsity in visual autoregressive modeling for training-free acceleration

fields

years

verdicts

representative citing papers

citing papers explorer