Unified visual transformer compression

Yu, S · arXiv 2203.08243

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

VisionPulse: Dynamic Visual Sparsity for Efficient Multimodal Reasoning

cs.CV · 2026-05-29 · unverdicted · novelty 5.0

VisionPulse is a step-wise visual token pruning method for LMMs that retains 5% of tokens per step, shortens reasoning traces by 11.2%, and maintains accuracy.

citing papers explorer

Showing 1 of 1 citing paper.

VisionPulse: Dynamic Visual Sparsity for Efficient Multimodal Reasoning cs.CV · 2026-05-29 · unverdicted · none · ref 21
VisionPulse is a step-wise visual token pruning method for LMMs that retains 5% of tokens per step, shortens reasoning traces by 11.2%, and maintains accuracy.

Unified visual transformer compression

fields

years

verdicts

representative citing papers

citing papers explorer