Transactions of the Association for Computational Linguistics , volume =

· 2023 · DOI 10.1162/tacl_a_00566

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

open at publisher browse 2 citing papers

representative citing papers

How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A

cs.CV · 2026-05-09 · unverdicted · novelty 6.0

F^3A is a training-free visual token pruning router that treats pruning as task-conditioned evidence search and allocates a fixed vision token budget using question cues and frozen sparse heads without extra LLM passes.

Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency

cs.CV · 2026-05-18 · unverdicted · novelty 5.0

SAGE adds duality consistency as an auxiliary reward in GRPO training with a dynamic operation pool to improve spatial reasoning robustness and generalization in VLMs.

citing papers explorer

Showing 2 of 2 citing papers.

How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A cs.CV · 2026-05-09 · unverdicted · none · ref 21
F^3A is a training-free visual token pruning router that treats pruning as task-conditioned evidence search and allocates a fixed vision token budget using question cues and frozen sparse heads without extra LLM passes.
Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency cs.CV · 2026-05-18 · unverdicted · none · ref 27
SAGE adds duality consistency as an auxiliary reward in GRPO training with a dynamic operation pool to improve spatial reasoning robustness and generalization in VLMs.

Transactions of the Association for Computational Linguistics , volume =

fields

years

verdicts

representative citing papers

citing papers explorer