Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models

Jian, Pu, Wu, Junhong, Sun, Wei, Wang, Chen, Ren, Shuo, Zhang, Jiajun · 2025 · DOI 10.18653/v1/2025.emnlp-main.470

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

Visually Grounded Self-Reflection for Vision-Language Models via Reinforcement Learning

cs.CL · 2026-07-02 · unverdicted · novelty 6.0

VRRL trains LVLMs for visually grounded self-reflection via prefix masking and buffered roll-ins, yielding higher out-of-distribution accuracy on grounding and navigation tasks than standard RL baselines.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Visually Grounded Self-Reflection for Vision-Language Models via Reinforcement Learning cs.CL · 2026-07-02 · unverdicted · none · ref 54
VRRL trains LVLMs for visually grounded self-reflection via prefix masking and buffered roll-ins, yielding higher out-of-distribution accuracy on grounding and navigation tasks than standard RL baselines.

Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models

fields

years

verdicts

representative citing papers

citing papers explorer