FOCUS: Unified vision-language modeling for interactive editing driven by referential segmentation

Fan Yang, Yousong Zhu, Xin Li, Yufei Zhan, Hongyin Zhao, Shurong Zheng, Yaowei Wang, Ming Tang, Jinqiao Wang · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency

cs.CV · 2026-05-18 · unverdicted · novelty 5.0

SAGE adds duality consistency as an auxiliary reward in GRPO training with a dynamic operation pool to improve spatial reasoning robustness and generalization in VLMs.

citing papers explorer

Showing 1 of 1 citing paper.

Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency cs.CV · 2026-05-18 · unverdicted · none · ref 57
SAGE adds duality consistency as an auxiliary reward in GRPO training with a dynamic operation pool to improve spatial reasoning robustness and generalization in VLMs.

FOCUS: Unified vision-language modeling for interactive editing driven by referential segmentation

fields

years

verdicts

representative citing papers

citing papers explorer