arXiv preprint arXiv:2411.14863 (2024)

Kim, J · 2024 · arXiv 2411.14863

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Timage: A Generative Text-in-Image Paradigm for Fine-Tuning Vision-Language Models

cs.CV · 2026-06-18 · unverdicted · novelty 7.0

Timage generates text query overlays on images via Constrained Schrödinger Bridge to boost fine-grained spatial reasoning in vision-language models, outperforming larger systems on VMCBench with a 7B backbone.

citing papers explorer

Showing 1 of 1 citing paper.

Timage: A Generative Text-in-Image Paradigm for Fine-Tuning Vision-Language Models cs.CV · 2026-06-18 · unverdicted · none · ref 26
Timage generates text query overlays on images via Constrained Schrödinger Bridge to boost fine-grained spatial reasoning in vision-language models, outperforming larger systems on VMCBench with a 7B backbone.

arXiv preprint arXiv:2411.14863 (2024)

fields

years

verdicts

representative citing papers

citing papers explorer