I think, therefore i diffuse: Enabling multimodal in-context reasoning in diffusion models.ArXiv, abs/2502.10458, 2025

Zhenxing Mi, Kuan-Chieh Jackson Wang, Guocheng Gordon Qian, Hanrong Ye, Runtao Liu, Sergey Tulyakov, Kfir Aberman, Dan Xu · 2025 · arXiv 2502.10458

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Evaluating Reasoning Fidelity in Visual Text Generation

cs.CV · 2026-06-03 · unverdicted · novelty 5.0

T2I models frequently exhibit semantic errors, logical inconsistencies, and incorrect reasoning steps in visual text generation tasks, unlike text-only models.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Evaluating Reasoning Fidelity in Visual Text Generation cs.CV · 2026-06-03 · unverdicted · none · ref 32
T2I models frequently exhibit semantic errors, logical inconsistencies, and incorrect reasoning steps in visual text generation tasks, unlike text-only models.

I think, therefore i diffuse: Enabling multimodal in-context reasoning in diffusion models.ArXiv, abs/2502.10458, 2025

fields

years

verdicts

representative citing papers

citing papers explorer