Multimodal llm-guided semantic cor- rection in text-to-image diffusion.ArXiv, abs/2505.20053,

Zheqi Lv, Junhao Chen, Qi Tian, Keting Yin, Shengyu Zhang, Fei Wu · arXiv 2505.20053

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Evaluating Reasoning Fidelity in Visual Text Generation

cs.CV · 2026-06-03 · unverdicted · novelty 5.0

T2I models frequently exhibit semantic errors, logical inconsistencies, and incorrect reasoning steps in visual text generation tasks, unlike text-only models.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Evaluating Reasoning Fidelity in Visual Text Generation cs.CV · 2026-06-03 · unverdicted · none · ref 29
T2I models frequently exhibit semantic errors, logical inconsistencies, and incorrect reasoning steps in visual text generation tasks, unlike text-only models.

Multimodal llm-guided semantic cor- rection in text-to-image diffusion.ArXiv, abs/2505.20053,

fields

years

verdicts

representative citing papers

citing papers explorer