Improving diffusion models for scene text editing with dual encoders

Ji, J · 2023 · arXiv 2304.05568

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

TextWand: A Unified Framework for Scene Text Editing

cs.CV · 2026-06-04 · unverdicted · novelty 6.0

TextWand unifies scene text removal, generation and replacement via rendering/erasure decomposition, ORPE for layout fidelity, RAS for clean erasure, and the new TextWand-Bench dataset, claiming superior accuracy and quality over prior models.

POCA: Pareto-Optimal Curriculum Alignment for Visual Text Generation

cs.CV · 2026-04-27 · unverdicted · novelty 6.0

POCA combines Pareto optimization with curriculum alignment to improve multi-reward reinforcement learning for visual text generation without relying on weighted sums.

SkyReels-Text: Fine-Grained Font-Controllable Text Editing for Poster Design

cs.CV · 2025-11-17 · unverdicted · novelty 6.0

SkyReels-Text enables simultaneous fine-grained editing of multiple text regions in posters using arbitrary glyph patches for font control without labels or test-time fine-tuning.

citing papers explorer

Showing 3 of 3 citing papers.

TextWand: A Unified Framework for Scene Text Editing cs.CV · 2026-06-04 · unverdicted · none · ref 49
TextWand unifies scene text removal, generation and replacement via rendering/erasure decomposition, ORPE for layout fidelity, RAS for clean erasure, and the new TextWand-Bench dataset, claiming superior accuracy and quality over prior models.
POCA: Pareto-Optimal Curriculum Alignment for Visual Text Generation cs.CV · 2026-04-27 · unverdicted · none · ref 11
POCA combines Pareto optimization with curriculum alignment to improve multi-reward reinforcement learning for visual text generation without relying on weighted sums.
SkyReels-Text: Fine-Grained Font-Controllable Text Editing for Poster Design cs.CV · 2025-11-17 · unverdicted · none · ref 13
SkyReels-Text enables simultaneous fine-grained editing of multiple text regions in posters using arbitrary glyph patches for font control without labels or test-time fine-tuning.

Improving diffusion models for scene text editing with dual encoders

fields

years

verdicts

representative citing papers

citing papers explorer