High-resolution im- age synthesis with latent diffusion models,

Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Bj ¨orn Ommer, “High-resolution image synthesis with latent diffusion models,” inProceedings of the IEEE/CVF conference on computer vision, pattern recognition · 2022

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Repurposing Image Diffusion Models for Training-Free Music Style Transfer on Mel-spectrograms

cs.SD · 2024-11-24 · conditional · novelty 7.0

Stylus achieves training-free music style transfer on Mel-spectrograms by repurposing image diffusion models via style-key injection in self-attention plus phase-preserving reconstruction, outperforming baselines by 34.1% in content preservation and 25.7% in perceptual quality per 2,925 human raters

MaskAttn-SDXL: Controllable Region-Level Text-To-Image Generation

cs.CV · 2025-09-18 · unverdicted · novelty 6.0

MaskAttn-SDXL adds token-conditioned spatial gating to SDXL cross-attention to sparsify irrelevant token-to-location bindings and improve region-level controllability without retraining or inference edits.

citing papers explorer

Showing 2 of 2 citing papers.

Repurposing Image Diffusion Models for Training-Free Music Style Transfer on Mel-spectrograms cs.SD · 2024-11-24 · conditional · none · ref 13
Stylus achieves training-free music style transfer on Mel-spectrograms by repurposing image diffusion models via style-key injection in self-attention plus phase-preserving reconstruction, outperforming baselines by 34.1% in content preservation and 25.7% in perceptual quality per 2,925 human raters
MaskAttn-SDXL: Controllable Region-Level Text-To-Image Generation cs.CV · 2025-09-18 · unverdicted · none · ref 12
MaskAttn-SDXL adds token-conditioned spatial gating to SDXL cross-attention to sparsify irrelevant token-to-location bindings and improve region-level controllability without retraining or inference edits.

High-resolution im- age synthesis with latent diffusion models,

fields

years

verdicts

representative citing papers

citing papers explorer