Diffuse and disperse: Image generation with representation regularization.arXiv preprint arXiv:2506.09027

Runqian Wang, Kaiming He · 2025 · arXiv 2506.09027

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

representative citing papers

cs.SD · 2026-05-06 · unverdicted · novelty 6.0

A semantic progress signal from SSL discrepancy slope enables three stage-aware mechanisms that improve training efficiency and performance in audio diffusion models over static baselines.

Continuous Adversarial Flow Models

cs.LG · 2026-04-13 · unverdicted · novelty 6.0

Continuous adversarial flow models replace MSE in flow matching with adversarial training via a discriminator, improving guidance-free FID on ImageNet from 8.26 to 3.63 for SiT and similar gains for JiT and text-to-image benchmarks.

MPDiT: Multi-Patch Global-to-Local Transformer Architecture For Efficient Flow Matching and Diffusion Model

cs.CV · 2026-03-27 · unverdicted · novelty 6.0

MPDiT uses a hierarchical multi-patch design in transformers to lower computation in diffusion models by handling coarse global features first then fine local details, plus faster-converging embeddings.

Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation

cs.CV · 2026-03-21 · unverdicted · novelty 6.0

Premier learns user-specific embeddings to modulate text-to-image generation, outperforming prior methods on preference alignment, text consistency, and expert ratings even with limited history.

Med-DisSeg: Dispersion-Driven Representation Learning for Fine-Grained Medical Image Segmentation

cs.CV · 2026-05-14 · unverdicted · novelty 4.0

Med-DisSeg uses a dispersive loss on batch representations plus adaptive multi-scale decoding to achieve state-of-the-art fine-grained segmentation on five medical imaging datasets.

citing papers explorer

Showing 5 of 5 citing papers.

Stage-adaptive audio diffusion modeling cs.SD · 2026-05-06 · unverdicted · none · ref 17
A semantic progress signal from SSL discrepancy slope enables three stage-aware mechanisms that improve training efficiency and performance in audio diffusion models over static baselines.
Continuous Adversarial Flow Models cs.LG · 2026-04-13 · unverdicted · none · ref 73
Continuous adversarial flow models replace MSE in flow matching with adversarial training via a discriminator, improving guidance-free FID on ImageNet from 8.26 to 3.63 for SiT and similar gains for JiT and text-to-image benchmarks.
MPDiT: Multi-Patch Global-to-Local Transformer Architecture For Efficient Flow Matching and Diffusion Model cs.CV · 2026-03-27 · unverdicted · none · ref 68
MPDiT uses a hierarchical multi-patch design in transformers to lower computation in diffusion models by handling coarse global features first then fine local details, plus faster-converging embeddings.
Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation cs.CV · 2026-03-21 · unverdicted · none · ref 37
Premier learns user-specific embeddings to modulate text-to-image generation, outperforming prior methods on preference alignment, text consistency, and expert ratings even with limited history.
Med-DisSeg: Dispersion-Driven Representation Learning for Fine-Grained Medical Image Segmentation cs.CV · 2026-05-14 · unverdicted · none · ref 15
Med-DisSeg uses a dispersive loss on batch representations plus adaptive multi-scale decoding to achieve state-of-the-art fine-grained segmentation on five medical imaging datasets.

Diffuse and disperse: Image generation with representation regularization.arXiv preprint arXiv:2506.09027

fields

years

verdicts

representative citing papers

citing papers explorer