Xverse: Consistent multi-subject control of identity and semantic attributes via dit modulation

Bowen Chen, Mengyi Zhao, Haomiao Sun, Li Chen, Xu Wang, Kang Du, Xinglong Wu · 2025 · arXiv 2506.21416

9 Pith papers cite this work. Polarity classification is still indexing.

9 Pith papers citing it

representative citing papers

InstructMoLE: Instruction-Guided Mixture of Low-rank Experts for Multi-Conditional Image Generation

cs.CV · 2025-12-25 · unverdicted · novelty 7.0

InstructMoLE replaces per-token routing with instruction-guided global routing for mixture-of-low-rank-experts in diffusion transformers and adds an output-space orthogonality loss to improve multi-conditional image generation.

MIBE: Multi-subject Interaction Benchmark and Evaluator for Personalized Image Generation

cs.CV · 2026-07-01 · unverdicted · novelty 6.0

MIBE introduces a multi-subject interaction benchmark (MIB) with silver and gold sets and a dual-head evaluator (MIE) trained on VLM labels that outperforms baselines in matching human judgments.

Scaling Multi-Reference Image Generation with Dynamic Reward Optimization

cs.CV · 2026-06-25 · unverdicted · novelty 6.0

Introduces OmniRef-Bench benchmark and DyRef two-stage framework using Difficulty-aware Advantage Reweighting and Discriminative Reward Scaling to improve open-source models on complex multi-reference image generation.

Training-Free Image Editing with Visual Context Integration and Concept Alignment

cs.CV · 2026-04-06 · unverdicted · novelty 6.0

VicoEdit performs training-free image editing by transforming source images directly with visual context and concept-alignment-guided posterior sampling, outperforming training-based methods.

Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation

cs.CV · 2026-03-21 · unverdicted · novelty 6.0

Premier learns user-specific embeddings to modulate text-to-image generation, outperforming prior methods on preference alignment, text consistency, and expert ratings even with limited history.

Adversarial Concept Distillation for One-Step Diffusion Personalization

cs.CV · 2025-10-23 · unverdicted · novelty 6.0

OPAD enables reliable high-quality personalization of one-step diffusion models via multi-step teacher distillation combined with adversarial alignment losses.

PSR: Scaling Multi-Subject Personalized Image Generation with Pairwise Subject-Consistency Rewards

cs.CV · 2025-12-01 · conditional · novelty 5.0

A data-generation pipeline plus pairwise subject-consistency rewards in RL improve consistency and prompt adherence for multi-subject personalized image generation.

UniVerse: A Unified Modulation Framework for Segmentation-Free,Disentangled Multi-Concept Personalization

cs.CV · 2026-05-29 · unverdicted · novelty 4.0

UniVerse proposes a unified modulation framework for segmentation-free, disentangled multi-concept personalization in diffusion transformers, claiming superior localization and fidelity over baselines.

Scone: Bridging Composition and Distinction in Subject-Driven Image Generation via Unified Understanding-Generation Modeling

cs.CV · 2025-12-14

citing papers explorer

Showing 7 of 7 citing papers after filters.

InstructMoLE: Instruction-Guided Mixture of Low-rank Experts for Multi-Conditional Image Generation cs.CV · 2025-12-25 · unverdicted · none · ref 2
InstructMoLE replaces per-token routing with instruction-guided global routing for mixture-of-low-rank-experts in diffusion transformers and adds an output-space orthogonality loss to improve multi-conditional image generation.
MIBE: Multi-subject Interaction Benchmark and Evaluator for Personalized Image Generation cs.CV · 2026-07-01 · unverdicted · none · ref 2
MIBE introduces a multi-subject interaction benchmark (MIB) with silver and gold sets and a dual-head evaluator (MIE) trained on VLM labels that outperforms baselines in matching human judgments.
Scaling Multi-Reference Image Generation with Dynamic Reward Optimization cs.CV · 2026-06-25 · unverdicted · none · ref 15
Introduces OmniRef-Bench benchmark and DyRef two-stage framework using Difficulty-aware Advantage Reweighting and Discriminative Reward Scaling to improve open-source models on complex multi-reference image generation.
Training-Free Image Editing with Visual Context Integration and Concept Alignment cs.CV · 2026-04-06 · unverdicted · none · ref 3
VicoEdit performs training-free image editing by transforming source images directly with visual context and concept-alignment-guided posterior sampling, outperforming training-based methods.
Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation cs.CV · 2026-03-21 · unverdicted · none · ref 4
Premier learns user-specific embeddings to modulate text-to-image generation, outperforming prior methods on preference alignment, text consistency, and expert ratings even with limited history.
Adversarial Concept Distillation for One-Step Diffusion Personalization cs.CV · 2025-10-23 · unverdicted · none · ref 11
OPAD enables reliable high-quality personalization of one-step diffusion models via multi-step teacher distillation combined with adversarial alignment losses.
UniVerse: A Unified Modulation Framework for Segmentation-Free,Disentangled Multi-Concept Personalization cs.CV · 2026-05-29 · unverdicted · none · ref 2
UniVerse proposes a unified modulation framework for segmentation-free, disentangled multi-concept personalization in diffusion transformers, claiming superior localization and fidelity over baselines.

Xverse: Consistent multi-subject control of identity and semantic attributes via dit modulation

fields

years

verdicts

representative citing papers

citing papers explorer