Also, because DRaFT runs the full sampling chain, our reward functions are always evaluated on final generations

of sampling, where K is deterministic, in (Xu et al · 2023

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Directly Fine-Tuning Diffusion Models on Differentiable Rewards

cs.CV · 2023-09-29 · conditional · novelty 6.0

DRaFT fine-tunes diffusion models by differentiating through sampling to maximize rewards, outperforming RL baselines and improving aesthetics on Stable Diffusion 1.4.

citing papers explorer

Showing 1 of 1 citing paper.

Directly Fine-Tuning Diffusion Models on Differentiable Rewards cs.CV · 2023-09-29 · conditional · none · ref 38
DRaFT fine-tunes diffusion models by differentiating through sampling to maximize rewards, outperforming RL baselines and improving aesthetics on Stable Diffusion 1.4.

Also, because DRaFT runs the full sampling chain, our reward functions are always evaluated on final generations

fields

years

verdicts

representative citing papers

citing papers explorer