Revisiting diffusion q-learning: From iterative denoising to one-step action generation.arXiv preprint arXiv:2508.13904, 2025

Thanh Nguyen, Chang D Yoo · 2025 · arXiv 2508.13904

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

ReFPO: Reflow Regularization for Flow Matching Policy Gradients

cs.RO · 2026-06-19 · unverdicted · novelty 4.0

ReFPO adds explicit Reflow regularization to FPO, stabilizing PPO-style training and supporting high-fidelity one-step inference across GridWorld, MuJoCo, and Humanoid tasks.

citing papers explorer

Showing 1 of 1 citing paper after filters.

ReFPO: Reflow Regularization for Flow Matching Policy Gradients cs.RO · 2026-06-19 · unverdicted · none · ref 25
ReFPO adds explicit Reflow regularization to FPO, stabilizing PPO-style training and supporting high-fidelity one-step inference across GridWorld, MuJoCo, and Humanoid tasks.

Revisiting diffusion q-learning: From iterative denoising to one-step action generation.arXiv preprint arXiv:2508.13904, 2025

fields

years

verdicts

representative citing papers

citing papers explorer