Boosting continuous control with consistency policy

Yuhui Chen, Haoran Li, Dongbin Zhao · 2024 · arXiv 5637.366288

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

cs.LG · 2026-06-21 · unverdicted · novelty 6.0

Presents adjoint matching for scalable max-ent RL training of diffusion policies, enabling simulation-free optimization.

Showing 1 of 1 citing paper.

Scalable Maximum Entropy Reinforcement Learning for Diffusion Policies via Adjoint Matching cs.LG · 2026-06-21 · unverdicted · none · ref 23
Presents adjoint matching for scalable max-ent RL training of diffusion policies, enabling simulation-free optimization.