pyrddlgym: From rddl to gym environments

Ayal Taitler, Michael Gimelfarb, Jihwan Jeong, Sriram Gopalakrishnan, Martin Mladenov, Xiaotian Liu, Scott Sanner · 2022 · arXiv 2211.05939

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Model-Driven Policy Optimization in Differentiable Simulators via Stochastic Exploration

cs.AI · 2026-05-08 · unverdicted · novelty 5.0

MDPO improves differentiable planning by injecting gradient-sensitivity-adapted noise into the action space, outperforming both deterministic variants and PPO on nonlinear and hybrid benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

Model-Driven Policy Optimization in Differentiable Simulators via Stochastic Exploration cs.AI · 2026-05-08 · unverdicted · none · ref 16
MDPO improves differentiable planning by injecting gradient-sensitivity-adapted noise into the action space, outperforming both deterministic variants and PPO on nonlinear and hybrid benchmarks.

pyrddlgym: From rddl to gym environments

fields

years

verdicts

representative citing papers

citing papers explorer