David Mark Bossens and Atsushi Nitanda

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

Policy Gradient for Continuous-Time Robust Markov Decision Processes

cs.LG · 2026-06-03 · unverdicted · novelty 7.0

Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.

citing papers explorer

Showing 1 of 1 citing paper.

Policy Gradient for Continuous-Time Robust Markov Decision Processes cs.LG · 2026-06-03 · unverdicted · none · ref 6
Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.

David Mark Bossens and Atsushi Nitanda

fields

years

verdicts

representative citing papers

citing papers explorer