Jincheng Mei, Chenjun Xiao, Csaba Szepesvári, and Dale Schuurmans

doi: 10 · 2009 · arXiv 2009.539975

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Policy Gradient for Continuous-Time Robust Markov Decision Processes

cs.LG · 2026-06-03 · unverdicted · novelty 7.0

Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.

citing papers explorer

Showing 1 of 1 citing paper.

Policy Gradient for Continuous-Time Robust Markov Decision Processes cs.LG · 2026-06-03 · unverdicted · none · ref 22
Extends robust MDPs to continuous time with policy gradient derivations using differential equation methods and proposes optimizers achieving linear convergence and specific sample complexities.

Jincheng Mei, Chenjun Xiao, Csaba Szepesvári, and Dale Schuurmans

fields

years

verdicts

representative citing papers

citing papers explorer