Stochastic variance reduction for policy gradient estimation

· 2018 · arXiv 1710.06034

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Input-Side Variance Suppression under Non-Normal Transient Amplification in Continuous-Control Reinforcement Learning

eess.SY · 2026-04-20 · unverdicted · novelty 6.0

Non-normal transient amplification is an important contributor to closed-loop variance in RL, and input-side suppression can reduce downstream covariance without altering peak gain.

citing papers explorer

Showing 1 of 1 citing paper.

Input-Side Variance Suppression under Non-Normal Transient Amplification in Continuous-Control Reinforcement Learning eess.SY · 2026-04-20 · unverdicted · none · ref 26
Non-normal transient amplification is an important contributor to closed-loop variance in RL, and input-side suppression can reduce downstream covariance without altering peak gain.

Stochastic variance reduction for policy gradient estimation

fields

years

verdicts

representative citing papers

citing papers explorer