Consistent with recent findings [29, 30, 28], this regularization is critical for maintaining stable gradient flow in expansive action spaces

Layer Normalization (LayerNorm)

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control

cs.LG · 2026-03-13 · unverdicted · novelty 6.0

FastDSAC enables state-of-the-art maximum entropy RL for high-dimensional humanoid control via entropy redistribution per dimension and improved continuous value estimation.

citing papers explorer

Showing 1 of 1 citing paper.

FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control cs.LG · 2026-03-13 · unverdicted · none · ref 32
FastDSAC enables state-of-the-art maximum entropy RL for high-dimensional humanoid control via entropy redistribution per dimension and improved continuous value estimation.

Consistent with recent findings [29, 30, 28], this regularization is critical for maintaining stable gradient flow in expansive action spaces

fields

years

verdicts

representative citing papers

citing papers explorer