Decision mamba: Reinforcement learning via sequence modeling with selective state spaces.arXiv preprint arXiv:2403.19925

Toshihiro Ota · arXiv 2403.19925

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Belief-State RWKV for Reinforcement Learning under Partial Observability

cs.LG · 2026-04-01 · unverdicted · novelty 5.0

Belief-state RWKV maintains an uncertainty-aware recurrent state for RL policies in partial observability and shows modest gains over standard recurrent baselines in a pilot with observation noise.

citing papers explorer

Showing 1 of 1 citing paper.

Belief-State RWKV for Reinforcement Learning under Partial Observability cs.LG · 2026-04-01 · unverdicted · none · ref 14
Belief-state RWKV maintains an uncertainty-aware recurrent state for RL policies in partial observability and shows modest gains over standard recurrent baselines in a pilot with observation noise.

Decision mamba: Reinforcement learning via sequence modeling with selective state spaces.arXiv preprint arXiv:2403.19925

fields

years

verdicts

representative citing papers

citing papers explorer