Between MDPs and semi- MDPs: A framework for temporal abstraction in reinforcement learning

· 1999

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Learning Without Losing Identity: Capability Evolution for Embodied Agents

cs.RO · 2026-04-09 · unverdicted · novelty 6.0 · 2 refs

Embodied agents maintain persistent identity while evolving modular capabilities through a closed-loop process, raising simulated task success from 32.4% to 91.3% with zero policy drift.

Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments

cs.LG · 2026-04-02 · unverdicted · novelty 6.0

AMC models memory consolidation via a Liquid-Glass-Crystal process governed by an SDE with proven convergence to a Beta distribution, yielding 34-43% better forward transfer and 67-80% less forgetting on standard continual RL benchmarks.

citing papers explorer

Showing 2 of 2 citing papers.

Learning Without Losing Identity: Capability Evolution for Embodied Agents cs.RO · 2026-04-09 · unverdicted · none · ref 7 · 2 links
Embodied agents maintain persistent identity while evolving modular capabilities through a closed-loop process, raising simulated task success from 32.4% to 91.3% with zero policy drift.
Adaptive Memory Crystallization for Autonomous AI Agent Learning in Dynamic Environments cs.LG · 2026-04-02 · unverdicted · none · ref 45
AMC models memory consolidation via a Liquid-Glass-Crystal process governed by an SDE with proven convergence to a Beta distribution, yielding 34-43% better forward transfer and 67-80% less forgetting on standard continual RL benchmarks.

Between MDPs and semi- MDPs: A framework for temporal abstraction in reinforcement learning

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer