Meta-reinforcement learning robust to distributional shift via model identification and experience relabeling

Mendonca, R · 2006 · arXiv 2006.07178

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks

cs.LG · 2025-02-05 · unverdicted · novelty 6.0

TAVT improves OOD task generalization in meta-RL by preserving task characteristics in virtual tasks via metric learning and using state regularization.

Self-Improving Skill Learning for Robust Skill-based Meta-Reinforcement Learning

cs.LG · 2025-02-06 · unverdicted · novelty 4.0

SISL adds self-improving decoupled policies and return-based prioritization to skill-based meta-RL to achieve stable adaptation from noisy demonstrations on long-horizon tasks.

citing papers explorer

Showing 2 of 2 citing papers.

Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks cs.LG · 2025-02-05 · unverdicted · none · ref 41
TAVT improves OOD task generalization in meta-RL by preserving task characteristics in virtual tasks via metric learning and using state regularization.
Self-Improving Skill Learning for Robust Skill-based Meta-Reinforcement Learning cs.LG · 2025-02-06 · unverdicted · none · ref 11
SISL adds self-improving decoupled policies and return-based prioritization to skill-based meta-RL to achieve stable adaptation from noisy demonstrations on long-horizon tasks.

Meta-reinforcement learning robust to distributional shift via model identification and experience relabeling

fields

years

verdicts

representative citing papers

citing papers explorer