Doubly mild generalization for offline reinforce- ment learning, 2024

Yixiu Mao, Qi Wang, Yun Qu, Yuhang Jiang, Xiangyang Ji · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

ISEP: Implicit Support Expansion for Offline Reinforcement Learning via Stochastic Policy Optimization

cs.LG · 2026-05-18 · unverdicted · novelty 5.0

ISEP expands action support in offline RL via value interpolation between data and policy samples, then uses stochastic policy optimization to avoid mode collapse in the resulting multimodal objective.

citing papers explorer

Showing 1 of 1 citing paper.

ISEP: Implicit Support Expansion for Offline Reinforcement Learning via Stochastic Policy Optimization cs.LG · 2026-05-18 · unverdicted · none · ref 17
ISEP expands action support in offline RL via value interpolation between data and policy samples, then uses stochastic policy optimization to avoid mode collapse in the resulting multimodal objective.

Doubly mild generalization for offline reinforce- ment learning, 2024

fields

years

verdicts

representative citing papers

citing papers explorer