Salience-invariant consistent policy learning for generalization in visual reinforcement learning

Jingbo Sun, Songjun Tu, Qichao Zhang, Ke Chen, Dongbin Zhao · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

What to Ignore, What to React: Visually Robust RL Fine-Tuning of VLA Models

cs.RO · 2026-05-13 · conditional · novelty 6.0

PAIR-VLA adds invariance and sensitivity objectives over paired visual variants during PPO fine-tuning of VLA models, yielding 9-16% average gains on ManiSkill3 under distractors, textures, poses, viewpoints, and lighting shifts.

citing papers explorer

Showing 1 of 1 citing paper.

What to Ignore, What to React: Visually Robust RL Fine-Tuning of VLA Models cs.RO · 2026-05-13 · conditional · none · ref 36
PAIR-VLA adds invariance and sensitivity objectives over paired visual variants during PPO fine-tuning of VLA models, yielding 9-16% average gains on ManiSkill3 under distractors, textures, poses, viewpoints, and lighting shifts.

Salience-invariant consistent policy learning for generalization in visual reinforcement learning

fields

years

verdicts

representative citing papers

citing papers explorer