Pebble: Feedback- efficient interactive reinforcement learning via relabel- ing experience and unsupervised pre-training,

· 2021

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons

cs.RO · 2026-03-02 · unverdicted · novelty 6.0

Robometer combines intra-trajectory progress supervision with inter-trajectory preference supervision on a 1M-trajectory dataset to learn more generalizable robotic reward functions than prior methods.

citing papers explorer

Showing 1 of 1 citing paper.

Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons cs.RO · 2026-03-02 · unverdicted · none · ref 29
Robometer combines intra-trajectory progress supervision with inter-trajectory preference supervision on a 1M-trajectory dataset to learn more generalizable robotic reward functions than prior methods.

Pebble: Feedback- efficient interactive reinforcement learning via relabel- ing experience and unsupervised pre-training,

fields

years

verdicts

representative citing papers

citing papers explorer