Steering your generalists: Improving robotic foun- dation models via value guidance.Conference on Robot Learning (CoRL)

Mitsuhiko Nakamoto, Oier Mees, Aviral Kumar, Sergey Levine · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Multimodal Reinforcement Learning with Adaptive Verifier for AI Agents

cs.AI · 2025-12-03 · unverdicted · novelty 6.0

Argos is an agentic verifier that adaptively picks scoring functions to evaluate accuracy, localization, and reasoning quality, enabling stronger multimodal RL training for AI agents.

citing papers explorer

Showing 1 of 1 citing paper.

Multimodal Reinforcement Learning with Adaptive Verifier for AI Agents cs.AI · 2025-12-03 · unverdicted · none · ref 43
Argos is an agentic verifier that adaptively picks scoring functions to evaluate accuracy, localization, and reasoning quality, enabling stronger multimodal RL training for AI agents.

Steering your generalists: Improving robotic foun- dation models via value guidance.Conference on Robot Learning (CoRL)

fields

years

verdicts

representative citing papers

citing papers explorer