Robomamba: Efficient vision-language-action model for robotic reasoning and ma- nipulation

Jiaming Liu, Mengzhen Liu, Zhenyu Wang, Pengju An, Xiaoqi Li, Kaichen Zhou, Senqiao Yang, Renrui Zhang, Yandong Guo, Shanghang Zhang · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Gaze-Regularized Vision-Language-Action Models for Robotic Manipulation

cs.CV · 2026-03-24 · unverdicted · novelty 6.0

Gaze regularization aligns VLA attention with human visual patterns via KL divergence on patch distributions, yielding 4-12% gains on manipulation benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

Gaze-Regularized Vision-Language-Action Models for Robotic Manipulation cs.CV · 2026-03-24 · unverdicted · none · ref 30
Gaze regularization aligns VLA attention with human visual patterns via KL divergence on patch distributions, yielding 4-12% gains on manipulation benchmarks.

Robomamba: Efficient vision-language-action model for robotic reasoning and ma- nipulation

fields

years

verdicts

representative citing papers

citing papers explorer