Pointvla: Injecting the 3d world into vision-language-action models

Li, C · 2026 · arXiv 2026.365330

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Fourier Features Let Agents Learn High Precision Policies with Imitation Learning

cs.LG · 2026-06-10 · unverdicted · novelty 6.0

Mapping point clouds to Fourier features improves high-precision imitation learning policies on RoboCasa, ManiSkill3, and real-robot tasks compared with Cartesian inputs.

Sparse2Act: Learning Action-Aligned Sparse 3D Representations for Cross-Domain Robot Manipulation

cs.RO · 2026-06-10 · unverdicted · novelty 5.0

Sparse2Act pretrains sparse 3D encoders via masked action-alignment supervision, yielding reusable representations that reach 86.9% success on LIBERO-10 and enable cross-domain transfer.

citing papers explorer

Showing 2 of 2 citing papers.

Fourier Features Let Agents Learn High Precision Policies with Imitation Learning cs.LG · 2026-06-10 · unverdicted · none · ref 26
Mapping point clouds to Fourier features improves high-precision imitation learning policies on RoboCasa, ManiSkill3, and real-robot tasks compared with Cartesian inputs.
Sparse2Act: Learning Action-Aligned Sparse 3D Representations for Cross-Domain Robot Manipulation cs.RO · 2026-06-10 · unverdicted · none · ref 45
Sparse2Act pretrains sparse 3D encoders via masked action-alignment supervision, yielding reusable representations that reach 86.9% success on LIBERO-10 and enable cross-domain transfer.

Pointvla: Injecting the 3d world into vision-language-action models

fields

years

verdicts

representative citing papers

citing papers explorer