Language-grounded decoupled action representation for robotic manipulation.arXiv preprint arXiv:2603.12967, 2026

Wuding Weng, Tongshu Wu, Liucheng Chen, Siyu Xie, Zheng Wang, Xing Xu, Jingkuan Song, Heng Tao Shen · 2026 · arXiv 2603.12967

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

DynaFLIP: Rethinking Robotics Perception via Tri-Modal-Dynamics Guided Representation

cs.RO · 2026-05-28 · unverdicted · novelty 6.0

DynaFLIP pre-trains dynamics-aware image encoders by aligning image, language, and 3D flow modalities through simplex-volume minimization plus regularizers on video triplets, yielding reusable backbones that improve manipulation policies by up to 22.5% in out-of-distribution settings.

citing papers explorer

Showing 1 of 1 citing paper after filters.

DynaFLIP: Rethinking Robotics Perception via Tri-Modal-Dynamics Guided Representation cs.RO · 2026-05-28 · unverdicted · none · ref 52
DynaFLIP pre-trains dynamics-aware image encoders by aligning image, language, and 3D flow modalities through simplex-volume minimization plus regularizers on video triplets, yielding reusable backbones that improve manipulation policies by up to 22.5% in out-of-distribution settings.

Language-grounded decoupled action representation for robotic manipulation.arXiv preprint arXiv:2603.12967, 2026

fields

years

verdicts

representative citing papers

citing papers explorer