Integrating object detection modality into visual language model for enhanced autonomous driving agent.arXiv preprint arXiv:2411.05898, 2024

Linfeng He, Yiming Sun, Sihao Wu, Jiaxu Liu, Xiaowei Huang · 2024 · arXiv 2411.05898

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

TPS-Drive: Task-Guided Representation Purification for VLM-based Autonomous Driving

cs.RO · 2026-05-26 · unverdicted · novelty 7.0

TPS-Drive uses an agent-centric tokenizer supervised by a frozen 3D detection head to purify VLM spatial representations, enabling better scene forecasting and lower collision rates on nuScenes and NAVSIM benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

TPS-Drive: Task-Guided Representation Purification for VLM-based Autonomous Driving cs.RO · 2026-05-26 · unverdicted · none · ref 8
TPS-Drive uses an agent-centric tokenizer supervised by a frozen 3D detection head to purify VLM spatial representations, enabling better scene forecasting and lower collision rates on nuScenes and NAVSIM benchmarks.

Integrating object detection modality into visual language model for enhanced autonomous driving agent.arXiv preprint arXiv:2411.05898, 2024

fields

years

verdicts

representative citing papers

citing papers explorer