Cambrian-1: A fully open, vision-centric exploration of multimodal llms, 2024

Shengbang Tong, Ellis Brown, Penghao Wu, Sanghyun Woo, Manoj Middepogu, Sai Charitha Akula, Jihan Yang, Shusheng Yang, Adithya Iyer, Xichen Pan, Austin Wang, Rob Fergus, Yann LeCun, Saining Xie · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

BOP-ASK: Object-Interaction Reasoning for Vision-Language Models

cs.CV · 2025-11-20 · unverdicted · novelty 6.0

BOP-ASK supplies 150k images and 33M QA pairs across six tasks to improve VLMs on precise 3D object interaction reasoning and spatial planning.

citing papers explorer

Showing 1 of 1 citing paper.

BOP-ASK: Object-Interaction Reasoning for Vision-Language Models cs.CV · 2025-11-20 · unverdicted · none · ref 54
BOP-ASK supplies 150k images and 33M QA pairs across six tasks to improve VLMs on precise 3D object interaction reasoning and spatial planning.

Cambrian-1: A fully open, vision-centric exploration of multimodal llms, 2024

fields

years

verdicts

representative citing papers

citing papers explorer