Recognizing limits: Investigating infeasibility in large language models.arXiv preprint arXiv:2408.05873, 2024

Wenbo Zhang, Zihang Xu, Hengrui Cai · 2024 · arXiv 2408.05873

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Position: Vision-Language-Action Models Cannot Be Verified to Perform Physical Reasoning

cs.RO · 2026-06-28 · conditional · novelty 5.0

VLA benchmark success rates cannot distinguish semantic generalization from physical reasoning due to an identifiability gap in current evaluation protocols.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Position: Vision-Language-Action Models Cannot Be Verified to Perform Physical Reasoning cs.RO · 2026-06-28 · conditional · none · ref 74
VLA benchmark success rates cannot distinguish semantic generalization from physical reasoning due to an identifiability gap in current evaluation protocols.

Recognizing limits: Investigating infeasibility in large language models.arXiv preprint arXiv:2408.05873, 2024

fields

years

verdicts

representative citing papers

citing papers explorer