System card: Claude sonnet 4.6

Anthropic · 2026

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Can Vision Language Models Judge Action Quality? An Empirical Evaluation

cs.CV · 2026-04-09 · conditional · novelty 7.0

Vision-language models perform only marginally above random on action quality assessment and retain systematic biases even after targeted prompting and contrastive reformulation.

citing papers explorer

Showing 1 of 1 citing paper.

Can Vision Language Models Judge Action Quality? An Empirical Evaluation cs.CV · 2026-04-09 · conditional · none · ref 1
Vision-language models perform only marginally above random on action quality assessment and retain systematic biases even after targeted prompting and contrastive reformulation.

System card: Claude sonnet 4.6

fields

years

verdicts

representative citing papers

citing papers explorer