The logit lens: Understanding hidden state dynamics in language models

Nostalgebraist · 2012 · arXiv 2012.08981

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Visuals Lie, Consistency Speaks: Disentangling Spatial Attention from Reliability in Vision-Language Models

cs.CV · 2026-06-16 · unverdicted · novelty 6.0

Spatial attention metrics in VLMs correlate near zero (R≈0.001) with accuracy while self-consistency predicts truth at R=0.429; reliability stems from generation dynamics rather than visual grounding.

citing papers explorer

Showing 1 of 1 citing paper.

Visuals Lie, Consistency Speaks: Disentangling Spatial Attention from Reliability in Vision-Language Models cs.CV · 2026-06-16 · unverdicted · none · ref 7
Spatial attention metrics in VLMs correlate near zero (R≈0.001) with accuracy while self-consistency predicts truth at R=0.429; reliability stems from generation dynamics rather than visual grounding.

The logit lens: Understanding hidden state dynamics in language models

fields

years

verdicts

representative citing papers

citing papers explorer