Do vision trans- formers see like convolutional neural networks? In Advances in Neural Information Processing Systems (NeurIPS) , pages 12116–12128

Maithra Raghu, Thomas Unterthiner, Simon Kornblith, Chiyuan Zhang, Alexey Dosovitskiy · 2021

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Zero-Shot Textual Explanations via Translating Decision-Critical Features

cs.CV · 2025-12-08 · unverdicted · novelty 5.0

TEXTER generates zero-shot textual explanations for image classifiers by isolating decision-critical features from contributing neurons, mapping them into CLIP space, and using sparse autoencoders for improved interpretability in Transformers.

citing papers explorer

Showing 1 of 1 citing paper.

Zero-Shot Textual Explanations via Translating Decision-Critical Features cs.CV · 2025-12-08 · unverdicted · none · ref 41
TEXTER generates zero-shot textual explanations for image classifiers by isolating decision-critical features from contributing neurons, mapping them into CLIP space, and using sparse autoencoders for improved interpretability in Transformers.

Do vision trans- formers see like convolutional neural networks? In Advances in Neural Information Processing Systems (NeurIPS) , pages 12116–12128

fields

years

verdicts

representative citing papers

citing papers explorer