Intriguing properties of vision transformers

URLhttps://arxiv · arXiv 2105.10497

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

iBOT: Image BERT Pre-Training with Online Tokenizer

cs.CV · 2021-11-15 · unverdicted · novelty 7.0

iBOT achieves 82.3% linear probing accuracy and 87.8% fine-tuning accuracy on ImageNet-1K using masked image modeling with a jointly trained online tokenizer.

Beyond Compression: Quantifying Spectral Accessibility in Vision Representations

cs.CV · 2026-06-02 · unverdicted · novelty 6.0

Vision encoders alter spectral accessibility non-monotonically across depth with architecture-specific effects from projections and pooling, quantified via a new residual loss against random baselines.

citing papers explorer

Showing 2 of 2 citing papers.

iBOT: Image BERT Pre-Training with Online Tokenizer cs.CV · 2021-11-15 · unverdicted · none · ref 7
iBOT achieves 82.3% linear probing accuracy and 87.8% fine-tuning accuracy on ImageNet-1K using masked image modeling with a jointly trained online tokenizer.
Beyond Compression: Quantifying Spectral Accessibility in Vision Representations cs.CV · 2026-06-02 · unverdicted · none · ref 9
Vision encoders alter spectral accessibility non-monotonically across depth with architecture-specific effects from projections and pooling, quantified via a new residual loss against random baselines.

Intriguing properties of vision transformers

fields

years

verdicts

representative citing papers

citing papers explorer