Masked autoencoders are scalable vision learners

Kaiming He, Xinlei Chen, Saining Xie, Yanghao Li, Piotr Doll´ar, Ross Girshick · 2021

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Layout-Aware Representation Learning for Open-Set ID Fraud Discovery

cs.CV · 2026-04-17 · unverdicted · novelty 5.0

Adapting DINOv3 via SimMIM and composite metric learning on U.S. IDs yields 99.83% Canadian layout accuracy and surfaces 276 fraud cases (222 missed by prior detectors) in 20k Canadian IDs via embedding analysis.

RoboTAG: End-to-end Robot Configuration Estimation via Topological Alignment Graph

cs.RO · 2025-11-11 · unverdicted · novelty 5.0

RoboTAG estimates robot poses from monocular images via a topological alignment graph with 2D-3D co-evolution and consistency supervision to alleviate reliance on labeled data.

citing papers explorer

Showing 2 of 2 citing papers.

Layout-Aware Representation Learning for Open-Set ID Fraud Discovery cs.CV · 2026-04-17 · unverdicted · none · ref 13
Adapting DINOv3 via SimMIM and composite metric learning on U.S. IDs yields 99.83% Canadian layout accuracy and surfaces 276 fraud cases (222 missed by prior detectors) in 20k Canadian IDs via embedding analysis.
RoboTAG: End-to-end Robot Configuration Estimation via Topological Alignment Graph cs.RO · 2025-11-11 · unverdicted · none · ref 11
RoboTAG estimates robot poses from monocular images via a topological alignment graph with 2D-3D co-evolution and consistency supervision to alleviate reliance on labeled data.

Masked autoencoders are scalable vision learners

fields

years

verdicts

representative citing papers

citing papers explorer