Selvaraju and Abhishek Das and Ramakrishna Vedantam and Michael Cogswell and Devi Parikh and Dhruv Batra , title =

Ramprasaath R · 2020 · arXiv 1610.02391

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

representative citing papers

ViperGPT: Visual Inference via Python Execution for Reasoning

cs.CV · 2023-03-14 · unverdicted · novelty 7.0

ViperGPT generates executable Python code to compose pre-trained vision-and-language modules into programs that answer visual queries, reaching state-of-the-art results with no additional training.

Vision Transformers Need Registers

cs.CV · 2023-09-28 · unverdicted · novelty 6.0

Adding register tokens to Vision Transformers eliminates high-norm background artifacts and raises state-of-the-art performance on dense visual prediction tasks.

Exploring Clustering Capability of Inpainting Model Embeddings for Pattern-based Individual Identification

cs.CV · 2026-05-06 · unverdicted · novelty 5.0

Inpainting auxiliary task improves clustering of embeddings for individual zebrafish identification based on skin patterns.

E-PCN: Jet Tagging with Explainable Particle Chebyshev Networks Using Kinematic Features

hep-ph · 2025-12-08 · conditional · novelty 5.0

E-PCN reaches 94.67% macro-accuracy on 10-class jet tagging by weighting graphs with angular separation, transverse momentum, momentum fraction, and invariant mass, with Grad-CAM showing the first two account for 76% of decisions and yielding gains over baseline PCN.

citing papers explorer

Showing 4 of 4 citing papers.

ViperGPT: Visual Inference via Python Execution for Reasoning cs.CV · 2023-03-14 · unverdicted · none · ref 48
ViperGPT generates executable Python code to compose pre-trained vision-and-language modules into programs that answer visual queries, reaching state-of-the-art results with no additional training.
Vision Transformers Need Registers cs.CV · 2023-09-28 · unverdicted · none · ref 219
Adding register tokens to Vision Transformers eliminates high-norm background artifacts and raises state-of-the-art performance on dense visual prediction tasks.
Exploring Clustering Capability of Inpainting Model Embeddings for Pattern-based Individual Identification cs.CV · 2026-05-06 · unverdicted · none · ref 67
Inpainting auxiliary task improves clustering of embeddings for individual zebrafish identification based on skin patterns.
E-PCN: Jet Tagging with Explainable Particle Chebyshev Networks Using Kinematic Features hep-ph · 2025-12-08 · conditional · none · ref 22
E-PCN reaches 94.67% macro-accuracy on 10-class jet tagging by weighting graphs with angular separation, transverse momentum, momentum fraction, and invariant mass, with Grad-CAM showing the first two account for 76% of decisions and yielding gains over baseline PCN.

Selvaraju and Abhishek Das and Ramakrishna Vedantam and Michael Cogswell and Devi Parikh and Dhruv Batra , title =

fields

years

verdicts

representative citing papers

citing papers explorer