Imagenet: A large-scale hierarchical image database

Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, Li Fei-Fei · 2009

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

browse 3 citing papers

citation-role summary

dataset 1

citation-polarity summary

use dataset 1

representative citing papers

Cluster-Aware Neural Collapse Prompt Tuning for Long-Tailed Generalization of Vision-Language Models

cs.CV · 2026-05-12 · unverdicted · novelty 6.0

CPT creates cluster-invariant spaces from pre-trained VLM semantics and applies neural collapse losses to boost long-tail performance and unseen-class generalization in prompt tuning.

Robustness of Vision Foundation Models to Common Perturbations

cs.CR · 2026-04-16 · unverdicted · novelty 6.0

Vision foundation models from OpenAI and Meta are non-robust to nine categories of common perturbations, with new metrics linking robustness scores to downstream performance drops and a fine-tuning method proposed to improve stability without losing utility.

Seeing Through Touch: Tactile-Driven Visual Localization of Material Regions

cs.CV · 2026-04-13 · unverdicted · novelty 6.0

The model uses dense visuo-tactile feature interactions and material-diversity pairing on expanded datasets to generate tactile saliency maps for material segmentation, outperforming prior global-alignment methods.

citing papers explorer

Showing 3 of 3 citing papers.

Cluster-Aware Neural Collapse Prompt Tuning for Long-Tailed Generalization of Vision-Language Models cs.CV · 2026-05-12 · unverdicted · none · ref 8
CPT creates cluster-invariant spaces from pre-trained VLM semantics and applies neural collapse losses to boost long-tail performance and unseen-class generalization in prompt tuning.
Robustness of Vision Foundation Models to Common Perturbations cs.CR · 2026-04-16 · unverdicted · none · ref 6
Vision foundation models from OpenAI and Meta are non-robust to nine categories of common perturbations, with new metrics linking robustness scores to downstream performance drops and a fine-tuning method proposed to improve stability without losing utility.
Seeing Through Touch: Tactile-Driven Visual Localization of Material Regions cs.CV · 2026-04-13 · unverdicted · none · ref 11
The model uses dense visuo-tactile feature interactions and material-diversity pairing on expanded datasets to generate tactile saliency maps for material segmentation, outperforming prior global-alignment methods.

Imagenet: A large-scale hierarchical image database

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer