arXiv preprint arXiv:2411.10794 (2024)

Regmi, S · 2024 · arXiv 2411.10794

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

When Confidence Lacks Concepts: Interpretable OOD Detection via Representation Perturbations

cs.LG · 2026-06-15 · unverdicted · novelty 6.0

Proposes using sparse autoencoders to extract class-conditioned concept vectors, then measuring logit stability under targeted perturbations as an interpretable OOD signal for deep networks in medical imaging.

citing papers explorer

Showing 1 of 1 citing paper.

When Confidence Lacks Concepts: Interpretable OOD Detection via Representation Perturbations cs.LG · 2026-06-15 · unverdicted · none · ref 26
Proposes using sparse autoencoders to extract class-conditioned concept vectors, then measuring logit stability under targeted perturbations as an interpretable OOD signal for deep networks in medical imaging.

arXiv preprint arXiv:2411.10794 (2024)

fields

years

verdicts

representative citing papers

citing papers explorer