We observe accuracy gains from PCA up to 64-dimensional embeddings, after which performance degrades as the latent becomes over-compressed at 32 and 16 dimensions

We only use DinoV3 features for this experiment, no tabular data · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Modular Multimodal Classification Without Fine-Tuning: A Simple Compositional Approach

cs.LG · 2026-05-20 · unverdicted · novelty 5.0

CoMET achieves strong multimodal classification performance by composing frozen modality encoders, PCA compression, and tabular foundation models without any training, reaching state-of-the-art on diverse benchmarks including large-scale hierarchical tasks.

citing papers explorer

Showing 1 of 1 citing paper.

Modular Multimodal Classification Without Fine-Tuning: A Simple Compositional Approach cs.LG · 2026-05-20 · unverdicted · none · ref 34
CoMET achieves strong multimodal classification performance by composing frozen modality encoders, PCA compression, and tabular foundation models without any training, reaching state-of-the-art on diverse benchmarks including large-scale hierarchical tasks.

We observe accuracy gains from PCA up to 64-dimensional embeddings, after which performance degrades as the latent becomes over-compressed at 32 and 16 dimensions

fields

years

verdicts

representative citing papers

citing papers explorer