A practitioner’s guide to continual multimodal pretraining

A Practitioner's Guide to Continual Multimodal Pretraining , author= · 2024 · arXiv 2408.14471

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

read on arXiv browse 5 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Continual Learning for VLMs: A Survey and Taxonomy Beyond Forgetting

cs.CV · 2025-08-06 · unverdicted · novelty 7.0

The paper offers a comprehensive survey and proposes a new taxonomy for continual learning strategies in VLMs and MLLMs to combat catastrophic forgetting beyond traditional methods.

DataComp-VLM: Improved Open Datasets for Vision-Language Models

cs.CV · 2026-06-26 · unverdicted · novelty 6.0

DataComp-VLM benchmark shows instruction-heavy data mixtures outperform caption-heavy ones for VLM training, with DCVLM-Baseline reaching 63.6% on 33 tasks using 200B tokens, +5.4pp over FineVision.

ProtoAda: Prototype-Guided Adaptive Adapter Expansion and Geometric Consolidation for Multimodal Continual Instruction Tuning

cs.CV · 2026-06-01 · unverdicted · novelty 6.0

ProtoAda uses format-aware prototypes for better task routing and geometry-aware consolidation to reduce interference in multimodal continual instruction tuning.

Rethinking Continual Learning for Speech and Audio: A Representation-Centric Taxonomy and Open Problems

eess.AS · 2026-05-24 · unverdicted · novelty 6.0

Introduces a representation-geometry-based taxonomy for continual learning in speech and audio, identifies mismatches with current CL assumptions in foundation models, and lists open challenges.

CRAM: Centroid-Routing and Adaptive MoE for Multimodal Continual Instruction Tuning

cs.CL · 2026-06-01 · unverdicted · novelty 5.0

CRAM uses adaptive MoE with centroid routing and orthogonality constraints to enable parameter-efficient multimodal continual instruction tuning while mitigating forgetting.

citing papers explorer

Showing 0 of 0 citing papers after filters.

No citing papers match the current filters.

A practitioner’s guide to continual multimodal pretraining

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer