Continual instruction tuning for large multimodal models

Jinghan He, Haiyun Guo, Ming Tang, Jinqiao Wang · 2023 · arXiv 2311.16206

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Modality-Inconsistent Continual Learning of Multimodal Large Language Models

cs.LG · 2024-12-17 · unverdicted · novelty 7.0

The paper introduces the MICL scenario for MLLMs with modality and task shifts and proposes MoInCL using pseudo-target generation and instruction-based distillation, reporting gains over continual learning baselines on six tasks.

CheXmix: Unified Generative Pretraining for Vision Language Models in Medical Imaging

cs.CV · 2026-04-24 · unverdicted · novelty 6.0

CheXmix combines masked autoencoder pretraining with early-fusion generative modeling to outperform prior models on chest X-ray classification by up to 8.6% AUROC, inpainting by 51%, and report generation by 45% on GREEN.

citing papers explorer

Showing 2 of 2 citing papers.

Modality-Inconsistent Continual Learning of Multimodal Large Language Models cs.LG · 2024-12-17 · unverdicted · none · ref 11
The paper introduces the MICL scenario for MLLMs with modality and task shifts and proposes MoInCL using pseudo-target generation and instruction-based distillation, reporting gains over continual learning baselines on six tasks.
CheXmix: Unified Generative Pretraining for Vision Language Models in Medical Imaging cs.CV · 2026-04-24 · unverdicted · none · ref 11
CheXmix combines masked autoencoder pretraining with early-fusion generative modeling to outperform prior models on chest X-ray classification by up to 8.6% AUROC, inpainting by 51%, and report generation by 45% on GREEN.

Continual instruction tuning for large multimodal models

fields

years

verdicts

representative citing papers

citing papers explorer