Data selection for fine-tuning vision language models via cross modal alignment trajectories,

· 2025 · arXiv 2510.01454

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning

cs.CV · 2026-05-26 · unverdicted · novelty 7.0

A selector trained once on LLaVA-665K in CLIP space selects 15% of instructions to reach 98.3% of full-data performance and generalizes to an unseen dataset and different VLMs.

Single-Rollout Hidden-State Dynamics for Training-Free RLVR Data Selection

cs.LG · 2026-05-27 · unverdicted · novelty 6.0

SHIFT selects compact RLVR training subsets using the magnitude of hidden-state change from a single inference rollout plus quality-weighted farthest-first coverage, outperforming training-free baselines on math reasoning and medical QA under low budgets.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning cs.CV · 2026-05-26 · unverdicted · none · ref 6
A selector trained once on LLaVA-665K in CLIP space selects 15% of instructions to reach 98.3% of full-data performance and generalizes to an unseen dataset and different VLMs.

Data selection for fine-tuning vision language models via cross modal alignment trajectories,

fields

years

verdicts

representative citing papers

citing papers explorer