arXiv preprint arXiv:2512.03405 (2025) 4

Wu, J · 2025 · arXiv 2512.03405

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding

cs.CV · 2026-06-01 · unverdicted · novelty 7.0

X-Stream benchmark shows SOTA MLLMs score ~50% on concurrent multi-stream tasks and lack proactive ability, using a dual-verification pipeline to avoid single-stream bias.

CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning

cs.CV · 2026-05-26 · unverdicted · novelty 5.0

CodecCap introduces a keyframe-residual captioning structure inspired by video codecs to achieve higher-fidelity dense video captions than direct VLM generation.

citing papers explorer

Showing 2 of 2 citing papers.

X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding cs.CV · 2026-06-01 · unverdicted · none · ref 49
X-Stream benchmark shows SOTA MLLMs score ~50% on concurrent multi-stream tasks and lack proactive ability, using a dual-verification pipeline to avoid single-stream bias.
CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning cs.CV · 2026-05-26 · unverdicted · none · ref 3
CodecCap introduces a keyframe-residual captioning structure inspired by video codecs to achieve higher-fidelity dense video captions than direct VLM generation.

arXiv preprint arXiv:2512.03405 (2025) 4

fields

years

verdicts

representative citing papers

citing papers explorer