Mm-cot: a benchmark for probing visual chain-of-thought reasoning in multimodal models

Jusheng Zhang, Kaitong Cai, Xiaoyang Guo, Sidi Liu, Qinhan Lv, Ruiqi Chen, Jing Yang, Yijia Fan, Xiaofei Sun, Jian Wang, Ziliang Chen, Liang Lin, Keze Wang, “Mm-cot:a benchmark for probing visual chain-of-thought reasoning in multim · 2025 · arXiv 2512.08228

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

representative citing papers

Visual Latents Know More Than They Say: Unsilencing Latent Reasoning in MLLMs

cs.LG · 2026-05-04 · unverdicted · novelty 6.0

Visual latents in MLLMs are systematically silenced by autoregressive training but can be unsilenced at inference via query-guided contrastive alignment followed by a confidence-progression reward.

Forgetting as a Feature: Cognitive Alignment of Large Language Models

cs.CL · 2025-12-28 · unverdicted · novelty 5.0

LLMs show human-like forgetting rates that can be harnessed through probabilistic memory prompting to improve long-horizon reasoning.

citing papers explorer

Showing 2 of 2 citing papers.

Visual Latents Know More Than They Say: Unsilencing Latent Reasoning in MLLMs cs.LG · 2026-05-04 · unverdicted · none · ref 43
Visual latents in MLLMs are systematically silenced by autoregressive training but can be unsilenced at inference via query-guided contrastive alignment followed by a confidence-progression reward.
Forgetting as a Feature: Cognitive Alignment of Large Language Models cs.CL · 2025-12-28 · unverdicted · none · ref 17
LLMs show human-like forgetting rates that can be harnessed through probabilistic memory prompting to improve long-horizon reasoning.

Mm-cot: a benchmark for probing visual chain-of-thought reasoning in multimodal models

fields

years

verdicts

representative citing papers

citing papers explorer