Language models can learn implicit multi-hop reasoning, but only if they have lots of training data

Yao, Yuekun, Du, Yupei, Zhu, Dawei, Hahn, Michael, Koller, Alexander · 2025 · DOI 10.18653/v1/2025.emnlp-main.490

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis

cs.LG · 2026-06-18 · unverdicted · novelty 6.0

Reasoning accuracy in latent CoT depends on mutual information fidelity between latent trajectories and explicit steps, with generative reconstruction preserving capacity better than geometric compression.

citing papers explorer

Showing 1 of 1 citing paper.

What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis cs.LG · 2026-06-18 · unverdicted · none · ref 14
Reasoning accuracy in latent CoT depends on mutual information fidelity between latent trajectories and explicit steps, with generative reconstruction preserving capacity better than geometric compression.

Language models can learn implicit multi-hop reasoning, but only if they have lots of training data

fields

years

verdicts

representative citing papers

citing papers explorer