Title resolution pending

A Mechanistic Analysis of Looped Reasoning Language Models , author= · 2026

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

browse 3 citing papers

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

representative citing papers

Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning

cs.LG · 2026-05-20 · unverdicted · novelty 6.0

Equilibrium Reasoners learn task-conditioned attractors in latent dynamics to support scalable iterative reasoning, raising Sudoku-Extreme accuracy from 2.6% to over 99% via up to 40,000 equivalent layers.

Solve the Loop: Attractor Models for Language and Reasoning

cs.LG · 2026-05-12 · unverdicted · novelty 6.0

Attractor Models solve for fixed points in transformer embeddings using implicit differentiation to enable stable iterative refinement, delivering better perplexity, accuracy, and efficiency than standard or looped transformers.

Training-Induced Escape from Token Clustering in a Mean-Field Formulation of Transformers

cs.LG · 2026-05-08 · unverdicted · novelty 5.0

Training a mean-field Transformer under L2 regularization induces an escape from attention-driven token clustering in later layers after initial clustering.

citing papers explorer

Showing 3 of 3 citing papers.

Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning cs.LG · 2026-05-20 · unverdicted · none · ref 41
Equilibrium Reasoners learn task-conditioned attractors in latent dynamics to support scalable iterative reasoning, raising Sudoku-Extreme accuracy from 2.6% to over 99% via up to 40,000 equivalent layers.
Solve the Loop: Attractor Models for Language and Reasoning cs.LG · 2026-05-12 · unverdicted · none · ref 14
Attractor Models solve for fixed points in transformer embeddings using implicit differentiation to enable stable iterative refinement, delivering better perplexity, accuracy, and efficiency than standard or looped transformers.
Training-Induced Escape from Token Clustering in a Mean-Field Formulation of Transformers cs.LG · 2026-05-08 · unverdicted · none · ref 55
Training a mean-field Transformer under L2 regularization induces an escape from attention-driven token clustering in later layers after initial clustering.

Title resolution pending

fields

years

verdicts

representative citing papers

citing papers explorer