arXiv preprint arXiv:2512.00207 , year=

Constructing Efficient Fact-Storing MLPs for Transformers , author= · arXiv 2512.00207

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

citation-role summary

method 1

citation-polarity summary

use method 1

representative citing papers

Geometric Factual Recall in Transformers

cs.CL · 2026-05-12 · conditional · novelty 8.0

A single-layer transformer memorizes random subject-attribute bijections using logarithmic embedding dimension via linear superpositions in embeddings and ReLU-gated selection in the MLP, with zero-shot transfer to new facts and matching multi-hop constructions.

citing papers explorer

Showing 1 of 1 citing paper.

Geometric Factual Recall in Transformers cs.CL · 2026-05-12 · conditional · none · ref 7
A single-layer transformer memorizes random subject-attribute bijections using logarithmic embedding dimension via linear superpositions in embeddings and ReLU-gated selection in the MLP, with zero-shot transfer to new facts and matching multi-hop constructions.

arXiv preprint arXiv:2512.00207 , year=

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer