Gomez, Łukasz Kaiser, and Illia Polosukhin

Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N · 2017

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

cs.LG · 2026-05-11 · unverdicted · novelty 6.0

Block-based double decoders use doubly-causal block attention masks to combine decoder-only training efficiency with encoder-decoder inference efficiency, outperforming standard encoder-decoders in scaling experiments.

Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions

cs.CL · 2026-04-30 · unverdicted · novelty 6.0

LLMs encode accurate but brittle internal beliefs about latent game states and convert them poorly into actions, creating systematic gaps that explain strategic failures.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Block-Based Double Decoders cs.LG · 2026-05-11 · unverdicted · none · ref 1
Block-based double decoders use doubly-causal block attention masks to combine decoder-only training efficiency with encoder-decoder inference efficiency, outperforming standard encoder-decoders in scaling experiments.
Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions cs.CL · 2026-04-30 · unverdicted · none · ref 37
LLMs encode accurate but brittle internal beliefs about latent game states and convert them poorly into actions, creating systematic gaps that explain strategic failures.

Gomez, Łukasz Kaiser, and Illia Polosukhin

fields

years

verdicts

representative citing papers

citing papers explorer