Preprint arXiv:2005.13407 (2020); journal version 2021

CausaLM: Causal model explanation through counterfactual language models · 2005 · arXiv 2005.13407

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Causal Tongue-Tie: LLMs Can Encode Causal Direction, But Their Yes/No Outputs Fail to Express

cs.CL · 2026-05-25 · unverdicted · novelty 5.0

LLMs encode causal direction internally via probes but revert to commonsense in Yes/No outputs on anti-commonsense items, showing output accuracy alone does not measure causal understanding.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Causal Tongue-Tie: LLMs Can Encode Causal Direction, But Their Yes/No Outputs Fail to Express cs.CL · 2026-05-25 · unverdicted · none · ref 3
LLMs encode causal direction internally via probes but revert to commonsense in Yes/No outputs on anti-commonsense items, showing output accuracy alone does not measure causal understanding.

Preprint arXiv:2005.13407 (2020); journal version 2021

fields

years

verdicts

representative citing papers

citing papers explorer