Causal autoregressive diffusion language model.arXiv preprint arXiv:2601.22031,

Junhao Ruan, Bei Li, Yongjing Yin, Pengcheng Huang, Xin Chen, Jingang Wang, Xunliang Cai, Tong Xiao, JingBo Zhu · arXiv 2601.22031

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Bifocal Diffusion Language Models: Asymmetric Bidirectional Context for Parallel Generation

cs.IR · 2026-06-26 · unverdicted · novelty 6.0

R2LM combines causal attention with a reverse Mamba SSM sidecar to supply right-side context in dLLMs, claiming 2.4x-12.9x throughput gains over bidirectional dLLMs and 1.9x-2.9x over AR baselines while matching or exceeding quality.

citing papers explorer

Showing 1 of 1 citing paper.

Bifocal Diffusion Language Models: Asymmetric Bidirectional Context for Parallel Generation cs.IR · 2026-06-26 · unverdicted · none · ref 18
R2LM combines causal attention with a reverse Mamba SSM sidecar to supply right-side context in dLLMs, claiming 2.4x-12.9x throughput gains over bidirectional dLLMs and 1.9x-2.9x over AR baselines while matching or exceeding quality.

Causal autoregressive diffusion language model.arXiv preprint arXiv:2601.22031,

fields

years

verdicts

representative citing papers

citing papers explorer