Title resolution pending

Cluster-former: Clustering-based sparse transformer for long-form question answering, in: Findings of the Association for Computational Linguistics: ACL-IJCNLP · 2021

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

representative citing papers

Hierarchical Kernel Transformer: Multi-Scale Attention with an Information-Theoretic Approximation Analysis

cs.LG · 2026-04-10 · unverdicted · novelty 7.0

HKT is a multi-scale attention architecture that bounds computation at 1.31x standard attention, proves kernel and decomposition properties, and reports accuracy gains on ListOps, sequential CIFAR-10, and character-level IMDB.

citing papers explorer

Showing 1 of 1 citing paper.

Hierarchical Kernel Transformer: Multi-Scale Attention with an Information-Theoretic Approximation Analysis cs.LG · 2026-04-10 · unverdicted · none · ref 6
HKT is a multi-scale attention architecture that bounds computation at 1.31x standard attention, proves kernel and decomposition properties, and reports accuracy gains on ListOps, sequential CIFAR-10, and character-level IMDB.

Title resolution pending

fields

years

verdicts

representative citing papers

citing papers explorer