arXiv preprint arXiv:2311.08376 , year=

Ensemble sampling for linear bandits: small ensembles suffice , author= · arXiv 2311.08376

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Practical and Optimal Algorithm for Linear Contextual Bandits with Rare Parameter Updates

stat.ML · 2026-05-31 · unverdicted · novelty 7.0

BLCE-G and BLCE achieve minimax-optimal regret for linear contextual bandits with only O(log log T) parameter updates and reduced computational cost by avoiding near G-optimal design.

Quantile of Means: A Bonus-Free Ensemble Method for Minimax Optimal Reinforcement Learning

cs.LG · 2026-06-18 · unverdicted · novelty 6.0

A quantile-of-means ensemble method achieves minimax optimal variance-dependent regret bounds for finite-horizon MDPs without count-based uncertainty estimates.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Practical and Optimal Algorithm for Linear Contextual Bandits with Rare Parameter Updates stat.ML · 2026-05-31 · unverdicted · none · ref 4
BLCE-G and BLCE achieve minimax-optimal regret for linear contextual bandits with only O(log log T) parameter updates and reduced computational cost by avoiding near G-optimal design.

arXiv preprint arXiv:2311.08376 , year=

fields

years

verdicts

representative citing papers

citing papers explorer