Thompson sampling for contextual bandits with linear payoffs

Shipra Agrawal, Navin Goyal · 2013

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

stat.ML · 2026-03-11 · unverdicted · novelty 5.0

RIE-Greedy uses stochasticity from cross-validation regularization to induce Thompson Sampling-like exploration, claimed equivalent in the two-armed case and empirically competitive in large-scale settings.

citing papers explorer

Showing 1 of 1 citing paper.

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits stat.ML · 2026-03-11 · unverdicted · none · ref 6
RIE-Greedy uses stochasticity from cross-validation regularization to induce Thompson Sampling-like exploration, claimed equivalent in the two-armed case and empirically competitive in large-scale settings.

Thompson sampling for contextual bandits with linear payoffs

fields

years

verdicts

representative citing papers

citing papers explorer