Performance of npg in countable state-space average-cost rl.arXiv preprint arXiv:2405.20467,

Yashaswini Murthy, Isaac Grosof, Siva Theja Maguluri, R Srikant · arXiv 2405.20467

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Algorithm for Contextual Queueing Bandits with Rate-Optimal Queue Length Regret

cs.LG · 2026-06-08 · unverdicted · novelty 7.0

Presents CQB-η-2 algorithm achieving &#x1D4AÃ(T^{-1/2}) queue length regret in contextual queueing bandits under stochastic contexts, with matching Ω(T^{-1/2}) lower bound.

citing papers explorer

Showing 1 of 1 citing paper.

Algorithm for Contextual Queueing Bandits with Rate-Optimal Queue Length Regret cs.LG · 2026-06-08 · unverdicted · none · ref 7
Presents CQB-η-2 algorithm achieving &#x1D4AÃ(T^{-1/2}) queue length regret in contextual queueing bandits under stochastic contexts, with matching Ω(T^{-1/2}) lower bound.

Performance of npg in countable state-space average-cost rl.arXiv preprint arXiv:2405.20467,

fields

years

verdicts

representative citing papers

citing papers explorer