Machine Learning 47(2-3), 235–256 (2002)

Auer, P · 2002

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Stochastic One-Sided Full-Information Bandit

cs.LG · 2019-06-20 · unverdicted · novelty 7.0

Elimination algorithm for stochastic one-sided full-info bandits achieves O(sqrt(T log(TK))) distribution-independent regret and a gap-dependent bound, claimed as the best theoretical result.

Multilevel Monte-Carlo for Solving POMDPs Online

cs.RO · 2019-07-23 · unverdicted · novelty 6.0

MLPP integrates multilevel Monte Carlo into MCTS to accelerate online POMDP solving for complex dynamics, with experiments indicating outperformance over prior solvers on torque control, navigation, and grasping tasks.

citing papers explorer

Showing 2 of 2 citing papers.

Stochastic One-Sided Full-Information Bandit cs.LG · 2019-06-20 · unverdicted · none · ref 2
Elimination algorithm for stochastic one-sided full-info bandits achieves O(sqrt(T log(TK))) distribution-independent regret and a gap-dependent bound, claimed as the best theoretical result.
Multilevel Monte-Carlo for Solving POMDPs Online cs.RO · 2019-07-23 · unverdicted · none · ref 4
MLPP integrates multilevel Monte Carlo into MCTS to accelerate online POMDP solving for complex dynamics, with experiments indicating outperformance over prior solvers on torque control, navigation, and grasping tasks.

Machine Learning 47(2-3), 235–256 (2002)

fields

years

verdicts

representative citing papers

citing papers explorer