Reinforce- ment learning for variable selection in a branch and bound algorithm

Marc Etheve, Zacharie Alès, Côme Bissuel, Olivier Juan, Safia Kedad-Sidhoum · 2020

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

TreeDQN: Sample-Efficient Off-Policy Reinforcement Learning for Combinatorial Optimization

cs.LG · 2023-06-09 · unverdicted · novelty 6.0

TreeDQN is a sample-efficient off-policy RL method for combinatorial optimization that uses tree MDPs, requires up to 10 times less training data than on-policy methods, and outperforms state-of-the-art on ML4CO tasks.

citing papers explorer

Showing 1 of 1 citing paper.

TreeDQN: Sample-Efficient Off-Policy Reinforcement Learning for Combinatorial Optimization cs.LG · 2023-06-09 · unverdicted · none · ref 14
TreeDQN is a sample-efficient off-policy RL method for combinatorial optimization that uses tree MDPs, requires up to 10 times less training data than on-policy methods, and outperforms state-of-the-art on ML4CO tasks.

Reinforce- ment learning for variable selection in a branch and bound algorithm

fields

years

verdicts

representative citing papers

citing papers explorer