Improved Gradient-Based Optimization Over Discrete Distributions

Arash Vahdat; Bill Macready; Evgeny Andriyash

arxiv: 1810.00116 · v3 · pith:4JF6VAUUnew · submitted 2018-09-29 · 📊 stat.ML · cs.LG

Improved Gradient-Based Optimization Over Discrete Distributions

Evgeny Andriyash , Arash Vahdat , Bill Macready This is my paper

classification 📊 stat.ML cs.LG

keywords biascontinuousdiscretedistributionestimatorsoptimizationreducedrelaxation

0 comments

read the original abstract

In many applications we seek to maximize an expectation with respect to a distribution over discrete variables. Estimating gradients of such objectives with respect to the distribution parameters is a challenging problem. We analyze existing solutions including finite-difference (FD) estimators and continuous relaxation (CR) estimators in terms of bias and variance. We show that the commonly used Gumbel-Softmax estimator is biased and propose a simple method to reduce it. We also derive a simpler piece-wise linear continuous relaxation that also possesses reduced bias. We demonstrate empirically that reduced bias leads to a better performance in variational inference and on binary optimization tasks.

This paper has not been read by Pith yet.

Improved Gradient-Based Optimization Over Discrete Distributions

discussion (0)