Thus ¯θi,j measures the rate at which the state process forgets its initial state–action pair, extending Dobrushin’s coefficients [Dobrushin, 1956] to the controlled setting

TV · 1956

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Model-based Bootstrap of Controlled Markov Chains

stat.ML · 2026-05-12 · unverdicted · novelty 6.0

A model-based bootstrap achieves distributional consistency for transition estimators in controlled Markov chains with unknown policies and yields asymptotically valid confidence intervals for offline policy evaluation and optimal policy recovery.

citing papers explorer

Showing 1 of 1 citing paper.

Model-based Bootstrap of Controlled Markov Chains stat.ML · 2026-05-12 · unverdicted · none · ref 7
A model-based bootstrap achieves distributional consistency for transition estimators in controlled Markov chains with unknown policies and yields asymptotically valid confidence intervals for offline policy evaluation and optimal policy recovery.

Thus ¯θi,j measures the rate at which the state process forgets its initial state–action pair, extending Dobrushin’s coefficients [Dobrushin, 1956] to the controlled setting

fields

years

verdicts

representative citing papers

citing papers explorer