U., Khodadadian, S., and Maguluri, S

· 2023 · arXiv 2401.00364

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

From Set Convergence to Pointwise Convergence: Finite-Time Guarantees for Average-Reward Q-Learning with Adaptive Stepsizes

cs.LG · 2025-04-25 · unverdicted · novelty 7.0

Establishes Õ(1/k) mean-square last-iterate convergence for asynchronous average-reward Q-learning with adaptive stepsizes and proves adaptivity is necessary.

Non-Expansive Mappings in Two-Time-Scale Stochastic Approximation: Finite-Time Analysis

math.OC · 2025-01-18 · unverdicted · novelty 6.0

Proves O(1/k^{1/4-ε}) last-iterate mean-square residual decay and almost-sure convergence for two-time-scale SA with non-expansive slow mappings, viewed as stochastic inexact Krasnoselskii-Mann iterations.

citing papers explorer

Showing 2 of 2 citing papers.

From Set Convergence to Pointwise Convergence: Finite-Time Guarantees for Average-Reward Q-Learning with Adaptive Stepsizes cs.LG · 2025-04-25 · unverdicted · none · ref 32
Establishes Õ(1/k) mean-square last-iterate convergence for asynchronous average-reward Q-learning with adaptive stepsizes and proves adaptivity is necessary.
Non-Expansive Mappings in Two-Time-Scale Stochastic Approximation: Finite-Time Analysis math.OC · 2025-01-18 · unverdicted · none · ref 16
Proves O(1/k^{1/4-ε}) last-iterate mean-square residual decay and almost-sure convergence for two-time-scale SA with non-expansive slow mappings, viewed as stochastic inexact Krasnoselskii-Mann iterations.

U., Khodadadian, S., and Maguluri, S

fields

years

verdicts

representative citing papers

citing papers explorer