Continuous-time q-learning for jump-diffusion models under tsallis entropy

· 2024 · arXiv 2407.03888

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

An Actor-Critic Framework for Continuous-Time Jump-Diffusion Controls with Normalizing Flows

math.OC · 2026-04-07 · unverdicted · novelty 7.0

An actor-critic framework built on a time-inhomogeneous little q-function and conditional normalizing flows serves as a mesh-free solver for entropy-regularized jump-diffusion control problems and stochastic games.

Entropy-Regularized Reinforcement Learning for Linear-Quadratic Stackelberg Differential Games in Regime-Switching Diffusion Models

cs.LG · 2026-06-27 · unverdicted · novelty 5.0

The paper introduces an entropy-regularized RL framework deriving exploratory weakly-coupled HJBI equations and using neural networks to approximate value functions for high-dimensional LQ-SDGs under Markov regime switching.

citing papers explorer

Showing 2 of 2 citing papers.

An Actor-Critic Framework for Continuous-Time Jump-Diffusion Controls with Normalizing Flows math.OC · 2026-04-07 · unverdicted · none · ref 8
An actor-critic framework built on a time-inhomogeneous little q-function and conditional normalizing flows serves as a mesh-free solver for entropy-regularized jump-diffusion control problems and stochastic games.
Entropy-Regularized Reinforcement Learning for Linear-Quadratic Stackelberg Differential Games in Regime-Switching Diffusion Models cs.LG · 2026-06-27 · unverdicted · none · ref 30
The paper introduces an entropy-regularized RL framework deriving exploratory weakly-coupled HJBI equations and using neural networks to approximate value functions for high-dimensional LQ-SDGs under Markov regime switching.

Continuous-time q-learning for jump-diffusion models under tsallis entropy

fields

years

verdicts

representative citing papers

citing papers explorer