Unlocking global optimality in bilevel optimization: A pilot study.arXiv preprint arXiv:2408.16087

Quan Xiao, Tianyi Chen · arXiv 2408.16087

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

A Hessian-Free Actor-Critic Algorithm for Bi-Level Reinforcement Learning with Applications to LLM Fine-Tuning

cs.LG · 2026-01-23 · unverdicted · novelty 7.0

A Hessian-free single-loop actor-critic algorithm achieves finite-time convergence to the unregularized bi-level RL optimum using attenuating entropy regularization under a special Polyak-Lojasiewicz condition.

citing papers explorer

Showing 1 of 1 citing paper.

A Hessian-Free Actor-Critic Algorithm for Bi-Level Reinforcement Learning with Applications to LLM Fine-Tuning cs.LG · 2026-01-23 · unverdicted · none · ref 4
A Hessian-free single-loop actor-critic algorithm achieves finite-time convergence to the unregularized bi-level RL optimum using attenuating entropy regularization under a special Polyak-Lojasiewicz condition.

Unlocking global optimality in bilevel optimization: A pilot study.arXiv preprint arXiv:2408.16087

fields

years

verdicts

representative citing papers

citing papers explorer