Agentgym-rl: Training llm agents for long-horizon decision making through multi-turn reinforcement learning, 2025

Zhiheng Xi, Jixuan Huang, Chenyang Liao, Baodai Huang, Honglin Guo, Jiaqi Liu, Rui Zheng, Junjie Ye, Jiazheng Zhang, Wenxiang Chen, Wei He, Yiwen Ding, Guanyu Li, Zehui Chen, Zhengyin Du, Xuesong Yao, Yufei Xu, Jiecao Chen, Tao Gui, Zuxuan · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Look Before You Leap: Autonomous Exploration for LLM Agents

cs.AI · 2026-05-15 · unverdicted · novelty 5.0

LLM agents improve adaptability by first using an interaction budget for systematic exploration measured via Exploration Checkpoint Coverage before executing tasks.

citing papers explorer

Showing 1 of 1 citing paper.

Look Before You Leap: Autonomous Exploration for LLM Agents cs.AI · 2026-05-15 · unverdicted · none · ref 7
LLM agents improve adaptability by first using an interaction budget for systematic exploration measured via Exploration Checkpoint Coverage before executing tasks.

Agentgym-rl: Training llm agents for long-horizon decision making through multi-turn reinforcement learning, 2025

fields

years

verdicts

representative citing papers

citing papers explorer