Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models , booktitle =

Chen, Zehui, Liu, Kuikun, Wang, Qiuchen, Zhang, Wenwei, Liu, Jiangning, Lin, Dahua · 2024 · DOI 10.18653/v1/2024.findings-acl.557

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

open at publisher browse 4 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Evoflux: Inference-Time Evolution of Executable Tool Workflows for Compact Agents

cs.AI · 2026-06-10 · unverdicted · novelty 6.0

Evoflux applies evolutionary search at inference time to repair executable tool workflows for compact agents, outperforming SFT and SFT+DPO on held-out MCP-Bench tasks with live servers and 250 tools.

The Landscape of Agentic Reinforcement Learning for LLMs: A Survey

cs.AI · 2025-09-02 · accept · novelty 6.0

Survey that defines agentic RL for LLMs via POMDPs, introduces a taxonomy of planning/tool-use/memory/reasoning capabilities and domains, and compiles open environments from over 500 papers.

WebAggregator: Enhancing Compositional Reasoning Capabilities of Deep Research Agent Foundation Models

cs.CL · 2025-10-16 · unverdicted · novelty 5.0

WebAggregator generates synthetic training data using exploration and logic-proposal steps to fine-tune 32B models that match or exceed GPT-4.1 and Claude-3.7-Sonnet on GAIA and related benchmarks by prioritizing compositional reasoning.

StepGuard: Guarding Web Navigation via Single-Step Calibration

cs.AI · 2026-06-16 · unverdicted · novelty 3.0

StepGuard framework with DDPO and CANR claims SOTA navigation and answer accuracy on web benchmarks by switching policies and triggering reflection on low-confidence steps.

citing papers explorer

Showing 1 of 1 citing paper after filters.

WebAggregator: Enhancing Compositional Reasoning Capabilities of Deep Research Agent Foundation Models cs.CL · 2025-10-16 · unverdicted · none · ref 1
WebAggregator generates synthetic training data using exploration and logic-proposal steps to fine-tune 32B models that match or exceed GPT-4.1 and Claude-3.7-Sonnet on GAIA and related benchmarks by prioritizing compositional reasoning.

Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models , booktitle =

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer