DOTS: Learning to reason dynamically in LLMs via optimal reasoning trajectories search

Murong Yue, Wenlin Yao, Haitao Mi, Dian Yu, Ziyu Yao, Dong Yu · 2025 · arXiv 2410.03864

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

TIME: Temporally Intelligent Meta-reasoning Engine for Context-Triggered Explicit Reasoning

cs.LG · 2026-01-08 · unverdicted · novelty 7.0

TIME trains LLMs to trigger compact, context-triggered reasoning via time tags and tick events, improving TIMEBench scores while cutting explicit reasoning tokens by an order of magnitude.

DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments

cs.AI · 2025-04-04 · conditional · novelty 6.0

End-to-end RL in authentic web environments produces LLM research agents that outperform prompt-engineering and RAG-based baselines by up to 28.9 and 7.2 points respectively while exhibiting emergent planning, cross-validation, and self-reflection.

citing papers explorer

Showing 2 of 2 citing papers.

TIME: Temporally Intelligent Meta-reasoning Engine for Context-Triggered Explicit Reasoning cs.LG · 2026-01-08 · unverdicted · none · ref 17
TIME trains LLMs to trigger compact, context-triggered reasoning via time tags and tick events, improving TIMEBench scores while cutting explicit reasoning tokens by an order of magnitude.
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments cs.AI · 2025-04-04 · conditional · none · ref 13
End-to-end RL in authentic web environments produces LLM research agents that outperform prompt-engineering and RAG-based baselines by up to 28.9 and 7.2 points respectively while exhibiting emergent planning, cross-validation, and self-reflection.

DOTS: Learning to reason dynamically in LLMs via optimal reasoning trajectories search

fields

years

verdicts

representative citing papers

citing papers explorer