Title resolution pending

· 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

representative citing papers

ProcessThinker: Enhancing Multi-modal Large Language Models Reasoning via Rollout-based Process Reward

cs.CL · 2026-04-23 · conditional · novelty 5.0

ProcessThinker assigns step-level rewards in GRPO by sampling continuations from each step prefix and using empirical success rates, improving video reasoning benchmarks without training a separate PRM.

citing papers explorer

Showing 1 of 1 citing paper.

ProcessThinker: Enhancing Multi-modal Large Language Models Reasoning via Rollout-based Process Reward cs.CL · 2026-04-23 · conditional · none · ref 30
ProcessThinker assigns step-level rewards in GRPO by sampling continuations from each step prefix and using empirical success rates, improving video reasoning benchmarks without training a separate PRM.

Title resolution pending

fields

years

verdicts

representative citing papers

citing papers explorer