Title resolution pending

URL https://arxiv · 2024 · arXiv 2509.21854

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

representative citing papers

AutoSearch: Adaptive Search Depth for Efficient Agentic RAG via Reinforcement Learning

cs.AI · 2026-04-19 · unverdicted · novelty 6.0

AutoSearch applies RL with a self-answering reward to adaptively determine minimal sufficient search depth in agentic RAG, reducing over-searching while maintaining answer quality on complex questions.

Saliency-Guided Representation with Consistency Policy Learning for Visual Unsupervised Reinforcement Learning

cs.CV · 2026-04-07 · unverdicted · novelty 6.0

SRCP improves zero-shot generalization of successor representation methods in visual unsupervised reinforcement learning via saliency-guided representations and consistency policies.

OpenVLThinkerV2: A Generalist Multimodal Reasoning Model for Multi-domain Visual Tasks

cs.CV · 2026-04-09 · unverdicted · novelty 5.0

OpenVLThinkerV2 applies a new Gaussian GRPO training objective with response and entropy shaping to outperform prior open-source and proprietary models on 18 visual reasoning benchmarks.

citing papers explorer

Showing 3 of 3 citing papers.

AutoSearch: Adaptive Search Depth for Efficient Agentic RAG via Reinforcement Learning cs.AI · 2026-04-19 · unverdicted · none · ref 6
AutoSearch applies RL with a self-answering reward to adaptively determine minimal sufficient search depth in agentic RAG, reducing over-searching while maintaining answer quality on complex questions.
Saliency-Guided Representation with Consistency Policy Learning for Visual Unsupervised Reinforcement Learning cs.CV · 2026-04-07 · unverdicted · none · ref 42
SRCP improves zero-shot generalization of successor representation methods in visual unsupervised reinforcement learning via saliency-guided representations and consistency policies.
OpenVLThinkerV2: A Generalist Multimodal Reasoning Model for Multi-domain Visual Tasks cs.CV · 2026-04-09 · unverdicted · none · ref 35
OpenVLThinkerV2 applies a new Gaussian GRPO training objective with response and entropy shaping to outperform prior open-source and proprietary models on 18 visual reasoning benchmarks.

Title resolution pending

fields

years

verdicts

representative citing papers

citing papers explorer