W2S-AlignTree: Weak-to-strong inference- time alignment for large language models via monte carlo tree search.arXiv preprint arXiv:2511.11518,

Ding, Z · arXiv 2511.11518

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Weak Critics Make Strong Learners: On-Policy Critique Distillation for Scalable Oversight

cs.AI · 2026-05-29 · unverdicted · novelty 6.0

Weak models used as critics supplying non-misleading revision directions, distilled on-policy via OPCD, improve frozen and trained strong models on reasoning and alignment benchmarks.

citing papers explorer

Showing 1 of 1 citing paper.

Weak Critics Make Strong Learners: On-Policy Critique Distillation for Scalable Oversight cs.AI · 2026-05-29 · unverdicted · none · ref 7
Weak models used as critics supplying non-misleading revision directions, distilled on-policy via OPCD, improve frozen and trained strong models on reasoning and alignment benchmarks.

W2S-AlignTree: Weak-to-strong inference- time alignment for large language models via monte carlo tree search.arXiv preprint arXiv:2511.11518,

fields

years

verdicts

representative citing papers

citing papers explorer