Selectit: Selective instruction tuning for llms via uncertainty-aware self-reflection

Liangxin Liu, Xuebo Liu, Derek F Wong, Dongfang Li, Ziyi Wang, Baotian Hu, Min Zhang · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

MindLoom: Composing Thought Modes for Frontier-Level Reasoning Data Synthesis

cs.AI · 2026-05-20 · unverdicted · novelty 5.0

MindLoom synthesizes frontier-level reasoning data by decomposing solutions into thought mode chains, training a retrieval model for mode selection, composing new problems with distribution-aligned sampling, and applying rollout-based difficulty labeling for fine-tuning.

citing papers explorer

Showing 1 of 1 citing paper.

MindLoom: Composing Thought Modes for Frontier-Level Reasoning Data Synthesis cs.AI · 2026-05-20 · unverdicted · none · ref 21
MindLoom synthesizes frontier-level reasoning data by decomposing solutions into thought mode chains, training a retrieval model for mode selection, composing new problems with distribution-aligned sampling, and applying rollout-based difficulty labeling for fine-tuning.

Selectit: Selective instruction tuning for llms via uncertainty-aware self-reflection

fields

years

verdicts

representative citing papers

citing papers explorer