Fact-and-Reflection Improves Confidence Calibration of Large Language Models,

· 2024 · arXiv 2402.17124

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Scaling with Confidence: Calibrating Confidence of LLMs for Adaptive Test Time Scaling

cs.AI · 2026-07-02 · unverdicted · novelty 5.0

C3RL is a new RL algorithm combining correctness, calibration, and reference accuracy rewards to improve LLM confidence calibration, enabling CAS to outperform majority voting with up to 12.33x lower inference cost.

Latent Confidence Alignment for LLM Self-Assessment

cs.CY · 2026-06-20 · unverdicted · novelty 5.0

LCAE is introduced as a Rasch-model metric that aligns LLM self-reported confidence with latent error probability derived from ability and item difficulty, shown to improve calibration on a medical dataset across 20 models.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Latent Confidence Alignment for LLM Self-Assessment cs.CY · 2026-06-20 · unverdicted · none · ref 32
LCAE is introduced as a Rasch-model metric that aligns LLM self-reported confidence with latent error probability derived from ability and item difficulty, shown to improve calibration on a medical dataset across 20 models.

Fact-and-Reflection Improves Confidence Calibration of Large Language Models,

fields

years

verdicts

representative citing papers

citing papers explorer