Optimising Factual Consistency in Summarisation via Preference Learning from Multiple Imperfect Metrics

Ye, Yuxuan, Santos-Rodriguez, Raul, Simpson, Edwin · 2025 · DOI 10.18653/v1/2025.findings-emnlp.940

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

Beyond Overlap Metrics: Rewarding Reasoning and Preferences for Faithful Multi-Role Dialogue Summarization

cs.CL · 2026-04-19 · unverdicted · novelty 5.0

A reasoning-distillation plus dual-reward GRPO method for multi-role dialogue summarization matches ROUGE and BERTScore baselines while improving factual faithfulness and preference alignment on CSDS and SAMSum.

citing papers explorer

Showing 1 of 1 citing paper.

Beyond Overlap Metrics: Rewarding Reasoning and Preferences for Faithful Multi-Role Dialogue Summarization cs.CL · 2026-04-19 · unverdicted · none · ref 44
A reasoning-distillation plus dual-reward GRPO method for multi-role dialogue summarization matches ROUGE and BERTScore baselines while improving factual faithfulness and preference alignment on CSDS and SAMSum.

Optimising Factual Consistency in Summarisation via Preference Learning from Multiple Imperfect Metrics

fields

years

verdicts

representative citing papers

citing papers explorer