InFindings of the Association for Computational Linguistics: EMNLP 2024, pages 15503–15514

Large language models know what to say but not when to speak · 2024 · arXiv 2403.06323

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Frictive Policy Optimization for LLMs: Epistemic Intervention, Risk-Sensitive Control, and Reflective Alignment

cs.CL · 2026-04-28 · unverdicted · novelty 7.0

The paper introduces Frictive Policy Optimization as a risk-sensitive epistemic control framework for LLM alignment that treats interventions like clarification, verification, and refusal as explicit actions to improve downstream belief quality rather than immediate rewards.

Sample Complexity for Markov Decision Processes and Stochastic Optimal Control with Static Risk Measures

math.OC · 2026-04-06 · unverdicted · novelty 4.0

State augmentation allows dynamic programming and sample complexity bounds for MDPs and optimal control under static risk measures including CVaR.

citing papers explorer

Showing 2 of 2 citing papers.

Frictive Policy Optimization for LLMs: Epistemic Intervention, Risk-Sensitive Control, and Reflective Alignment cs.CL · 2026-04-28 · unverdicted · none · ref 4
The paper introduces Frictive Policy Optimization as a risk-sensitive epistemic control framework for LLM alignment that treats interventions like clarification, verification, and refusal as explicit actions to improve downstream belief quality rather than immediate rewards.
Sample Complexity for Markov Decision Processes and Stochastic Optimal Control with Static Risk Measures math.OC · 2026-04-06 · unverdicted · none · ref 31
State augmentation allows dynamic programming and sample complexity bounds for MDPs and optimal control under static risk measures including CVaR.

InFindings of the Association for Computational Linguistics: EMNLP 2024, pages 15503–15514

fields

years

verdicts

representative citing papers

citing papers explorer