Rrpo: Robust reward policy optimization for llm-based emotional tts,

· 2025 · arXiv 2512.04552

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

FlowTTS-GRPO: Online Reinforcement Learning with Multi-Objective Reward Optimization for Flow-Matching Based Text-to-Speech

eess.AS · 2026-06-22 · unverdicted · novelty 5.0

FlowTTS-GRPO applies online RL with weighted multi-objective rewards to flow-matching TTS models via ODE-to-SDE conversion, reporting gains in speaker similarity and perceptual quality on CosyVoice 3.0 and F5-TTS.

citing papers explorer

Showing 1 of 1 citing paper after filters.

FlowTTS-GRPO: Online Reinforcement Learning with Multi-Objective Reward Optimization for Flow-Matching Based Text-to-Speech eess.AS · 2026-06-22 · unverdicted · none · ref 30
FlowTTS-GRPO applies online RL with weighted multi-objective rewards to flow-matching TTS models via ODE-to-SDE conversion, reporting gains in speaker similarity and perceptual quality on CosyVoice 3.0 and F5-TTS.

Rrpo: Robust reward policy optimization for llm-based emotional tts,

fields

years

verdicts

representative citing papers

citing papers explorer