Training language models to follow instructions with human feedback,

Long Ouyang, Jeffrey Wu, Xu Jiang, Diogo Almeida, Carroll Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, et al · 2022

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Aligning Language Models for Lyric-to-Melody Generation with Rule-Based Musical Constraints

cs.SD · 2026-04-20 · unverdicted · novelty 6.0

Rule-generated preference data aligned via sequential DPO and KTO reduces musical constraint violations and improves coherence in lyric-to-melody generation over baselines.

citing papers explorer

Showing 1 of 1 citing paper.

Aligning Language Models for Lyric-to-Melody Generation with Rule-Based Musical Constraints cs.SD · 2026-04-20 · unverdicted · none · ref 29
Rule-generated preference data aligned via sequential DPO and KTO reduces musical constraint violations and improves coherence in lyric-to-melody generation over baselines.

Training language models to follow instructions with human feedback,

fields

years

verdicts

representative citing papers

citing papers explorer