Dynamic Rewarding with Prompt Optimization Enables Tuning-free Self-Alignment of Language Models

Singla, Somanshu, Wang, Zhen, Liu, Tianyang, Ashfaq, Abdullah, Hu, Zhiting, Xing, Eric P · 2024 · DOI 10.18653/v1/2024.emnlp-main.1220

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it