G-eval: Nlg evaluation using gpt-4 with better human alignment

Yang Liu, Dan Iter, Yichong Xu, Shuohang Wang, Ruochen Xu, Chenguang Zhu · 2023

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Multi-Task Reinforcement Learning for Enhanced Multimodal LLM-as-a-Judge

cs.CL · 2026-03-12 · unverdicted · novelty 4.0

MT-RL-Judge uses multi-task RL to train MLLM judges that outperform baselines in consistency, human preference correlation, and out-of-distribution generalization.

citing papers explorer

Showing 1 of 1 citing paper.

Multi-Task Reinforcement Learning for Enhanced Multimodal LLM-as-a-Judge cs.CL · 2026-03-12 · unverdicted · none · ref 5
MT-RL-Judge uses multi-task RL to train MLLM judges that outperform baselines in consistency, human preference correlation, and out-of-distribution generalization.

G-eval: Nlg evaluation using gpt-4 with better human alignment

fields

years

verdicts

representative citing papers

citing papers explorer