arXiv preprint arXiv:2404.09043 (2024)

Jia Gu, Liang Pang, Huawei Shen, Xueqi Cheng · 2024 · arXiv 2404.09043

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Flipping Against All Odds: Reducing LLM Coin Flip Bias via Verbalized Rejection Sampling

cs.LG · 2025-06-11 · unverdicted · novelty 7.0

Verbalized Rejection Sampling reduces bias in LLM Bernoulli sampling by prompting the model to reason about and accept or reject proposed samples.

DynamicPO: Dynamic Preference Optimization for Recommendation

cs.IR · 2026-05-01 · unverdicted · novelty 6.0

DynamicPO prevents preference optimization collapse in multi-negative DPO by adaptively selecting boundary-critical negatives and calibrating per-sample optimization strength, yielding higher recommendation accuracy on three public datasets.

citing papers explorer

Showing 2 of 2 citing papers.

Flipping Against All Odds: Reducing LLM Coin Flip Bias via Verbalized Rejection Sampling cs.LG · 2025-06-11 · unverdicted · none · ref 6
Verbalized Rejection Sampling reduces bias in LLM Bernoulli sampling by prompting the model to reason about and accept or reject proposed samples.
DynamicPO: Dynamic Preference Optimization for Recommendation cs.IR · 2026-05-01 · unverdicted · none · ref 10
DynamicPO prevents preference optimization collapse in multi-negative DPO by adaptively selecting boundary-critical negatives and calibrating per-sample optimization strength, yielding higher recommendation accuracy on three public datasets.

arXiv preprint arXiv:2404.09043 (2024)

fields

years

verdicts

representative citing papers

citing papers explorer