SimPO: Simple preference optimization with a reference-free reward, in: Advances in Neural Information Processing Systems

Meng, Y · 2024 · DOI 10.52202/079017-3946

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

open at publisher browse 2 citing papers

representative citing papers

Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings

cs.CL · 2026-06-18 · unverdicted · novelty 5.0

Sequential DPO produces varied effects on prior preferences (partial degradation, stability, pair-level redistribution, or positive transfer) depending on objective relationships rather than uniform forgetting.

EPPC-OASIS: Ontology-Aware Adaptation and Structured Inference Refinement for Electronic Patient-Provider Communication Mining in Secure Messages

cs.AI · 2026-05-22 · unverdicted · novelty 5.0

EPPC-OASIS combines ontology-aware fine-tuning via Wasserstein alignment with structured inference refinement to extract EPPC codes from secure messages, reporting 77.13% Code+Sub-code F1 and 63.83% Triplet F1 with small gains over supervised fine-tuning baselines.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Beyond Uniform Forgetting: A Study of Sequential Direct Preference Optimization Across Preference Settings cs.CL · 2026-06-18 · unverdicted · none · ref 9
Sequential DPO produces varied effects on prior preferences (partial degradation, stability, pair-level redistribution, or positive transfer) depending on objective relationships rather than uniform forgetting.

SimPO: Simple preference optimization with a reference-free reward, in: Advances in Neural Information Processing Systems

fields

years

verdicts

representative citing papers

citing papers explorer