Preference-based rein- forcement learning: A formal framework and a policy iteration algorithm.Machine Learning, 89(1– 2):123–156

Johannes F¨ urnkranz, Eyke H¨ ullermeier, Weiwei Cheng, Sang-Hyeun Park · 2012

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Function-free Optimization via Comparison Oracles

math.OC · 2026-04-29 · unverdicted · novelty 7.0

Introduces a geometry-based framework for comparison-oracle optimization, with O(d log(d/ε)) comparisons for normal direction estimation and Õ(d D²/ε²) comparisons to reach ε level-set optimality gap under regularity, convexity, and growth conditions.

citing papers explorer

Showing 1 of 1 citing paper.

Function-free Optimization via Comparison Oracles math.OC · 2026-04-29 · unverdicted · none · ref 7
Introduces a geometry-based framework for comparison-oracle optimization, with O(d log(d/ε)) comparisons for normal direction estimation and Õ(d D²/ε²) comparisons to reach ε level-set optimality gap under regularity, convexity, and growth conditions.

Preference-based rein- forcement learning: A formal framework and a policy iteration algorithm.Machine Learning, 89(1– 2):123–156

fields

years

verdicts

representative citing papers

citing papers explorer