arXiv preprint arXiv:2402.08976 , year =

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

cs.LG · 2026-05-28 · unverdicted · novelty 6.0

UNIQ uses split conformal prediction on a multi-expectile ensemble to produce state-adaptive expectiles on top of IQL, yielding consistent gains on D4RL MuJoCo tasks at near-IQL memory cost.

citing papers explorer

Showing 1 of 1 citing paper.

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning cs.LG · 2026-05-28 · unverdicted · none · ref 33
UNIQ uses split conformal prediction on a multi-expectile ensemble to produce state-adaptive expectiles on top of IQL, yielding consistent gains on D4RL MuJoCo tasks at near-IQL memory cost.

arXiv preprint arXiv:2402.08976 , year =

fields

years

verdicts

representative citing papers

citing papers explorer