Local-cloud inference offloading for llms in multi-modal, multi-task, multi- dialogue settings,

· 2025 · arXiv 2502.11007

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Online LLM Selection via Constrained Bandits with Time-Varying Demand

cs.LG · 2026-06-16 · unverdicted · novelty 5.0

Develops a constrained bandit algorithm for online LLM selection under packing and covering constraints with time-varying demand, claiming sublinear regret and constraint violations versus an offline full-information benchmark.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Online LLM Selection via Constrained Bandits with Time-Varying Demand cs.LG · 2026-06-16 · unverdicted · none · ref 16
Develops a constrained bandit algorithm for online LLM selection under packing and covering constraints with time-varying demand, claiming sublinear regret and constraint violations versus an offline full-information benchmark.

Local-cloud inference offloading for llms in multi-modal, multi-task, multi- dialogue settings,

fields

years

verdicts

representative citing papers

citing papers explorer