Virtual memory management minimum granularity.https: //forums.developer.nvidia.com/t/virtual-memory-management- minimum-granularity/268699

· 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Amoeba: Runtime Tensor Parallel Transformation for LLM Inference Services

cs.DC · 2025-09-24 · unverdicted · novelty 6.0

Amoeba adaptively adjusts tensor parallelism at runtime for LLM inference services to handle mixed short and long context requests, delivering 1.75x-6.57x throughput gains over prior solutions in real-world trace evaluations.

citing papers explorer

Showing 1 of 1 citing paper.

Amoeba: Runtime Tensor Parallel Transformation for LLM Inference Services cs.DC · 2025-09-24 · unverdicted · none · ref 1
Amoeba adaptively adjusts tensor parallelism at runtime for LLM inference services to handle mixed short and long context requests, delivering 1.75x-6.57x throughput gains over prior solutions in real-world trace evaluations.

Virtual memory management minimum granularity.https: //forums.developer.nvidia.com/t/virtual-memory-management- minimum-granularity/268699

fields

years

verdicts

representative citing papers

citing papers explorer