Janus: A unified distributed training framework for sparse mixture-of-experts models

Juncai Liu, Jessie Hui Wang, Yimin Jiang · 2023

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

GRACE-MoE: Grouping and Replication with Locality-Aware Routing for Efficient Distributed MoE Inference

cs.DC · 2025-09-29 · unverdicted · novelty 6.0

GRACE-MoE integrates expert grouping, dynamic replication, and locality-aware routing with hierarchical sparse communication to reduce end-to-end latency in distributed SMoE inference.

citing papers explorer

Showing 1 of 1 citing paper.

GRACE-MoE: Grouping and Replication with Locality-Aware Routing for Efficient Distributed MoE Inference cs.DC · 2025-09-29 · unverdicted · none · ref 9
GRACE-MoE integrates expert grouping, dynamic replication, and locality-aware routing with hierarchical sparse communication to reduce end-to-end latency in distributed SMoE inference.

Janus: A unified distributed training framework for sparse mixture-of-experts models

fields

years

verdicts

representative citing papers

citing papers explorer