Longllmlingua: Accelerating and enhancing llms in long context sce- narios via prompt compression,

· 2024

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

representative citing papers

Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA

cs.CL · 2026-05-18 · unverdicted · novelty 7.0

Evaluating LLMLingua-2 at 2x compression on LLaDA shows non-uniform transfer to diffusion LLMs, with mathematical reasoning degrading substantially despite high BERTScore while summarization remains more robust.

The Efficiency Frontier: A Unified Framework for Cost-Performance Optimization in LLM Context Management

cs.CL · 2026-05-21 · unverdicted · novelty 4.0

Introduces Efficiency Frontier framework for deployment-aware cost-performance optimization of LLM context strategies, reporting ~25% token reduction at F1≈0.78 on 5,000 HotpotQA instances.

citing papers explorer

Showing 2 of 2 citing papers.

Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA cs.CL · 2026-05-18 · unverdicted · none · ref 2
Evaluating LLMLingua-2 at 2x compression on LLaDA shows non-uniform transfer to diffusion LLMs, with mathematical reasoning degrading substantially despite high BERTScore while summarization remains more robust.
The Efficiency Frontier: A Unified Framework for Cost-Performance Optimization in LLM Context Management cs.CL · 2026-05-21 · unverdicted · none · ref 7
Introduces Efficiency Frontier framework for deployment-aware cost-performance optimization of LLM context strategies, reporting ~25% token reduction at F1≈0.78 on 5,000 HotpotQA instances.

Longllmlingua: Accelerating and enhancing llms in long context sce- narios via prompt compression,

fields

years

verdicts

representative citing papers

citing papers explorer