Proceedings of the 18th ACM/IFIP/USENIX Middleware Conference , series =

Rasley, Jeff, He, Yuxiong, Yan, Feng, Ruwase, Olatunji, Fonseca, Rodrigo , title = · 2017 · arXiv 5974.313599

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Quantization Inflates Reasoning: Token Inflation as a Hidden Cost of Low-Bit Reasoning Models

cs.AI · 2026-06-24 · unverdicted · novelty 6.0

Low-bit post-training quantization of reasoning LLMs increases reasoning token counts while preserving accuracy, introducing a hidden test-time compute cost.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Quantization Inflates Reasoning: Token Inflation as a Hidden Cost of Low-Bit Reasoning Models cs.AI · 2026-06-24 · unverdicted · none · ref 39
Low-bit post-training quantization of reasoning LLMs increases reasoning token counts while preserving accuracy, introducing a hidden test-time compute cost.

Proceedings of the 18th ACM/IFIP/USENIX Middleware Conference , series =

fields

years

verdicts

representative citing papers

citing papers explorer