The entropy enigma: Success and failure of entropy minimization

· 2024 · arXiv 2405.05012

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

representative citing papers

Entropy Minimization without Model Collapse: Mitigating Prediction Bias in Medical Imaging

cs.LG · 2026-06-01 · unverdicted · novelty 6.0

Entropy minimization amplifies prediction bias from merged feature clusters under distribution shifts, and DSBR mitigates collapse by equalizing predicted class contributions to the unsupervised loss.

The Unreasonable Effectiveness of Entropy Minimization in LLM Reasoning

cs.LG · 2025-05-21 · unverdicted · novelty 6.0

Entropy minimization on self-generated outputs elicits strong reasoning in pretrained LLMs, matching or exceeding supervised RL methods on benchmarks.

Trust Region On-Policy Distillation

cs.LG · 2026-05-31 · unverdicted · novelty 5.0

TrOPD stabilizes on-policy distillation for LLMs with trust-region learning, outlier estimation, and off-policy guidance, outperforming prior OPD methods on reasoning and code benchmarks.

MER-DG: Modality-Entropy Regularization for Multimodal Domain Generalization

cs.LG · 2026-05-03 · unverdicted · novelty 5.0

MER-DG applies modality-entropy regularization to reduce fusion overfitting in multimodal domain generalization, reporting average gains of 5% over standard fusion and 2% over prior methods on EPIC-Kitchens and HAC benchmarks.

citing papers explorer

Showing 3 of 3 citing papers after filters.

Entropy Minimization without Model Collapse: Mitigating Prediction Bias in Medical Imaging cs.LG · 2026-06-01 · unverdicted · none · ref 60
Entropy minimization amplifies prediction bias from merged feature clusters under distribution shifts, and DSBR mitigates collapse by equalizing predicted class contributions to the unsupervised loss.
Trust Region On-Policy Distillation cs.LG · 2026-05-31 · unverdicted · none · ref 98
TrOPD stabilizes on-policy distillation for LLMs with trust-region learning, outlier estimation, and off-policy guidance, outperforming prior OPD methods on reasoning and code benchmarks.
MER-DG: Modality-Entropy Regularization for Multimodal Domain Generalization cs.LG · 2026-05-03 · unverdicted · none · ref 6
MER-DG applies modality-entropy regularization to reduce fusion overfitting in multimodal domain generalization, reporting average gains of 5% over standard fusion and 2% over prior methods on EPIC-Kitchens and HAC benchmarks.

The entropy enigma: Success and failure of entropy minimization

fields

years

verdicts

representative citing papers

citing papers explorer