InInternational Conference on Learning Representations

On large-batch training for deep learning: Generalization gap, sharp minima · 2024 · arXiv 2403.19270

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

citation-role summary

dataset 1

citation-polarity summary

background 1

representative citing papers

Establishing a Scale for Kullback-Leibler Divergence in Language Models Across Various Settings

cs.CL · 2025-05-21 · unverdicted · novelty 5.0

Log-likelihood vectors establish a consistent KL divergence scale across pretraining, model sizes, seeds, quantization, fine-tuning, and layers, revealing subdiffusive trajectories and early stabilization in Pythia models.

A Survey on Large Language Models for Code Generation

cs.CL · 2024-06-01 · unverdicted · novelty 3.0

A systematic literature review that organizes recent work on LLMs for code generation into a taxonomy covering data curation, model advances, evaluations, ethics, environmental impact, and applications, with benchmark comparisons.

citing papers explorer

Showing 2 of 2 citing papers.

Establishing a Scale for Kullback-Leibler Divergence in Language Models Across Various Settings cs.CL · 2025-05-21 · unverdicted · none · ref 8
Log-likelihood vectors establish a consistent KL divergence scale across pretraining, model sizes, seeds, quantization, fine-tuning, and layers, revealing subdiffusive trajectories and early stabilization in Pythia models.
A Survey on Large Language Models for Code Generation cs.CL · 2024-06-01 · unverdicted · none · ref 132
A systematic literature review that organizes recent work on LLMs for code generation into a taxonomy covering data curation, model advances, evaluations, ethics, environmental impact, and applications, with benchmark comparisons.

InInternational Conference on Learning Representations

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer