arXiv:2510.11498 [cs]

47 Tzu-Mao Li, Michal Lukáč, Michaël Gharbi, Jonathan Ragan-Kelley · 2025 · arXiv 2510.11498

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

read on arXiv browse 4 citing papers

citation-role summary

background 2

citation-polarity summary

background 2

representative citing papers

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

cs.AI · 2026-05-11 · unverdicted · novelty 7.0

PaperFit uses rendered page images in a closed loop to diagnose and repair typesetting defects in LaTeX documents, outperforming baselines on a new benchmark of 200 papers.

Self-Distillation Policy Optimization via Visual Feedback: Bridging Code and Visual Artifacts

cs.AI · 2026-06-09 · unverdicted · novelty 6.0

Visual-SDPO distills visual feedback from rendered code outputs into a student policy via grounded credit weighting and GRPO, yielding over 10-point gains on chart/UI/slide benchmarks.

Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges

cs.LG · 2026-04-15 · unverdicted · novelty 5.0

The paper introduces the Proxy Compression Hypothesis as a unifying framework explaining reward hacking in RLHF as an emergent result of compressing high-dimensional human objectives into proxy reward signals under optimization pressure.

Beyond NL2Code: A Structured Survey of Multimodal Code Intelligence

cs.CL · 2026-06-14 · unverdicted · novelty 3.0

A structured survey of multimodal code intelligence that formulates the field by code roles and organizes work into four domains while proposing verification-centered research directions.

citing papers explorer

Showing 2 of 2 citing papers after filters.

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents cs.AI · 2026-05-11 · unverdicted · none · ref 118
PaperFit uses rendered page images in a closed loop to diagnose and repair typesetting defects in LaTeX documents, outperforming baselines on a new benchmark of 200 papers.
Self-Distillation Policy Optimization via Visual Feedback: Bridging Code and Visual Artifacts cs.AI · 2026-06-09 · unverdicted · none · ref 17
Visual-SDPO distills visual feedback from rendered code outputs into a student policy via grounded credit weighting and GRPO, yielding over 10-point gains on chart/UI/slide benchmarks.

arXiv:2510.11498 [cs]

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer