Needle in the repo: A benchmark for maintainability in ai-generated repository edits, 2026a.https://arxiv.org/abs/2603.27745

18 Haichao Zhu, Qian Zhang, Jiyuan Wang, Zhaorui Yang, Yuxin Qiu · arXiv 2603.27745

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Interactive Evaluation Requires a Design Science

cs.AI · 2026-05-18 · unverdicted · novelty 5.0

Interactive evaluation of AI must be reframed as a distinct paradigm that maps interaction trajectories to judgments on process, recoverability, coordination, robustness, and system performance, supported by a two-axis taxonomy and design principles.

citing papers explorer

Showing 1 of 1 citing paper.

Interactive Evaluation Requires a Design Science cs.AI · 2026-05-18 · unverdicted · none · ref 72
Interactive evaluation of AI must be reframed as a distinct paradigm that maps interaction trajectories to judgments on process, recoverability, coordination, robustness, and system performance, supported by a two-axis taxonomy and design principles.

Needle in the repo: A benchmark for maintainability in ai-generated repository edits, 2026a.https://arxiv.org/abs/2603.27745

fields

years

verdicts

representative citing papers

citing papers explorer