Automating autograding: Large language models as test suite generators for introductory pro- gramming

· 2025

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

browse 2 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

LLMs as Teaching Assistants for Mathematics Exam Grading: Reliability, and Practical Usability

cs.CY · 2026-06-01 · unverdicted · novelty 5.0

Liberal partial-credit prompting reduces question-level grading error for all six tested LLMs, with ChatGPT 5.5 Thinking (LIBERAL) achieving the lowest MAE of 1.87.

A Blueprint for AI-Driven Software Quality: Integrating LLMs with Established Standards

cs.SE · 2025-05-19 · unverdicted · novelty 3.0

Survey mapping LLM applications in software quality assurance to established standards including ISO/IEC 12207, ISO 25010, CMMI, and TMM, with case studies, challenges, and future directions.

citing papers explorer

Showing 0 of 0 citing papers after filters.

No citing papers match the current filters.

Automating autograding: Large language models as test suite generators for introductory pro- gramming

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer