On the Surprising Efficacy of LLMs for Penetration-Testing, July 2025

Andreas Happe, Jürgen Cito · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

CritBench: A Framework for Evaluating Cybersecurity Capabilities of Large Language Models in IEC 61850 Digital Substation Environments

cs.CR · 2026-04-07 · unverdicted · novelty 6.0

CritBench evaluates five LLMs on 81 tasks in IEC 61850 environments, showing reliable performance on static analysis and single-tool reconnaissance but degradation on dynamic live-system tasks that require sequential reasoning, with domain-specific tools improving results.

citing papers explorer

Showing 1 of 1 citing paper.

CritBench: A Framework for Evaluating Cybersecurity Capabilities of Large Language Models in IEC 61850 Digital Substation Environments cs.CR · 2026-04-07 · unverdicted · none · ref 4
CritBench evaluates five LLMs on 81 tasks in IEC 61850 environments, showing reliable performance on static analysis and single-tool reconnaissance but degradation on dynamic live-system tasks that require sequential reasoning, with domain-specific tools improving results.

On the Surprising Efficacy of LLMs for Penetration-Testing, July 2025

fields

years

verdicts

representative citing papers

citing papers explorer