CySecBench: Generative AI-based cybersecurity-focused prompt dataset for benchmarking large language models

Johan Wahréus, Ahmed Mohamed Hussain, Panos Papadimitratos · 2025 · arXiv 2501.01335

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

A Validated Prompt Bank for Malicious Code Generation: Separating Executable Weapons from Security Knowledge in 1,554 Consensus-Labeled Prompts

cs.CR · 2026-05-04 · accept · novelty 5.0

The paper releases a 1,554-prompt consensus-labeled bank separating executable malicious code requests from security knowledge requests, validated by five-model majority labeling with Fleiss' kappa of 0.876.

citing papers explorer

Showing 1 of 1 citing paper after filters.

A Validated Prompt Bank for Malicious Code Generation: Separating Executable Weapons from Security Knowledge in 1,554 Consensus-Labeled Prompts cs.CR · 2026-05-04 · accept · none · ref 12
The paper releases a 1,554-prompt consensus-labeled bank separating executable malicious code requests from security knowledge requests, validated by five-model majority labeling with Fleiss' kappa of 0.876.

CySecBench: Generative AI-based cybersecurity-focused prompt dataset for benchmarking large language models

fields

years

verdicts

representative citing papers

citing papers explorer