Less data, more security: Advancing cybersecurity LLMs specialization via resource-efficient domain- adaptive continuous pre-training with minimal to- kens, 2025

Salahuddin Salahuddin, Ahmed Hussain, Jussi L¨ opp¨ onen, Toni Jutila, Panos Papadimitratos · 2025 · arXiv 2507.02964

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

cs.CR · 2026-05-27 · unverdicted · novelty 7.0

CAI Dataset is presented as the largest described corpus of LLM-driven hacker trajectories, with the claim that operator data concentration in frontier-model providers creates a major security risk best addressed by on-premise specialized LLMs.

citing papers explorer

Showing 1 of 1 citing paper.

Cybersecurity AI (CAI) Dataset cs.CR · 2026-05-27 · unverdicted · none · ref 31
CAI Dataset is presented as the largest described corpus of LLM-driven hacker trajectories, with the claim that operator data concentration in frontier-model providers creates a major security risk best addressed by on-premise specialized LLMs.

Less data, more security: Advancing cybersecurity LLMs specialization via resource-efficient domain- adaptive continuous pre-training with minimal to- kens, 2025

fields

years

verdicts

representative citing papers

citing papers explorer