ARVO: Atlas of Re- producible Vulnerabilities for Open Source Software, August 2024

Xiang Mei, Pulkit Singh Singaria, Jordi Del Castillo, Haoran Xi, Tiffany Bao, Ruoyu Wang, Yan Shoshitaishvili, Adam Doupé, Hammond Pearce, Brendan Dolan-Gavitt, et al · 2024 · arXiv 2408.02153

7 Pith papers cite this work. Polarity classification is still indexing.

7 Pith papers citing it

read on arXiv browse 7 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

ExploitBench: A Capability Ladder Benchmark for LLM Cybersecurity Agents

cs.CR · 2026-05-13 · conditional · novelty 8.0

ExploitBench decomposes LLM exploitation into 16 oracle-verified capability flags and finds public frontier models trigger crashes but rarely reach arbitrary code execution on 41 V8 bugs.

Veritas: A Semantically Grounded Agentic Framework for Memory Corruption Vulnerability Detection in Binaries

cs.SE · 2026-05-14 · unverdicted · novelty 6.0

Veritas detects memory corruption vulnerabilities in stripped binaries by combining static value-flow slicing, dual-view LLM reasoning, and multi-agent runtime validation, reporting 90% recall, zero false positives on 623 exhaustive cases, and discovery of a real Apple CVE.

Organizational Security Resource Estimation via Vulnerability Queueing

cs.CR · 2026-04-11 · unverdicted · novelty 6.0

A queueing framework segments vulnerability data with Gaussian mixture models, fits arrival/service/resource parameters by KL-divergence minimization, and reports 91-96% accuracy in estimating organizational cyber resources from timestamps.

Program Analysis Guided LLM Agent for Proof-of-Concept Generation

cs.SE · 2026-04-08 · unverdicted · novelty 6.0

PAGENT integrates static and dynamic program analysis guidance with an LLM agent to improve automated proof-of-concept generation success by 132% over prior agentic methods.

PoC-Adapt: Semantic-Aware Automated Vulnerability Reproduction with LLM Multi-Agents and Reinforcement Learning-Driven Adaptive Policy

cs.CR · 2026-04-08 · unverdicted · novelty 6.0

PoC-Adapt improves automated PoC exploit generation reliability by 25% and lowers cost using semantic state validation and RL adaptive policies, verifying 12 PoCs from 80 recent CVE attempts at $0.42 each.

Beyond Crash-to-Patch: Patch Evolution for Linux Kernel Repair

cs.SE · 2026-04-04 · unverdicted · novelty 6.0

Reconstructing 6946 syzbot bug-fix lifecycles reveals that accepted kernel patches are non-local and reviewer-constrained, enabling PatchAdvisor to improve automated repair quality over baselines via retrieval and diagnostic guidance.

A Queueing-Theoretic Framework for Dynamic Attack Surfaces: Data-Integrated Risk Analysis and Adaptive Defense

cs.CR · 2026-04-12 · unverdicted · novelty 5.0

A queueing model of attack surfaces validated on supply-chain data shows AI automation can raise exploit rates and an RL policy cuts active vulnerabilities by over 90% without extra budget.

citing papers explorer

Showing 7 of 7 citing papers.

ExploitBench: A Capability Ladder Benchmark for LLM Cybersecurity Agents cs.CR · 2026-05-13 · conditional · none · ref 5
ExploitBench decomposes LLM exploitation into 16 oracle-verified capability flags and finds public frontier models trigger crashes but rarely reach arbitrary code execution on 41 V8 bugs.
Veritas: A Semantically Grounded Agentic Framework for Memory Corruption Vulnerability Detection in Binaries cs.SE · 2026-05-14 · unverdicted · none · ref 31
Veritas detects memory corruption vulnerabilities in stripped binaries by combining static value-flow slicing, dual-view LLM reasoning, and multi-agent runtime validation, reporting 90% recall, zero false positives on 623 exhaustive cases, and discovery of a real Apple CVE.
Organizational Security Resource Estimation via Vulnerability Queueing cs.CR · 2026-04-11 · unverdicted · none · ref 19
A queueing framework segments vulnerability data with Gaussian mixture models, fits arrival/service/resource parameters by KL-divergence minimization, and reports 91-96% accuracy in estimating organizational cyber resources from timestamps.
Program Analysis Guided LLM Agent for Proof-of-Concept Generation cs.SE · 2026-04-08 · unverdicted · none · ref 28
PAGENT integrates static and dynamic program analysis guidance with an LLM agent to improve automated proof-of-concept generation success by 132% over prior agentic methods.
PoC-Adapt: Semantic-Aware Automated Vulnerability Reproduction with LLM Multi-Agents and Reinforcement Learning-Driven Adaptive Policy cs.CR · 2026-04-08 · unverdicted · none · ref 11
PoC-Adapt improves automated PoC exploit generation reliability by 25% and lowers cost using semantic state validation and RL adaptive policies, verifying 12 PoCs from 80 recent CVE attempts at $0.42 each.
Beyond Crash-to-Patch: Patch Evolution for Linux Kernel Repair cs.SE · 2026-04-04 · unverdicted · none · ref 22
Reconstructing 6946 syzbot bug-fix lifecycles reveals that accepted kernel patches are non-local and reviewer-constrained, enabling PatchAdvisor to improve automated repair quality over baselines via retrieval and diagnostic guidance.
A Queueing-Theoretic Framework for Dynamic Attack Surfaces: Data-Integrated Risk Analysis and Adaptive Defense cs.CR · 2026-04-12 · unverdicted · none · ref 1
A queueing model of attack surfaces validated on supply-chain data shows AI automation can raise exploit rates and an RL policy cuts active vulnerabilities by over 90% without extra budget.

ARVO: Atlas of Re- producible Vulnerabilities for Open Source Software, August 2024

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer