CPA-RAG: Covert poisoning attacks on retrieval- augmented generation in large language models

· 2025 · arXiv 2505.19864

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases

cs.CR · 2026-05-01 · unverdicted · novelty 6.0

CleanBase identifies malicious documents in RAG databases by detecting cliques in a semantic similarity graph constructed using embedding models and a statistical threshold.

RAGShield: Detecting Numerical Claim Manipulation in Government RAG Systems

cs.CR · 2026-04-01 · conditional · novelty 6.0

RAGShield detects all numerical manipulations in government RAG systems via pattern-based value extraction and cross-source verification, achieving 0% attack success rate on 430 real IRS-derived attacks where embedding defenses miss 79-90%.

RefineRAG: Word-Level Poisoning Attacks via Retriever-Guided Text Refinement

cs.CR · 2026-04-08 · unverdicted · novelty 5.0

RefineRAG achieves 90% attack success on NQ by generating toxic seeds then optimizing them via retriever-in-the-loop word refinement, outperforming prior methods on effectiveness and naturalness.

citing papers explorer

Showing 3 of 3 citing papers.

CleanBase: Detecting Malicious Documents in RAG Knowledge Databases cs.CR · 2026-05-01 · unverdicted · none · ref 35
CleanBase identifies malicious documents in RAG databases by detecting cliques in a semantic similarity graph constructed using embedding models and a statistical threshold.
RAGShield: Detecting Numerical Claim Manipulation in Government RAG Systems cs.CR · 2026-04-01 · conditional · none · ref 8
RAGShield detects all numerical manipulations in government RAG systems via pattern-based value extraction and cross-source verification, achieving 0% attack success rate on 430 real IRS-derived attacks where embedding defenses miss 79-90%.
RefineRAG: Word-Level Poisoning Attacks via Retriever-Guided Text Refinement cs.CR · 2026-04-08 · unverdicted · none · ref 17
RefineRAG achieves 90% attack success on NQ by generating toxic seeds then optimizing them via retriever-in-the-loop word refinement, outperforming prior methods on effectiveness and naturalness.

CPA-RAG: Covert poisoning attacks on retrieval- augmented generation in large language models

fields

years

verdicts

representative citing papers

citing papers explorer