Con-recall: Detecting pre-training data in LLM s via contrastive decoding

Cheng Wang, Yiwei Wang, Bryan Hooi, Yujun Cai, Nanyun Peng, Kai-Wei Chang · 2024 · arXiv 2409.03363

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Reading the Finetuning Prior: Verbatim Content Recovery via Contrastive Decoding Diffing

cs.LG · 2026-05-25 · unverdicted · novelty 7.0

Contrastive Decoding Diffing recovers exact implanted facts from finetuned LLMs via logit-space differences between finetuned and base models, outperforming white-box baselines with less access.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Reading the Finetuning Prior: Verbatim Content Recovery via Contrastive Decoding Diffing cs.LG · 2026-05-25 · unverdicted · none · ref 21
Contrastive Decoding Diffing recovers exact implanted facts from finetuned LLMs via logit-space differences between finetuned and base models, outperforming white-box baselines with less access.

Con-recall: Detecting pre-training data in LLM s via contrastive decoding

fields

years

verdicts

representative citing papers

citing papers explorer