Noisy neighbors: Efficient membership inference attacks against llms

Filippo Galli, Luca Melis, Tommaso Cucinotta · 2024 · arXiv 2406.16565

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Hey, That's My Data! Token-Only Dataset Inference in Large Language Models

cs.CL · 2025-06-06 · unverdicted · novelty 6.0

CatShift detects training data membership in LLMs by comparing output shifts induced by fine-tuning on member versus non-member data, relying on catastrophic forgetting without requiring logit access.

Data Compressibility Quantifies LLM Memorization

cs.CL · 2025-07-08 · unverdicted · novelty 5.0

Set-level data entropy estimators show linear correlation with LLM memorization scores, forming the Entropy-Memorization Linearity.

citing papers explorer

Showing 2 of 2 citing papers.

Hey, That's My Data! Token-Only Dataset Inference in Large Language Models cs.CL · 2025-06-06 · unverdicted · none · ref 13
CatShift detects training data membership in LLMs by comparing output shifts induced by fine-tuning on member versus non-member data, relying on catastrophic forgetting without requiring logit access.
Data Compressibility Quantifies LLM Memorization cs.CL · 2025-07-08 · unverdicted · none · ref 56
Set-level data entropy estimators show linear correlation with LLM memorization scores, forming the Entropy-Memorization Linearity.

Noisy neighbors: Efficient membership inference attacks against llms

fields

years

verdicts

representative citing papers

citing papers explorer