Data-faithful feature attribution: Mitigating unobservable confounders via instrumental variables.Advances in Neural Information Processing Systems, 37:44935–44964, 2024a

Sun, Q · 2025 · arXiv 2505.18513

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

NanoKnow: How to Know What Your Language Model Knows

cs.CL · 2026-02-23 · accept · novelty 7.0

NanoKnow partitions QA questions by pre-training data presence to separate the effects of memorized facts from external evidence in LLM outputs.

On the Fragility of Data Attribution When Learning Is Distributed

cs.LG · 2026-05-15 · unverdicted · novelty 6.0

A single adversary in distributed training inflates its attribution value via latent optimization on synthetic batches without degrading accuracy or triggering basic defenses.

citing papers explorer

Showing 2 of 2 citing papers.

NanoKnow: How to Know What Your Language Model Knows cs.CL · 2026-02-23 · accept · none · ref 23
NanoKnow partitions QA questions by pre-training data presence to separate the effects of memorized facts from external evidence in LLM outputs.
On the Fragility of Data Attribution When Learning Is Distributed cs.LG · 2026-05-15 · unverdicted · none · ref 24
A single adversary in distributed training inflates its attribution value via latent optimization on synthetic batches without degrading accuracy or triggering basic defenses.

Data-faithful feature attribution: Mitigating unobservable confounders via instrumental variables.Advances in Neural Information Processing Systems, 37:44935–44964, 2024a

fields

years

verdicts

representative citing papers

citing papers explorer