Stealing part of a production language model

Nicholas Carlini, Daniel Paleka, et al · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Robust LLM Watermarking with Minimal Semantic Distortion for IP Protection

cs.CR · 2026-05-22 · unverdicted · novelty 6.0

SAFESEAL is a key-conditioned LLM watermarking framework using tournament sampling for synonym substitution and a contrastive detector that reports 98.2% detection, 0.983 BERTScore, and 0.963 entity similarity while claiming robustness to attacks.

citing papers explorer

Showing 1 of 1 citing paper.

Robust LLM Watermarking with Minimal Semantic Distortion for IP Protection cs.CR · 2026-05-22 · unverdicted · none · ref 8
SAFESEAL is a key-conditioned LLM watermarking framework using tournament sampling for synonym substitution and a contrastive detector that reports 98.2% detection, 0.983 BERTScore, and 0.963 entity similarity while claiming robustness to attacks.

Stealing part of a production language model

fields

years

verdicts

representative citing papers

citing papers explorer