Latent guard: a safety framework for text-to-image generation.arXiv preprint arXiv:2404.08031

· 2024 · arXiv 2404.08031

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Harnessing Hyperbolic Geometry for Harmful Prompt Detection and Sanitization

cs.CR · 2026-04-07 · unverdicted · novelty 7.0

HyPE detects harmful prompts as outliers in hyperbolic space and HyPS sanitizes them using explainable attribution, outperforming prior defenses in accuracy and robustness across datasets and adversarial scenarios.

PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models

cs.CV · 2025-01-07 · unverdicted · novelty 7.0

PromptGuard optimizes a universal safety soft prompt (and category-specific variants) in T2I embedding space to moderate NSFW inputs, achieving average unsafe ratios of 5.84-6.18% while being 3.8x faster than prior defenses.

citing papers explorer

Showing 2 of 2 citing papers.

Harnessing Hyperbolic Geometry for Harmful Prompt Detection and Sanitization cs.CR · 2026-04-07 · unverdicted · none · ref 6
HyPE detects harmful prompts as outliers in hyperbolic space and HyPS sanitizes them using explainable attribution, outperforming prior defenses in accuracy and robustness across datasets and adversarial scenarios.
PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models cs.CV · 2025-01-07 · unverdicted · none · ref 22
PromptGuard optimizes a universal safety soft prompt (and category-specific variants) in T2I embedding space to moderate NSFW inputs, achieving average unsafe ratios of 5.84-6.18% while being 3.8x faster than prior defenses.

Latent guard: a safety framework for text-to-image generation.arXiv preprint arXiv:2404.08031

fields

years

verdicts

representative citing papers

citing papers explorer