Debiasing vision-language models via biased prompts

Debiasing vision-language models via biased prompts , author= · 2023 · arXiv 2302.00070

7 Pith papers cite this work. Polarity classification is still indexing.

7 Pith papers citing it

representative citing papers

Intermediate Text Representation Guided Text-to-Image Generation for Enhancing One-and-Only Alignment

cs.CV · 2026-06-29 · unverdicted · novelty 6.0

IR-guided diffusion injects intermediate text representations into early denoising steps to improve alignment for one-and-only objects, reporting up to 19.1pp VQAScore gains on OAO-AttackBench and other benchmarks.

Density-Aware Translation of Spurious Correlations in Zero-Shot VLMs

cs.CV · 2026-06-01 · unverdicted · novelty 6.0

DAT rescales CLIP image-text similarities based on local embedding density to reduce the impact of spurious correlations in zero-shot classification.

Stay Fair! Ensuring Group Fairness in Diffusion Models Across Guidance Scales

cs.CV · 2026-05-27 · unverdicted · novelty 6.0

StayFair addresses guidance bias in diffusion models by extending demographic parity, allowing fairness to hold across guidance scales via modified classifier or null-embedding steps.

Embedding Arithmetic: A Lightweight, Tuning-Free Framework for Post-hoc Bias Mitigation in Text-to-Image Models

cs.CV · 2026-04-20 · unverdicted · novelty 6.0

Embedding Arithmetic performs vector operations in the embedding space of T2I models to mitigate bias at inference time, outperforming baselines on diversity while preserving coherence via a new Concept Coherence Score.

Aligning Modalities in Vision Large Language Models via Preference Fine-tuning

cs.LG · 2024-02-18 · unverdicted · novelty 5.0

POVID generates AI-created preference data to fine-tune vision-language models with DPO, reducing hallucinations and improving benchmark scores.

FAIR_XAI: Improving Multimodal Foundation Model Fairness via Explainability for Wellbeing Assessment

cs.AI · 2026-04-26 · unverdicted · novelty 4.0

Vision-language models for wellbeing assessment exhibit dataset-dependent performance and demographic biases, with explainability interventions providing inconsistent fairness gains at potential accuracy costs.

Operationalizing Fairness in Text-to-Image Models: A Survey of Bias, Fairness Audits and Mitigation Strategies

cs.CV · 2026-04-15 · unverdicted · novelty 4.0

A systematic review of T2I bias literature that distinguishes target and threshold fairness and proposes a target-based operationalization framework.

citing papers explorer

Showing 7 of 7 citing papers.

Intermediate Text Representation Guided Text-to-Image Generation for Enhancing One-and-Only Alignment cs.CV · 2026-06-29 · unverdicted · none · ref 7
IR-guided diffusion injects intermediate text representations into early denoising steps to improve alignment for one-and-only objects, reporting up to 19.1pp VQAScore gains on OAO-AttackBench and other benchmarks.
Density-Aware Translation of Spurious Correlations in Zero-Shot VLMs cs.CV · 2026-06-01 · unverdicted · none · ref 11
DAT rescales CLIP image-text similarities based on local embedding density to reduce the impact of spurious correlations in zero-shot classification.
Stay Fair! Ensuring Group Fairness in Diffusion Models Across Guidance Scales cs.CV · 2026-05-27 · unverdicted · none · ref 24
StayFair addresses guidance bias in diffusion models by extending demographic parity, allowing fairness to hold across guidance scales via modified classifier or null-embedding steps.
Embedding Arithmetic: A Lightweight, Tuning-Free Framework for Post-hoc Bias Mitigation in Text-to-Image Models cs.CV · 2026-04-20 · unverdicted · none · ref 7
Embedding Arithmetic performs vector operations in the embedding space of T2I models to mitigate bias at inference time, outperforming baselines on diversity while preserving coherence via a new Concept Coherence Score.
Aligning Modalities in Vision Large Language Models via Preference Fine-tuning cs.LG · 2024-02-18 · unverdicted · none · ref 147
POVID generates AI-created preference data to fine-tune vision-language models with DPO, reducing hallucinations and improving benchmark scores.
FAIR_XAI: Improving Multimodal Foundation Model Fairness via Explainability for Wellbeing Assessment cs.AI · 2026-04-26 · unverdicted · none · ref 22
Vision-language models for wellbeing assessment exhibit dataset-dependent performance and demographic biases, with explainability interventions providing inconsistent fairness gains at potential accuracy costs.
Operationalizing Fairness in Text-to-Image Models: A Survey of Bias, Fairness Audits and Mitigation Strategies cs.CV · 2026-04-15 · unverdicted · none · ref 6
A systematic review of T2I bias literature that distinguishes target and threshold fairness and proposes a target-based operationalization framework.

Debiasing vision-language models via biased prompts

fields

years

verdicts

representative citing papers

citing papers explorer