Investigating gender bias in language models using causal mediation analysis

· 2020

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

A Multi-Level Causal Intervention Framework for Mechanistic Interpretability in Variational Autoencoders

cs.LG · 2025-05-06 · unverdicted · novelty 8.0

Introduces a causal intervention framework with new metrics for mechanistic interpretability of VAEs and reports empirical findings from extensive experiments on multiple models and datasets.

citing papers explorer

Showing 1 of 1 citing paper.

A Multi-Level Causal Intervention Framework for Mechanistic Interpretability in Variational Autoencoders cs.LG · 2025-05-06 · unverdicted · none · ref 17
Introduces a causal intervention framework with new metrics for mechanistic interpretability of VAEs and reports empirical findings from extensive experiments on multiple models and datasets.

Investigating gender bias in language models using causal mediation analysis

fields

years

verdicts

representative citing papers

citing papers explorer