Measuring Gender and Racial Biases in Large Language Models: Intersectional Evidence from Automated Resume Evaluation.PNAS Nexus, 4(3), 2025

An, J · 2025 · DOI 10.1093/pnasnexus/pgaf089

6 Pith papers cite this work. Polarity classification is still indexing.

6 Pith papers citing it

open at publisher browse 6 citing papers

citation-role summary

background 1

citation-polarity summary

support 1

representative citing papers

AgentFairBench: Do LLM Agents Discriminate When They Act?

cs.AI · 2026-06-15 · unverdicted · novelty 6.0

AgentFairBench is a multi-domain benchmark for demographic disparity in LLM agent actions, with a pilot showing no significant effect for Claude Haiku 4.5 after arity-matched noise correction.

Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit

cs.AI · 2026-05-28 · unverdicted · novelty 6.0

Persona prefixes reduce brand recommendation Jaccard similarity by 0.12-0.20, with mid-market brands swapping up to 75% of recommendations while category leaders remain ~80% consistent across OpenAI and Anthropic models.

Auditing demographic bias in AI-based emergency police dispatch: a cross-lingual evaluation of eleven large language models

cs.CL · 2026-05-02 · unverdicted · novelty 6.0

Demographic bias in LLM dispatch decisions appears mainly in ambiguous-severity incidents, varies by language and demographic axis with religious appearance showing the largest effects, and does not transfer consistently across English and Mandarin.

All Public Voices Are Equal, But Are Some More Equal Than Others to LLMs?

cs.CY · 2026-04-19 · unverdicted · novelty 6.0

LLMs produce lower-fidelity summaries of identical public comments when attributed to lower-status occupations like street vendors versus financial analysts, with inconsistent race effects and no gender effects.

Justice in Judgment: Unveiling (Hidden) Bias in LLM-assisted Peer Reviews

cs.CY · 2025-09-16 · unverdicted · novelty 5.0

Controlled prompt interventions reveal strong affiliation bias in LLM peer reviews favoring top-ranked institutions, plus effects from seniority and publication history.

Weird Generalization is Weirdly Brittle

cs.CL · 2026-04-11 · unverdicted · novelty 4.0

Weird generalization in fine-tuned models is brittle, appearing only in specific cases and disappearing under prompt-based interventions that make the undesired behavior expected.

citing papers explorer

Showing 2 of 2 citing papers after filters.

AgentFairBench: Do LLM Agents Discriminate When They Act? cs.AI · 2026-06-15 · unverdicted · none · ref 15
AgentFairBench is a multi-domain benchmark for demographic disparity in LLM agent actions, with a pilot showing no significant effect for Claude Haiku 4.5 after arity-matched noise correction.
Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit cs.AI · 2026-05-28 · unverdicted · none · ref 22
Persona prefixes reduce brand recommendation Jaccard similarity by 0.12-0.20, with mid-market brands swapping up to 75% of recommendations while category leaders remain ~80% consistent across OpenAI and Anthropic models.

Measuring Gender and Racial Biases in Large Language Models: Intersectional Evidence from Automated Resume Evaluation.PNAS Nexus, 4(3), 2025

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer