To- wards interactive evaluations for interaction harms in human-ai systems

Lujain Ibrahim, Saffron Huang, Lama Ahmad, Markus Anderljung · 2024 · arXiv 2405.10632

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

read on arXiv browse 4 citing papers

citation-role summary

background 1

citation-polarity summary

support 1

representative citing papers

Results-Actionability Gap: Understanding How Practitioners Evaluate LLM Products in the Wild

cs.SE · 2026-01-25 · conditional · novelty 7.0

Qualitative study of 19 practitioners reveals ten LLM product evaluation practices and introduces the results-actionability gap as a key barrier to turning findings into improvements.

Benchmarking Misuse Mitigation Against Covert Adversaries

cs.CR · 2025-06-06 · unverdicted · novelty 6.0

Develops the BSD data generation pipeline and two new datasets to evaluate decomposition attacks as effective misuse enablers and stateful defenses as a countermeasure in language model safety.

Inform, Coach, Relate, Listen: Auditing LLM Caregiving Support Roles

cs.HC · 2026-05-28 · unverdicted · novelty 5.0

LLM support roles in Alzheimer's caregiving queries systematically alter interactional risk prevalence and composition, with directive roles rated higher in quality despite elevated risks.

Measuring and mitigating overreliance to build human-compatible AI

cs.CY · 2025-09-08 · conditional · novelty 5.0

The paper consolidates risks of overreliance on LLMs, identifies gaps in current measurement approaches, and proposes mitigation strategies to keep AI as a human-compatible thought partner.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Measuring and mitigating overreliance to build human-compatible AI cs.CY · 2025-09-08 · conditional · none · ref 64
The paper consolidates risks of overreliance on LLMs, identifies gaps in current measurement approaches, and proposes mitigation strategies to keep AI as a human-compatible thought partner.

To- wards interactive evaluations for interaction harms in human-ai systems

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer