The reliability of LLMs for medical diagnosis: An exam- ination of consistency, manipulation, and contextual awareness,

· 2025 · arXiv 2503.10647

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

Same Patient, Different Words, Different Diagnosis? Evaluating Semantic Stability in Clinical LLMs

cs.CL · 2026-05-28 · unverdicted · novelty 6.0

Domain specialization does not consistently improve clinical LLM robustness to meaning-preserving prompt variations, as shown by new sensitivity metrics on DiagnosisQA and MedQA.

citing papers explorer

Showing 1 of 1 citing paper.

Same Patient, Different Words, Different Diagnosis? Evaluating Semantic Stability in Clinical LLMs cs.CL · 2026-05-28 · unverdicted · none · ref 2
Domain specialization does not consistently improve clinical LLM robustness to meaning-preserving prompt variations, as shown by new sensitivity metrics on DiagnosisQA and MedQA.

The reliability of LLMs for medical diagnosis: An exam- ination of consistency, manipulation, and contextual awareness,

fields

years

verdicts

representative citing papers

citing papers explorer