Chaudhari, and Jean-Benoit Delbrouck

Sophie Ostmeier, Justin Xu, Zhihong Chen, Maya Varma, Louis Blankemeier, Christian Bluethgen, Arne Edward Michalson, Michael Moseley, Curtis Langlotz, Akshay S · 2024 · DOI 10.18653/v1/2024.findings-emnlp.21

6 Pith papers cite this work. Polarity classification is still indexing.

6 Pith papers citing it

open at publisher browse 6 citing papers

representative citing papers

A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy

cs.CV · 2026-06-23 · unverdicted · novelty 7.0

White-box method ReXTrust achieves highest AUC (peak 93.0) on Gut-VLM across five VLMs, outperforming alternatives by statistically significant margins while black-box and some gray-box methods collapse on certain models.

SAGE: An Expert-Annotated South Asian GI Endoscopy Dataset for Multimodal Learning and Hallucination Analysis

cs.CV · 2026-06-20 · unverdicted · novelty 7.0

Introduces the SAGE South Asian GI endoscopy dataset and reports large performance drops in multi-class classifiers and large multimodal models due to geographic population shift.

RadSEM: A Finding-by-Finding Metric for Clinical Consistency in Radiology Reports

q-bio.QM · 2026-06-03 · unverdicted · novelty 7.0

RadSEM is a constrained LLM-assisted metric that rewrites radiology reports into atomic finding sentences, applies contradiction-constrained many-to-many matching, and computes an abnormal-focused weighted F1 score.

Revisiting LLM Adaptation for 3D CT Report Generation: A Study of Scaling and Diagnostic Priors

cs.CL · 2026-06-15 · unverdicted · novelty 6.0

RAD3D-Prefix is a diagnostic-prior conditioning framework for 3D CT report generation that integrates image embeddings with multi-label classification logits, showing that freezing larger LLMs and training only projection layers outperforms fine-tuning across scales.

Enhancing Reinforcement Learning for Radiology Report Generation with Evidence-aware Rewards and Self-correcting Preference Learning

cs.LG · 2026-04-15 · unverdicted · novelty 6.0

ESC-RL improves RL for radiology reports via group-wise evidence-aware rewards (GEAR) and LLM-driven self-correcting preference learning (SPL), reaching state-of-the-art on two chest X-ray datasets.

CXRMate-2: Structured Multimodal Temporal Embeddings and Tractable Reinforcement Learning for Clinically Acceptable Chest X-ray Radiology Report Generation

cs.CV · 2026-04-21 · unverdicted · novelty 5.0

CXRMate-2 improves chest X-ray report generation via temporal embeddings and tractable RL, delivering metric gains and 45% acceptability in radiologist review with no significant preference difference on most findings.

citing papers explorer

Showing 6 of 6 citing papers after filters.

A Benchmark for Hallucination Detection in VLMs for Gastrointestinal Endoscopy cs.CV · 2026-06-23 · unverdicted · none · ref 19
White-box method ReXTrust achieves highest AUC (peak 93.0) on Gut-VLM across five VLMs, outperforming alternatives by statistically significant margins while black-box and some gray-box methods collapse on certain models.
SAGE: An Expert-Annotated South Asian GI Endoscopy Dataset for Multimodal Learning and Hallucination Analysis cs.CV · 2026-06-20 · unverdicted · none · ref 24
Introduces the SAGE South Asian GI endoscopy dataset and reports large performance drops in multi-class classifiers and large multimodal models due to geographic population shift.
RadSEM: A Finding-by-Finding Metric for Clinical Consistency in Radiology Reports q-bio.QM · 2026-06-03 · unverdicted · none · ref 8
RadSEM is a constrained LLM-assisted metric that rewrites radiology reports into atomic finding sentences, applies contradiction-constrained many-to-many matching, and computes an abnormal-focused weighted F1 score.
Revisiting LLM Adaptation for 3D CT Report Generation: A Study of Scaling and Diagnostic Priors cs.CL · 2026-06-15 · unverdicted · none · ref 27
RAD3D-Prefix is a diagnostic-prior conditioning framework for 3D CT report generation that integrates image embeddings with multi-label classification logits, showing that freezing larger LLMs and training only projection layers outperforms fine-tuning across scales.
Enhancing Reinforcement Learning for Radiology Report Generation with Evidence-aware Rewards and Self-correcting Preference Learning cs.LG · 2026-04-15 · unverdicted · none · ref 18
ESC-RL improves RL for radiology reports via group-wise evidence-aware rewards (GEAR) and LLM-driven self-correcting preference learning (SPL), reaching state-of-the-art on two chest X-ray datasets.
CXRMate-2: Structured Multimodal Temporal Embeddings and Tractable Reinforcement Learning for Clinically Acceptable Chest X-ray Radiology Report Generation cs.CV · 2026-04-21 · unverdicted · none · ref 53
CXRMate-2 improves chest X-ray report generation via temporal embeddings and tractable RL, delivering metric gains and 45% acceptability in radiologist review with no significant preference difference on most findings.

Chaudhari, and Jean-Benoit Delbrouck

fields

years

verdicts

representative citing papers

citing papers explorer