M3T: Multi-Modal Medical Trans- former to Bridge Clinical Context with Visual Insights for Retinal Image Medical Description Generation

Nagur Shareef Shaik, Teja Krishna Cherukuri, Dong Hye Ye · 2024 · arXiv 2406.13129

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

DREAM: Dynamic Retinal Enhancement with Adaptive Multi-modal Fusion for Expert Precision Medical Report Generation

cs.CV · 2026-04-19 · unverdicted · novelty 5.0

DREAM introduces a two-stage adaptive multi-modal fusion framework that reaches BLEU-4 of 0.241 on DeepEyeNet for retinal image report generation and generalizes to ROCO.

citing papers explorer

Showing 1 of 1 citing paper.

DREAM: Dynamic Retinal Enhancement with Adaptive Multi-modal Fusion for Expert Precision Medical Report Generation cs.CV · 2026-04-19 · unverdicted · none · ref 12
DREAM introduces a two-stage adaptive multi-modal fusion framework that reaches BLEU-4 of 0.241 on DeepEyeNet for retinal image report generation and generalizes to ROCO.

M3T: Multi-Modal Medical Trans- former to Bridge Clinical Context with Visual Insights for Retinal Image Medical Description Generation

fields

years

verdicts

representative citing papers

citing papers explorer