Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling

Zhe Chen et al · 2025

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Towards Selection of Large Multimodal Models as Engines for Burned-in Protected Health Information Detection in Medical Images

cs.CV · 2025-11-03 · unverdicted · novelty 4.0

Empirical benchmark of GPT-4o, Gemini 2.5 Flash, and Qwen 2.5 7B finds superior OCR performance over EasyOCR but inconsistent gains in overall PHI detection accuracy, with strongest improvements on complex imprint patterns.

citing papers explorer

Showing 1 of 1 citing paper.

Towards Selection of Large Multimodal Models as Engines for Burned-in Protected Health Information Detection in Medical Images cs.CV · 2025-11-03 · unverdicted · none · ref 20
Empirical benchmark of GPT-4o, Gemini 2.5 Flash, and Qwen 2.5 7B finds superior OCR performance over EasyOCR but inconsistent gains in overall PHI detection accuracy, with strongest improvements on complex imprint patterns.

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling

fields

years

verdicts

representative citing papers

citing papers explorer