Preprint, arXiv:2401.14493

K-qa: A real-world medical q&a benchmark · arXiv 2401.14493

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

representative citing papers

ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection

cs.AI · 2026-04-09 · unverdicted · novelty 6.0

ProMedical builds a 50k preference dataset with fine-grained rubrics and a multi-dimensional reward model that disentangles safety from proficiency, yielding 22.3% accuracy and 21.7% safety gains on Qwen3-8B via GRPO while generalizing to UltraMedical.

citing papers explorer

Showing 1 of 1 citing paper.

ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection cs.AI · 2026-04-09 · unverdicted · none · ref 3
ProMedical builds a 50k preference dataset with fine-grained rubrics and a multi-dimensional reward model that disentangles safety from proficiency, yielding 22.3% accuracy and 21.7% safety gains on Qwen3-8B via GRPO while generalizing to UltraMedical.

Preprint, arXiv:2401.14493

fields

years

verdicts

representative citing papers

citing papers explorer