RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

Cecilia Mascolo; Domenico Talia; Gaia A. Bertolino; Tong Xia; Yuwei Zhang

arxiv: 2602.18452 · v3 · pith:RZN5OVMLnew · submitted 2026-02-04 · 💻 cs.SD · cs.LG· eess.AS

RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

Gaia A. Bertolino , Yuwei Zhang , Tong Xia , Domenico Talia , Cecilia Mascolo This is my paper

classification 💻 cs.SD cs.LGeess.AS

keywords audioheterogeneityquestionra-qarespiratoryunderansweringbenchmark

0 comments

read the original abstract

As conversational multimodal AI tools are increasingly adopted to process patient data for health assessment, robust benchmarks are needed to measure progress and expose failure modes under realistic conditions. Despite the importance of respiratory audio for mobile health screening, respiratory audio question answering remains underexplored, with existing studies evaluated narrowly and lacking real-world heterogeneity across modalities, devices, and question types. We hence introduce the \textbf{Respiratory-Audio Question-Answering (RA-QA) benchmark}, including a standardized data generation pipeline, a comprehensive multimodal QA collection, and a unified evaluation protocol. RA-QA harmonizes public RA datasets into a collection of 9 million format-diverse QA pairs covering diagnostic and contextual attributes. We benchmark general audio-language models as well as domain-specific architectures, establishing reproducible reference points and showing how current approaches fail under heterogeneity.

This paper has not been read by Pith yet.

RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

discussion (0)