Singmos: An extensive open- source singing voice dataset for mos prediction

· 2024 · arXiv 2406.10911

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

representative citing papers

CoMelSinger: Discrete Token-Based Zero-Shot Singing Synthesis With Structured Melody Control and Guidance

cs.SD · 2025-09-24 · unverdicted · novelty 6.0

CoMelSinger introduces a discrete token-based zero-shot SVS framework on MaskGCT with coarse-to-fine contrastive learning and an SVT module to improve melody control and reduce prosody leakage.

MOS-Bench: Benchmarking Generalization Abilities of Subjective Speech Quality Assessment Models

cs.SD · 2024-11-06 · unverdicted · novelty 6.0

MOS-Bench benchmark shows that existing SSQA models struggle with out-of-domain generalization and that training on multiple diverse datasets improves robustness.

Listening Like a Judge: A Music-Aware Framework for Automatic Singing Performance Evaluation

cs.SD · 2026-06-24 · unverdicted · novelty 5.0

MusicJudge is a modality-guided framework that performs block-aligned multimodal analysis for singing quality assessment by coupling lyrics with pitch-rhythm fidelity via multi-signal matching and Modality-Guided LoRA fine-tuning.

Investigating Human-Model Discrepancies in Speech Quality Assessment via Acoustic and Prosodic Perturbations

eess.AS · 2026-06-18 · unverdicted · novelty 5.0

MOS models match humans on acoustic degradation but are insensitive to prosodic errors and show a double dissociation on speaker characteristics like mean F0 bias and insensitivity to rate and F0 variability.

citing papers explorer

Showing 4 of 4 citing papers.

CoMelSinger: Discrete Token-Based Zero-Shot Singing Synthesis With Structured Melody Control and Guidance cs.SD · 2025-09-24 · unverdicted · none · ref 67
CoMelSinger introduces a discrete token-based zero-shot SVS framework on MaskGCT with coarse-to-fine contrastive learning and an SVT module to improve melody control and reduce prosody leakage.
MOS-Bench: Benchmarking Generalization Abilities of Subjective Speech Quality Assessment Models cs.SD · 2024-11-06 · unverdicted · none · ref 31
MOS-Bench benchmark shows that existing SSQA models struggle with out-of-domain generalization and that training on multiple diverse datasets improves robustness.
Listening Like a Judge: A Music-Aware Framework for Automatic Singing Performance Evaluation cs.SD · 2026-06-24 · unverdicted · none · ref 26
MusicJudge is a modality-guided framework that performs block-aligned multimodal analysis for singing quality assessment by coupling lyrics with pitch-rhythm fidelity via multi-signal matching and Modality-Guided LoRA fine-tuning.
Investigating Human-Model Discrepancies in Speech Quality Assessment via Acoustic and Prosodic Perturbations eess.AS · 2026-06-18 · unverdicted · none · ref 38
MOS models match humans on acoustic degradation but are insensitive to prosodic errors and show a double dissociation on speaker characteristics like mean F0 bias and insensitivity to rate and F0 variability.

Singmos: An extensive open- source singing voice dataset for mos prediction

fields

years

verdicts

representative citing papers

citing papers explorer