Secous- ticodec: Cross-modal aligned streaming single-codecbook speech codec,

· 2025 · arXiv 2508.02849

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Towards Unified Song Generation and Singing Voice Conversion with Accompaniment Co-Generation

cs.SD · 2026-06-05 · unverdicted · novelty 7.0

UniSinger unifies speaker-cloned song generation and accompaniment co-generation SVC in one multimodal diffusion transformer model trained with curriculum learning via task-specific modality masking.

ContextCodec: Content-Focused Context Guidance for Ultra-Low Bitrate Speech Coding

cs.SD · 2026-06-09 · unverdicted · novelty 5.0

ContextCodec uses a dual-branch encoder with CLIP-style contrastive training on phoneme-aligned context features plus autoregressive refinement to improve quality-intelligibility at bitrates down to 500 bps.

citing papers explorer

Showing 2 of 2 citing papers after filters.

Towards Unified Song Generation and Singing Voice Conversion with Accompaniment Co-Generation cs.SD · 2026-06-05 · unverdicted · none · ref 24
UniSinger unifies speaker-cloned song generation and accompaniment co-generation SVC in one multimodal diffusion transformer model trained with curriculum learning via task-specific modality masking.
ContextCodec: Content-Focused Context Guidance for Ultra-Low Bitrate Speech Coding cs.SD · 2026-06-09 · unverdicted · none · ref 30
ContextCodec uses a dual-branch encoder with CLIP-style contrastive training on phoneme-aligned context features plus autoregressive refinement to improve quality-intelligibility at bitrates down to 500 bps.

Secous- ticodec: Cross-modal aligned streaming single-codecbook speech codec,

fields

years

verdicts

representative citing papers

citing papers explorer