Panns: Large-scale pretrained audio neural networks for audio pattern recognition,

· 2020

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

browse 3 citing papers

representative citing papers

A conceptual framework for learning to listen by reward: Curiosity-driven search for novel sources

cs.SD · 2026-05-19 · unverdicted · novelty 5.0

Introduces a conceptual framework for curiosity-driven reward-based learning in audio via continuous search for novel sound sources, with an overview of prior work and a proof-of-concept.

Towards Fine-grained Temporal Perception: Post-Training Large Audio-Language Models with Audio-Side Time Prompt

cs.SD · 2026-04-15 · unverdicted · novelty 5.0

TimePro-RL interleaves timestamp embeddings in audio sequences and applies RL post-SFT to boost temporal alignment in LALMs, yielding gains on grounding, event detection, and dense captioning.

How Class Ontology and Data Scale Affect Audio Transfer Learning

cs.LG · 2026-03-26 · unverdicted · novelty 5.0

Larger pre-training data scale and class diversity improve audio transfer learning performance, yet similarity between pre-training and target task has a stronger positive effect.

citing papers explorer

Showing 3 of 3 citing papers.

A conceptual framework for learning to listen by reward: Curiosity-driven search for novel sources cs.SD · 2026-05-19 · unverdicted · none · ref 36
Introduces a conceptual framework for curiosity-driven reward-based learning in audio via continuous search for novel sound sources, with an overview of prior work and a proof-of-concept.
Towards Fine-grained Temporal Perception: Post-Training Large Audio-Language Models with Audio-Side Time Prompt cs.SD · 2026-04-15 · unverdicted · none · ref 7
TimePro-RL interleaves timestamp embeddings in audio sequences and applies RL post-SFT to boost temporal alignment in LALMs, yielding gains on grounding, event detection, and dense captioning.
How Class Ontology and Data Scale Affect Audio Transfer Learning cs.LG · 2026-03-26 · unverdicted · none · ref 15
Larger pre-training data scale and class diversity improve audio transfer learning performance, yet similarity between pre-training and target task has a stronger positive effect.

Panns: Large-scale pretrained audio neural networks for audio pattern recognition,

fields

years

verdicts

representative citing papers

citing papers explorer