Advancing audio- visual navigation through multi-agent collaboration in 3d environments

· 2025

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

browse 4 citing papers

representative citing papers

Generalizable Audio-Visual Navigation via Binaural Difference Attention and Action Transition Prediction

cs.SD · 2026-04-06 · unverdicted · novelty 7.0

BDATP enhances generalization in audio-visual navigation by explicitly modeling interaural differences and using auxiliary action prediction, achieving up to 21.6 percentage point gains in success rate on unheard sounds in Replica dataset.

Reliability-Aware Geometric Fusion for Robust Audio-Visual Navigation

cs.SD · 2026-04-02 · unverdicted · novelty 6.0

RAVN improves audio-visual navigation by learning audio-derived reliability cues via an Acoustic Geometry Reasoner and using them to modulate visual features through Reliability-Aware Geometric Modulation.

Spatial-Aware Conditioned Fusion for Audio-Visual Navigation

cs.SD · 2026-04-02 · unverdicted · novelty 5.0

SACF discretizes target direction and distance from audio-visual cues then applies conditioned fusion to improve navigation efficiency and generalization to unheard sounds.

Audio Spatially-Guided Fusion for Audio-Visual Navigation

cs.SD · 2026-04-02 · unverdicted · novelty 5.0

Audio Spatially-Guided Fusion improves generalization in audio-visual navigation on unheard sound sources by extracting spatial audio features and adaptively fusing them with visual data.

citing papers explorer

Showing 4 of 4 citing papers.

Generalizable Audio-Visual Navigation via Binaural Difference Attention and Action Transition Prediction cs.SD · 2026-04-06 · unverdicted · none · ref 28
BDATP enhances generalization in audio-visual navigation by explicitly modeling interaural differences and using auxiliary action prediction, achieving up to 21.6 percentage point gains in success rate on unheard sounds in Replica dataset.
Reliability-Aware Geometric Fusion for Robust Audio-Visual Navigation cs.SD · 2026-04-02 · unverdicted · none · ref 4
RAVN improves audio-visual navigation by learning audio-derived reliability cues via an Acoustic Geometry Reasoner and using them to modulate visual features through Reliability-Aware Geometric Modulation.
Spatial-Aware Conditioned Fusion for Audio-Visual Navigation cs.SD · 2026-04-02 · unverdicted · none · ref 5
SACF discretizes target direction and distance from audio-visual cues then applies conditioned fusion to improve navigation efficiency and generalization to unheard sounds.
Audio Spatially-Guided Fusion for Audio-Visual Navigation cs.SD · 2026-04-02 · unverdicted · none · ref 24
Audio Spatially-Guided Fusion improves generalization in audio-visual navigation on unheard sound sources by extracting spatial audio features and adaptively fusing them with visual data.

Advancing audio- visual navigation through multi-agent collaboration in 3d environments

fields

years

verdicts

representative citing papers

citing papers explorer