CSTA: CNN- based Spatiotemporal Attention for Video Summarization

Jaewon Son, Jaehun Park, Kwangsu Kim · 2024

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

SD-MVSum: Script-Driven Multimodal Video Summarization Method and Datasets

cs.CV · 2025-10-07 · conditional · novelty 5.0

SD-MVSum extends script-driven video summarization to multimodal inputs by modeling script-video and script-transcript relevance with a new weighted cross-modal attention mechanism, plus extended S-VideoXum and MrHiSum datasets.

citing papers explorer

Showing 1 of 1 citing paper.

SD-MVSum: Script-Driven Multimodal Video Summarization Method and Datasets cs.CV · 2025-10-07 · conditional · none · ref 29
SD-MVSum extends script-driven video summarization to multimodal inputs by modeling script-video and script-transcript relevance with a new weighted cross-modal attention mechanism, plus extended S-VideoXum and MrHiSum datasets.

CSTA: CNN- based Spatiotemporal Attention for Video Summarization

fields

years

verdicts

representative citing papers

citing papers explorer