Title resolution pending

Jangra, Anubhav, Mukherjee, Sourajit, Jatowt, Adam, Saha, Sriparna, Hasanuzzaman, Mohammad , title = · 2023 · DOI 10.1145/3584700

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

open at publisher browse 3 citing papers

Title metadata for this work has not finished resolving. The hub is built from the citation graph; the title resolver retries DOI and OpenAlex on its next pass.

representative citing papers

Measuring What Matters Beyond Text: Evaluating Multimodal Summaries by Quality, Alignment, and Diversity

cs.AI · 2026-05-12 · unverdicted · novelty 7.0

MM-Eval unifies evaluation of multimodal summaries by integrating factual text quality, cross-modal relevance via MLLM judge, and visual diversity via truncated CLIP entropy, then calibrates their combination on human preferences.

Illusions of the Gold Standard: A Large-scale Analysis of Human Evaluation Protocols for Long-form Text Generation

cs.CL · 2026-06-06 · conditional · novelty 6.0

A systematic analysis of 284 manually reviewed papers plus 1.8k+ others from 2023-2025 reveals under-reporting of human evaluation study design details, creating ambiguity in what was measured and how.

Towards Visually Grounded Multimodal Summarization via Cross-Modal Transformer and Gated Attention

cs.AI · 2026-05-12 · unverdicted · novelty 6.0

SPeCTrA-Sum uses hierarchical cross-modal fusion via DVP and DPP-distilled image selection via VRP to generate more accurate and visually grounded multimodal summaries.

citing papers explorer

Showing 3 of 3 citing papers.

Measuring What Matters Beyond Text: Evaluating Multimodal Summaries by Quality, Alignment, and Diversity cs.AI · 2026-05-12 · unverdicted · none · ref 123
MM-Eval unifies evaluation of multimodal summaries by integrating factual text quality, cross-modal relevance via MLLM judge, and visual diversity via truncated CLIP entropy, then calibrates their combination on human preferences.
Illusions of the Gold Standard: A Large-scale Analysis of Human Evaluation Protocols for Long-form Text Generation cs.CL · 2026-06-06 · conditional · none · ref 70
A systematic analysis of 284 manually reviewed papers plus 1.8k+ others from 2023-2025 reveals under-reporting of human evaluation study design details, creating ambiguity in what was measured and how.
Towards Visually Grounded Multimodal Summarization via Cross-Modal Transformer and Gated Attention cs.AI · 2026-05-12 · unverdicted · none · ref 122
SPeCTrA-Sum uses hierarchical cross-modal fusion via DVP and DPP-distilled image selection via VRP to generate more accurate and visually grounded multimodal summaries.

Title resolution pending

fields

years

verdicts

representative citing papers

citing papers explorer