Seeing Culture: A Benchmark for Visual Reasoning and Grounding

Satar, Burak, Ma, Zhixin, Irawan, Patrick Amadeus, Mulyawan, Wilfried Ariel, Jiang, Jing, Lim, Ee-Peng · 2025 · DOI 10.18653/v1/2025.emnlp-main.1131

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

open at publisher browse 2 citing papers

representative citing papers

ChinaHeritaQA: A Culturally-Grounded Visual Question Answering Dataset for World Heritage Sites in China

cs.CV · 2026-06-08 · unverdicted · novelty 7.0

ChinaHeritaQA is a new bilingual VQA benchmark dataset with 2,279 images and 14,133 QA pairs for evaluating cultural reasoning abilities of VLMs on Chinese World Heritage sites across seven cognitive dimensions.

CulMind: Benchmarking Multimodal Understanding and Reasoning in Chinese Cultural Heritage

cs.CL · 2026-06-19 · unverdicted · novelty 6.0

Introduces CulMind benchmark, CulMind-R reasoning subset, and ReaScore metric to evaluate MLLMs on Chinese cultural heritage multimodal understanding and reasoning quality.

citing papers explorer

Showing 2 of 2 citing papers.

ChinaHeritaQA: A Culturally-Grounded Visual Question Answering Dataset for World Heritage Sites in China cs.CV · 2026-06-08 · unverdicted · none · ref 4
ChinaHeritaQA is a new bilingual VQA benchmark dataset with 2,279 images and 14,133 QA pairs for evaluating cultural reasoning abilities of VLMs on Chinese World Heritage sites across seven cognitive dimensions.
CulMind: Benchmarking Multimodal Understanding and Reasoning in Chinese Cultural Heritage cs.CL · 2026-06-19 · unverdicted · none · ref 30
Introduces CulMind benchmark, CulMind-R reasoning subset, and ReaScore metric to evaluate MLLMs on Chinese cultural heritage multimodal understanding and reasoning quality.

Seeing Culture: A Benchmark for Visual Reasoning and Grounding

fields

years

verdicts

representative citing papers

citing papers explorer