Multimodal Transformer for Multimodal Machine Translation

Yao, Shaowei, Wan, Xiaojun · 2020 · DOI 10.18653/v1/2020.acl-main.400

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

open at publisher browse 1 citing papers

representative citing papers

VIDA: A dataset for Visually Dependent Ambiguity in Multimodal Machine Translation

cs.CL · 2026-05-03 · unverdicted · novelty 7.0

VIDA provides 2,500 visually-dependent ambiguous translation examples and span-level disambiguation metrics; CoT-SFT on LVLMs improves out-of-distribution performance over standard SFT.

citing papers explorer

Showing 1 of 1 citing paper after filters.

VIDA: A dataset for Visually Dependent Ambiguity in Multimodal Machine Translation cs.CL · 2026-05-03 · unverdicted · none · ref 2
VIDA provides 2,500 visually-dependent ambiguous translation examples and span-level disambiguation metrics; CoT-SFT on LVLMs improves out-of-distribution performance over standard SFT.

Multimodal Transformer for Multimodal Machine Translation

fields

years

verdicts

representative citing papers

citing papers explorer