Flickr30k entities: Collecting region-to- phrase correspondences for richer image-to-sentence models,

Bryan A · 2015

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

MaskAttn-SDXL: Controllable Region-Level Text-To-Image Generation

cs.CV · 2025-09-18 · unverdicted · novelty 6.0

MaskAttn-SDXL adds token-conditioned spatial gating to SDXL cross-attention to sparsify irrelevant token-to-location bindings and improve region-level controllability without retraining or inference edits.

citing papers explorer

Showing 1 of 1 citing paper.

MaskAttn-SDXL: Controllable Region-Level Text-To-Image Generation cs.CV · 2025-09-18 · unverdicted · none · ref 16
MaskAttn-SDXL adds token-conditioned spatial gating to SDXL cross-attention to sparsify irrelevant token-to-location bindings and improve region-level controllability without retraining or inference edits.

Flickr30k entities: Collecting region-to- phrase correspondences for richer image-to-sentence models,

fields

years

verdicts

representative citing papers

citing papers explorer