Omnisvg: A unified scalable vector graphics generation model.arXiv preprint arXiv:2504.06263, 2025b

Yiying Yang, Wei Cheng, Sijin Chen, Xianfang Zeng, Jiaxu Zhang, Liao Wang, Gang Yu, Xingjun Ma, Yu-Gang Jiang · 2025 · arXiv 2504.06263

8 Pith papers cite this work. Polarity classification is still indexing.

8 Pith papers citing it

read on arXiv browse 8 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

Vision2Code: A Multi-Domain Benchmark for Evaluating Image-to-Code Generation

cs.CV · 2026-05-11 · accept · novelty 8.0

Vision2Code is a multi-domain benchmark that evaluates image-to-code generation via rendered outputs scored by a VLM rater with dataset-specific rubrics, revealing domain-dependent model performance and enabling improvement without paired reference code.

mEOL: Training-Free Instruction-Guided Multimodal Embedder for Vector Graphics and Image Retrieval

cs.CV · 2026-04-18 · unverdicted · novelty 7.0

mEOL creates aligned embeddings for text, images, and SVGs using instruction-guided MLLM one-word summaries and semantic SVG rewriting, outperforming baselines on a new text-to-SVG retrieval benchmark.

Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis

cs.LG · 2026-04-09 · unverdicted · novelty 7.0

Element-level leave-one-out analysis yields per-element quality scores and four structural metrics (purity, coverage, compactness, locality) that quantify SVG modularity and enable artifact detection.

Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling

cs.LG · 2026-04-06 · unverdicted · novelty 7.0

HiVG introduces hierarchical SVG tokenization with atomic and segment tokens plus HMN initialization to enable more efficient and stable autoregressive generation of vector graphics programs.

Visual-ERM: Reward Modeling for Visual Equivalence

cs.CV · 2026-03-13 · unverdicted · novelty 7.0

Visual-ERM is a new multimodal reward model that supplies fine-grained visual feedback for training vision-language models on chart-to-code, table, and SVG tasks, yielding measurable gains over prior rewards.

Vision-as-Inverse-Graphics Agent via Interleaved Multimodal Reasoning

cs.CV · 2026-01-16 · conditional · novelty 7.0

VIGA introduces a training-free interleaved multimodal reasoning loop that improves vision-as-inverse-graphics accuracy over one-shot baselines on BlenderGym, SlideBench, and new BlenderBench.

AnchorFlow: Editable SVG Reconstruction via Sparse Anchor Point Fields

cs.GR · 2026-05-19 · unverdicted · novelty 6.0

AnchorFlow predicts image-conditioned sparse anchor point fields to resolve into ordered Bezier paths, then uses rendering feedback to correct errors, yielding SVGs with reduced editable complexity and competitive fidelity.

DataSway: Vivifying Metaphoric Visualization with Animation Clip Generation and Coordination

cs.HC · 2025-07-29 · unverdicted · novelty 6.0

DataSway supports creation of semantically aligned animations for metaphoric data visualizations by generating clips via VLMs and coordinating timelines based on entity order, attributes, layout, or randomness.

citing papers explorer

Showing 8 of 8 citing papers.

Vision2Code: A Multi-Domain Benchmark for Evaluating Image-to-Code Generation cs.CV · 2026-05-11 · accept · none · ref 14
Vision2Code is a multi-domain benchmark that evaluates image-to-code generation via rendered outputs scored by a VLM rater with dataset-specific rubrics, revealing domain-dependent model performance and enabling improvement without paired reference code.
mEOL: Training-Free Instruction-Guided Multimodal Embedder for Vector Graphics and Image Retrieval cs.CV · 2026-04-18 · unverdicted · none · ref 43
mEOL creates aligned embeddings for text, images, and SVGs using instruction-guided MLLM one-word summaries and semantic SVG rewriting, outperforming baselines on a new text-to-SVG retrieval benchmark.
Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis cs.LG · 2026-04-09 · unverdicted · none · ref 4
Element-level leave-one-out analysis yields per-element quality scores and four structural metrics (purity, coverage, compactness, locality) that quantify SVG modularity and enable artifact detection.
Hierarchical SVG Tokenization: Learning Compact Visual Programs for Scalable Vector Graphics Modeling cs.LG · 2026-04-06 · unverdicted · none · ref 43
HiVG introduces hierarchical SVG tokenization with atomic and segment tokens plus HMN initialization to enable more efficient and stable autoregressive generation of vector graphics programs.
Visual-ERM: Reward Modeling for Visual Equivalence cs.CV · 2026-03-13 · unverdicted · none · ref 36
Visual-ERM is a new multimodal reward model that supplies fine-grained visual feedback for training vision-language models on chart-to-code, table, and SVG tasks, yielding measurable gains over prior rewards.
Vision-as-Inverse-Graphics Agent via Interleaved Multimodal Reasoning cs.CV · 2026-01-16 · conditional · none · ref 64
VIGA introduces a training-free interleaved multimodal reasoning loop that improves vision-as-inverse-graphics accuracy over one-shot baselines on BlenderGym, SlideBench, and new BlenderBench.
AnchorFlow: Editable SVG Reconstruction via Sparse Anchor Point Fields cs.GR · 2026-05-19 · unverdicted · none · ref 29
AnchorFlow predicts image-conditioned sparse anchor point fields to resolve into ordered Bezier paths, then uses rendering feedback to correct errors, yielding SVGs with reduced editable complexity and competitive fidelity.
DataSway: Vivifying Metaphoric Visualization with Animation Clip Generation and Coordination cs.HC · 2025-07-29 · unverdicted · none · ref 82
DataSway supports creation of semantically aligned animations for metaphoric data visualizations by generating clips via VLMs and coordinating timelines based on entity order, attributes, layout, or randomness.

Omnisvg: A unified scalable vector graphics generation model.arXiv preprint arXiv:2504.06263, 2025b

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer