Data2Vis: Automatic Generation of Data Visualizations Using Sequence to Sequence Recurrent Neural Networks

\c{C}a\u{g}atay Demiralp; Victor Dibia

arxiv: 1804.03126 · v3 · pith:X2JLFDCFnew · submitted 2018-04-09 · 💻 cs.HC · cs.AI· cs.LG

Data2Vis: Automatic Generation of Data Visualizations Using Sequence to Sequence Recurrent Neural Networks

Victor Dibia , \c{C}a\u{g}atay Demiralp This is my paper

classification 💻 cs.HC cs.AIcs.LG

keywords visualizationdatavisualizationssequencedata2visneuralspecificationsattributes

0 comments

read the original abstract

Rapidly creating effective visualizations using expressive grammars is challenging for users who have limited time and limited skills in statistics and data visualization. Even high-level, dedicated visualization tools often require users to manually select among data attributes, decide which transformations to apply, and specify mappings between visual encoding variables and raw or transformed attributes. In this paper we introduce Data2Vis, a neural translation model for automatically generating visualizations from given datasets. We formulate visualization generation as a sequence to sequence translation problem where data specifications are mapped to visualization specifications in a declarative language (Vega-Lite). To this end, we train a multilayered attention-based recurrent neural network (RNN) with long short-term memory (LSTM) units on a corpus of visualization specifications. Qualitative results show that our model learns the vocabulary and syntax for a valid visualization specification, appropriate transformations (count, bins, mean) and how to use common data selection patterns that occur within data visualizations. Data2Vis generates visualizations that are comparable to manually-created visualizations in a fraction of the time, with potential to learn more complex visualization strategies at scale.

This paper has not been read by Pith yet.

discussion (0)

Forward citations

Cited by 1 Pith paper

Reviewed papers in the Pith corpus that reference this work. Sorted by Pith novelty score.

YAC: Bridging Natural Language and Interactive Visual Exploration with Generative AI for Biomedical Data Discovery
cs.HC 2025-09 unverdicted novelty 5.0

YAC is a prototype system that uses a tool-calling multi-agent architecture to translate natural language into linked interactive visualizations and filters for biomedical data, with user-adjustable structured output ...