MergeVQ: A Uni- fied Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization, 2025

Siyuan Li, Luyuan Zhang, Zedong Wang, Juanxi Tian, Cheng Tan, Zicheng Liu, Chang Yu, Qingsong Xie, Haonan Lu, Haoqian Wang, Zhen Lei · 2025 · arXiv 2504.00999

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

read on arXiv browse 1 citing papers

representative citing papers

Learning from Semantic Dictionaries: Discriminative Codebook Contrastive Learning for Unified Visual Representation and Generation

cs.CV · 2026-05-24 · unverdicted · novelty 6.0

LEASE achieves state-of-the-art unified performance on ImageNet-1K by combining masked token reconstruction and codebook contrast losses in a one-time precomputed discrete token space.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Learning from Semantic Dictionaries: Discriminative Codebook Contrastive Learning for Unified Visual Representation and Generation cs.CV · 2026-05-24 · unverdicted · none · ref 33
LEASE achieves state-of-the-art unified performance on ImageNet-1K by combining masked token reconstruction and codebook contrast losses in a one-time precomputed discrete token space.

MergeVQ: A Uni- fied Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization, 2025

fields

years

verdicts

representative citing papers

citing papers explorer