Ts-llava: Constructing vi- sual tokens through thumbnail-and-sampling for training-free video large language models.arXiv preprint arXiv:2411.11066,

Tingyu Qu, Mingxiao Li, Tinne Tuytelaars, Marie-Francine Moens · 2024 · arXiv 2411.11066

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

read on arXiv browse 3 citing papers

citation-role summary

other 1

citation-polarity summary

unclear 1

representative citing papers

Enhancing Visual Token Representations for Video Large Language Models via Training-Free Spatial-Temporal Pooling and Gridding

cs.AI · 2026-05-21 · unverdicted · novelty 6.0

ST-GridPool improves video LLM performance via hierarchical temporal gridding and norm-based spatial pooling on visual tokens without training.

WindowQuant: Mixed-Precision KV Cache Quantization based on Window-Level Similarity for VLMs Inference Optimization

cs.CV · 2026-05-04 · unverdicted · novelty 6.0

WindowQuant performs window-adaptive mixed-precision KV cache quantization guided by similarity to the text prompt, with reordering to enable efficient inference in VLMs.

Direct RNA sequence design under codon constraints using expressive tensor-based secondary structure models

q-bio.QM · 2026-04-21 · unverdicted · novelty 6.0

Direct algorithms sample codon sequences from Boltzmann distributions using tensor-based secondary structure free energy models for RNA design under codon constraints.

citing papers explorer

Showing 3 of 3 citing papers.

Enhancing Visual Token Representations for Video Large Language Models via Training-Free Spatial-Temporal Pooling and Gridding cs.AI · 2026-05-21 · unverdicted · none · ref 8
ST-GridPool improves video LLM performance via hierarchical temporal gridding and norm-based spatial pooling on visual tokens without training.
WindowQuant: Mixed-Precision KV Cache Quantization based on Window-Level Similarity for VLMs Inference Optimization cs.CV · 2026-05-04 · unverdicted · none · ref 35
WindowQuant performs window-adaptive mixed-precision KV cache quantization guided by similarity to the text prompt, with reordering to enable efficient inference in VLMs.
Direct RNA sequence design under codon constraints using expressive tensor-based secondary structure models q-bio.QM · 2026-04-21 · unverdicted · none · ref 10
Direct algorithms sample codon sequences from Boltzmann distributions using tensor-based secondary structure free energy models for RNA design under codon constraints.

Ts-llava: Constructing vi- sual tokens through thumbnail-and-sampling for training-free video large language models.arXiv preprint arXiv:2411.11066,

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer