BLIP-2: Bootstrapping language-image pre-training with frozen image encoders and large language models,

Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi, “BLIP-2: Bootstrapping language-image pre-training with frozen image encoders, large language models,” inProc · 2023

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Contextual Biasing for ASR in Speech LLM with Common Word Cues and Bias Word Position Prediction

eess.AS · 2026-04-14 · unverdicted · novelty 6.0

Common-word acoustic cues and bias-word position prediction in speech LLMs cut rare-word transcription errors by 16.3% versus baselines, including out-of-domain cases.

citing papers explorer

Showing 1 of 1 citing paper.

Contextual Biasing for ASR in Speech LLM with Common Word Cues and Bias Word Position Prediction eess.AS · 2026-04-14 · unverdicted · none · ref 49
Common-word acoustic cues and bias-word position prediction in speech LLMs cut rare-word transcription errors by 16.3% versus baselines, including out-of-domain cases.

BLIP-2: Bootstrapping language-image pre-training with frozen image encoders and large language models,

fields

years

verdicts

representative citing papers

citing papers explorer