arXiv preprint arXiv:2505.10634 (2025)

Jianfei Zhao, Feng Zhang, Xin Sun, Chong Feng · 2025 · arXiv 2505.10634

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

citation-role summary

baseline 1

citation-polarity summary

baseline 1

representative citing papers

Decoding by Perturbation: Mitigating MLLM Hallucinations via Dynamic Textual Perturbation

cs.CL · 2026-04-14 · unverdicted · novelty 7.0

DeP mitigates MLLM hallucinations by dynamically perturbing text prompts to identify and reinforce stable visual evidence regions while counteracting language prior biases using attention variance and logit statistics.

Tell Model Where to Look: Mitigating Hallucinations in MLLMs by Vision-Guided Attention

cs.CV · 2025-11-25 · unverdicted · novelty 6.0

VGA constructs precise visual grounding from token semantics to guide MLLM attention toward relevant regions, dynamically suppressing described areas in captioning, and achieves SOTA dehallucination with negligible overhead.

citing papers explorer

Showing 2 of 2 citing papers.

Decoding by Perturbation: Mitigating MLLM Hallucinations via Dynamic Textual Perturbation cs.CL · 2026-04-14 · unverdicted · none · ref 63
DeP mitigates MLLM hallucinations by dynamically perturbing text prompts to identify and reinforce stable visual evidence regions while counteracting language prior biases using attention variance and logit statistics.
Tell Model Where to Look: Mitigating Hallucinations in MLLMs by Vision-Guided Attention cs.CV · 2025-11-25 · unverdicted · none · ref 32
VGA constructs precise visual grounding from token semantics to guide MLLM attention toward relevant regions, dynamically suppressing described areas in captioning, and achieves SOTA dehallucination with negligible overhead.

arXiv preprint arXiv:2505.10634 (2025)

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer