Vlforgery face triad: Detection, localization and attribution via multimodal large language models

He, X · 2025 · arXiv 2503.06142

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

UniShield: Unified Face Attack Detection via KG-Informed Multimodal Reasoning

cs.CV · 2026-05-09 · unverdicted · novelty 7.0

UniShield introduces a knowledge-graph-informed multimodal framework that improves unified detection of physical and digital face attacks through instruction tuning and consistency-optimized reasoning.

Bridging the Modality Gap in Forensic Image Retrieval

cs.CV · 2026-06-10 · unverdicted · novelty 3.0

Multimodal fusion of MLLM-generated text embeddings and visual features improves retrieval for forensic tattoo and face matching tasks across images, descriptions, and sketches.

citing papers explorer

Showing 2 of 2 citing papers after filters.

UniShield: Unified Face Attack Detection via KG-Informed Multimodal Reasoning cs.CV · 2026-05-09 · unverdicted · none · ref 9
UniShield introduces a knowledge-graph-informed multimodal framework that improves unified detection of physical and digital face attacks through instruction tuning and consistency-optimized reasoning.
Bridging the Modality Gap in Forensic Image Retrieval cs.CV · 2026-06-10 · unverdicted · none · ref 15
Multimodal fusion of MLLM-generated text embeddings and visual features improves retrieval for forensic tattoo and face matching tasks across images, descriptions, and sketches.

Vlforgery face triad: Detection, localization and attribution via multimodal large language models

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer