OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery

Xiucheng Liang, Jinheng Xie, Tianhong Zhao, Rudi Stouffs, Filip Biljecki · 2025 · arXiv 2504.02866

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

V-RoAst: Visual Road Assessment. Can VLM be a Road Safety Assessor Using the iRAP Standard?

cs.CV · 2024-08-20 · unverdicted · novelty 7.0

V-RoAst applies zero-shot VLMs (Gemini-1.5-flash, GPT-4o-mini) to iRAP road safety attribute classification on a new ThaiRAP image dataset and compares them to CNN baselines, finding better generalization to unseen classes but weaker spatial reasoning.

Leveraging Multimodal LLMs for Built Environment and Housing Attribute Assessment from Street-View Imagery

cs.CV · 2026-04-22 · unverdicted · novelty 4.0

Fine-tuning Gemma 3 27B on modest human-labeled street-view data yields building condition scores that align with and sometimes exceed individual human raters on correlation metrics, with knowledge distillation producing comparable smaller LLM, CNN, and transformer models.

citing papers explorer

Showing 2 of 2 citing papers.

V-RoAst: Visual Road Assessment. Can VLM be a Road Safety Assessor Using the iRAP Standard? cs.CV · 2024-08-20 · unverdicted · none · ref 27
V-RoAst applies zero-shot VLMs (Gemini-1.5-flash, GPT-4o-mini) to iRAP road safety attribute classification on a new ThaiRAP image dataset and compares them to CNN baselines, finding better generalization to unseen classes but weaker spatial reasoning.
Leveraging Multimodal LLMs for Built Environment and Housing Attribute Assessment from Street-View Imagery cs.CV · 2026-04-22 · unverdicted · none · ref 16
Fine-tuning Gemma 3 27B on modest human-labeled street-view data yields building condition scores that align with and sometimes exceed individual human raters on correlation metrics, with knowledge distillation producing comparable smaller LLM, CNN, and transformer models.

OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery

fields

years

verdicts

representative citing papers

citing papers explorer