unstructured: A library for preprocessing and parsing unstructured data.https:// github.com/Unstructured- IO/unstructured,

Unstructured Technologies

1 Pith paper cite this work. Polarity classification is still indexing.

1 Pith paper citing it

browse 1 citing papers

representative citing papers

Lightweight and Production-Ready PDF Visual Element Parsing

cs.CV · 2026-04-25 · unverdicted · novelty 4.0

A production-oriented PDF visual element parser achieves ≥96% detection accuracy and 93% caption association accuracy using heuristics and layout rules, outperforming prior parsers and vision-language models on benchmarks while cutting latency by more than 2×.

citing papers explorer

Showing 1 of 1 citing paper.

Lightweight and Production-Ready PDF Visual Element Parsing cs.CV · 2026-04-25 · unverdicted · none · ref 26
A production-oriented PDF visual element parser achieves ≥96% detection accuracy and 93% caption association accuracy using heuristics and layout rules, outperforming prior parsers and vision-language models on benchmarks while cutting latency by more than 2×.

unstructured: A library for preprocessing and parsing unstructured data.https:// github.com/Unstructured- IO/unstructured,

fields

years

verdicts

representative citing papers

citing papers explorer