Victor Zhong, Caiming Xiong, and Richard Socher

URLhttps://arxiv · 2010 · arXiv 2010.02840

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

representative citing papers

Agent-Agnostic Evaluation of SQL Accuracy in Production Text-to-SQL Systems

cs.AI · 2026-04-30 · unverdicted · novelty 5.0

STEF is a schema-agnostic evaluation framework that scores SQL generation accuracy from natural language inputs using semantic feature alignment and a composite metric.

BADGER: Bridging Agentic and Deterministic Evaluation for Generative Enterprise Reasoning

cs.AI · 2026-06-01 · unverdicted · novelty 4.0

BADGER is a new enterprise evaluation framework that adds LLM-assisted SQL component extraction and a Hybrid-EX metric validated on 150 human-annotated queries to existing text-to-SQL and agentic assessment methods.

citing papers explorer

Showing 2 of 2 citing papers.

Agent-Agnostic Evaluation of SQL Accuracy in Production Text-to-SQL Systems cs.AI · 2026-04-30 · unverdicted · none · ref 5
STEF is a schema-agnostic evaluation framework that scores SQL generation accuracy from natural language inputs using semantic feature alignment and a composite metric.
BADGER: Bridging Agentic and Deterministic Evaluation for Generative Enterprise Reasoning cs.AI · 2026-06-01 · unverdicted · none · ref 19
BADGER is a new enterprise evaluation framework that adds LLM-assisted SQL component extraction and a Hybrid-EX metric validated on 150 human-annotated queries to existing text-to-SQL and agentic assessment methods.

Victor Zhong, Caiming Xiong, and Richard Socher

fields

years

verdicts

representative citing papers

citing papers explorer