Wei Zhou, Bolei Ma, Annemarie Friedrich, and Mohsen Mesgar

Fengbin Zhu, Wenqiang Lei, Youcheng Huang, Chao Wang, Shuo Zhang, Jiancheng Lv, Fuli Feng, Tat-Seng Chua · 2021 · DOI 10.18653/v1/2021.acl-long.254

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

open at publisher browse 4 citing papers

representative citing papers

From Table to Cell: Attention for Better Reasoning with TABALIGN

cs.AI · 2026-05-14 · unverdicted · novelty 7.0

TABALIGN pairs a diffusion language model planner emitting binary cell masks with a trained attention verifier, raising average accuracy 15.76 points over strong baselines on eight table benchmarks while speeding execution 44.64%.

FrontierFinance: A Long-Horizon Computer-Use Benchmark of Real-World Financial Tasks

cs.CL · 2026-04-07 · unverdicted · novelty 7.0

FrontierFinance benchmark shows human financial experts outperform state-of-the-art LLMs by achieving higher scores and more client-ready outputs on realistic long-horizon tasks.

TABQAWORLD: Optimizing Multimodal Reasoning for Multi-Turn Table Question Answering

cs.AI · 2026-04-03 · unverdicted · novelty 6.0

TABQAWORLD improves multi-turn table QA by dynamically selecting multimodal representations and optimizing reasoning trajectories with metadata, delivering 4.87% accuracy gains over baselines and 33.35% latency reduction.

FinReasoning: A Hierarchical Benchmark for Reliable Financial Research Reporting

cs.CL · 2026-02-25 · unverdicted · novelty 6.0

FinReasoning is a hierarchical benchmark that decomposes LLM financial research capabilities into semantic consistency, data alignment, and deep insight, revealing model-type differences in auditing versus insight generation.

citing papers explorer

Showing 4 of 4 citing papers.

From Table to Cell: Attention for Better Reasoning with TABALIGN cs.AI · 2026-05-14 · unverdicted · none · ref 83
TABALIGN pairs a diffusion language model planner emitting binary cell masks with a trained attention verifier, raising average accuracy 15.76 points over strong baselines on eight table benchmarks while speeding execution 44.64%.
FrontierFinance: A Long-Horizon Computer-Use Benchmark of Real-World Financial Tasks cs.CL · 2026-04-07 · unverdicted · none · ref 35
FrontierFinance benchmark shows human financial experts outperform state-of-the-art LLMs by achieving higher scores and more client-ready outputs on realistic long-horizon tasks.
TABQAWORLD: Optimizing Multimodal Reasoning for Multi-Turn Table Question Answering cs.AI · 2026-04-03 · unverdicted · none · ref 6
TABQAWORLD improves multi-turn table QA by dynamically selecting multimodal representations and optimizing reasoning trajectories with metadata, delivering 4.87% accuracy gains over baselines and 33.35% latency reduction.
FinReasoning: A Hierarchical Benchmark for Reliable Financial Research Reporting cs.CL · 2026-02-25 · unverdicted · none · ref 41
FinReasoning is a hierarchical benchmark that decomposes LLM financial research capabilities into semantic consistency, data alignment, and deep insight, revealing model-type differences in auditing versus insight generation.

Wei Zhou, Bolei Ma, Annemarie Friedrich, and Mohsen Mesgar

fields

years

verdicts

representative citing papers

citing papers explorer