Measuring what llms think they do: Shap faithfulness and deployability on financial tabular classification

Measuring What LLMs Think They Do: SHAP Faithfulness, Deployability on Financial Tabular Classification , author= · 2025 · arXiv 2512.00163

2 Pith papers cite this work. Polarity classification is still indexing.

2 Pith papers citing it

read on arXiv browse 2 citing papers

representative citing papers

LLM Doesn't Know What It Doesn't Know: Detecting Epistemic Blind Spots via Cross-Model Attribution Divergence on Clinical Tabular Data

cs.AI · 2026-06-17 · unverdicted · novelty 7.0

LLMs exhibit epistemically vacuous confidence on clinical tabular data, but cross-model attribution divergence with XGBoost enables a calibrator that reduces expected calibration error from 0.254 to 0.080.

Signal or Noise in Multi-Agent LLM-based Stock Recommendations?

q-fin.PM · 2026-04-19 · unverdicted · novelty 6.0

A multi-agent LLM equity system produces statistically significant outperformance on S&P 500 stocks, with strong-buy portfolios returning +2.18% monthly versus +1.15% for the equal-weight benchmark over 19 months.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Signal or Noise in Multi-Agent LLM-based Stock Recommendations? q-fin.PM · 2026-04-19 · unverdicted · none · ref 1
A multi-agent LLM equity system produces statistically significant outperformance on S&P 500 stocks, with strong-buy portfolios returning +2.18% monthly versus +1.15% for the equal-weight benchmark over 19 months.

Measuring what llms think they do: Shap faithfulness and deployability on financial tabular classification

fields

years

verdicts

representative citing papers

citing papers explorer