XDomainBench: Diagnosing Reasoning Collapse in High-Dimensional Scientific Knowledge Composition

Chau Yuen; Che Wang; Fei Huang; Foo Ping; Fuyao Zhang; Gong Zhiren; Jiaming Zhang; Tiantong Wu; Wei Yang Bryan Lim; Yikun Hou

arxiv: 2605.14754 · v1 · pith:OZ67K5S3new · submitted 2026-05-14 · 💻 cs.AI

XDomainBench: Diagnosing Reasoning Collapse in High-Dimensional Scientific Knowledge Composition

Gong Zhiren , Tiantong Wu , Jiaming Zhang , Fuyao Zhang , Che Wang , Yurong Hao , Yikun Hou , Foo Ping

show 4 more authors

Yilei Zhao Fei Huang Chau Yuen Wei Yang Bryan Lim

This is my paper

classification 💻 cs.AI

keywords compositionreasoningscientificcollapseinteractiveknowledgedifficultydomain

0 comments

read the original abstract

Large Language Models (LLMs) are increasingly deployed for knowledge synthesis, yet their capacity for compositional generalization in scientific knowledge remains under-characterized. Existing benchmarks primarily focus on single-turn restricted scenarios, failing to capture the capability boundaries exposed by real-world interactive scientific workflows. To address this, we introduce XDomainBench, a diagnostic benchmark for interactive interdisciplinary scientific reasoning. We formalize the composition order and mixture structure to enable systematic stress-testing from single-discipline to inter-disciplinary, comprising 8,598 interactive sessions across 20 domains and 4 task categories, with 8 realistic trajectory patterns covering difficulty and domain-mixture dynamics, simulating real AI4S scenarios. Large-scale evaluation of LLMs reveals a systematic reasoning collapse as composition order increases, stemming from two root causes: (i) direct difficulty increases induced by domain composition, and (ii) indirect interaction-amplified failures where trajectory patterns trigger error accumulation, reasoning breaks, and domain confusion, ultimately leading to session collapse.

This paper has not been read by Pith yet.

XDomainBench: Diagnosing Reasoning Collapse in High-Dimensional Scientific Knowledge Composition

discussion (0)