arXiv (2025),10.48550/arXiv.2506.09092

Wentao Chen, Jiace Zhu, Qi Fan, Yehan Ma, An Zou · 2025 · arXiv 2506.09092

3 Pith papers cite this work. Polarity classification is still indexing.

3 Pith papers citing it

representative citing papers

CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs

cs.LG · 2026-05-19 · unverdicted · novelty 7.0 · 2 refs

CODA re-expresses most non-attention Transformer computations as GEMM-plus-epilogue programs using a constrained set of composable primitives to keep intermediate results on-chip and cut global memory traffic.

Generated, Parallel, Scalable? A Study of Agentic AI-Generated Julia Code on Supercomputers

cs.DC · 2026-06-15 · unverdicted · novelty 5.0

Empirical study of agentic LLM generation of parallel Julia code finds reliable execution only at small scales with recurring failures in task dependencies and scheduling at larger scales.

HTAM: Hierarchical Transition-Attended Memory for Operator Optimization

cs.CL · 2026-05-28 · unverdicted · novelty 5.0

HTAM builds a Hierarchical Transition Graph to organize coarse global directions and detailed local strategies for guiding LLM-based CUDA kernel optimization, improving results on KernelBench.

citing papers explorer

Showing 3 of 3 citing papers after filters.

CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs cs.LG · 2026-05-19 · unverdicted · none · ref 3 · 2 links
CODA re-expresses most non-attention Transformer computations as GEMM-plus-epilogue programs using a constrained set of composable primitives to keep intermediate results on-chip and cut global memory traffic.
Generated, Parallel, Scalable? A Study of Agentic AI-Generated Julia Code on Supercomputers cs.DC · 2026-06-15 · unverdicted · none · ref 23
Empirical study of agentic LLM generation of parallel Julia code finds reliable execution only at small scales with recurring failures in task dependencies and scheduling at larger scales.
HTAM: Hierarchical Transition-Attended Memory for Operator Optimization cs.CL · 2026-05-28 · unverdicted · none · ref 6
HTAM builds a Hierarchical Transition Graph to organize coarse global directions and detailed local strategies for guiding LLM-based CUDA kernel optimization, improving results on KernelBench.

arXiv (2025),10.48550/arXiv.2506.09092

fields

years

verdicts

representative citing papers

citing papers explorer