archive

Every paper Pith has read. Search by title, abstract, or pith.

14903 papers in cs.LG · page 11

cs.LG 2026-05-20 reviewed

Mean UA-RAO with ensembles beats deterministic baselines in PQD localization
A Unified Framework for Uncertainty-Aware Explainable Artificial Intelligence: A Case Study in Power Quality Disturbance Classification

Yinsong Chen +3
cs.LG 2026-05-20 reviewed

Parallel Monte Carlo trains deep state space models 10x faster
Efficient Learning of Deep State Space Models via Importance Smoothing

John-Joseph Brady +2
cs.LG 2026-05-20 reviewed

Projection algorithm reduces constraint violations to O(log T)
Improved Guarantees for Constrained Online Convex Optimization via Self-Contraction

Dhruv Sarkar +1
cs.LG 2026-05-20 reviewed

Hyperbolic operator adds L1 bias to stable sparse transformer training
HORST: Composing Optimizer Geometries for Sparse Transformer Training

Tom Jacobs +2
cs.LG 2026-05-20 reviewed

FL programs factor through fixed shared state
A Typed Tensor Language for Federated Learning

Theofilos Mailis +8
cs.LG 2026-05-20 reviewed

Unbalanced OT learns unique map from noisy to clean images without pairs
UOTIP: Unbalanced Optimal Transport Map for Unpaired Inverse Problems

Donggyu Lee +2
cs.LG 2026-05-20 reviewed

Separate corrector cuts error buildup in deep forecasts
Reviving Error Correction in Modern Deep Time-Series Forecasting

Minh Hoang Nguyen +5
cs.MA 2026-05-20 reviewed

Decoupled messages sustain MARL performance at low bandwidth
Decoupling Communication from Policy: Robust MARL under Bandwidth Constraints

Alexi Canesse +3
physics.app-ph 2026-05-20 reviewed

Blueprint couples materials and biomedical data into governed AI workflows
AIMBio-Mat: An AI-Native FAIR Platform for Closed-Loop Materials Discovery and Biomedical Translation

D.-M. Mei +53
cs.SD 2026-05-20 reviewed

Music attention uses metadata to cut repetition in generated melodies
Musical Attention Transformer: Music Generation Using a Music-Specific Attention Model

Shinnosuke Taksuka +1
cs.CV 2026-05-20 reviewed

New transformer fuses hyperspectral imagery with other EO sensors
SpectralEarth-FM: Bringing Hyperspectral Imagery into Multimodal Earth Observation Pretraining

Nassim Ait Ali Braham +5
cs.LG 2026-05-20 reviewed

Self-pretraining uncovers attention patterns labels cannot reach
Towards Understanding Self-Pretraining for Sequence Classification

Omar Coser +3
cs.LG 2026-05-20 reviewed

Personalized bounds deconfound recommendations without RCTs
Robust Personalized Recommendation under Hidden Confounding in MNAR

Zongyu Li +2
cs.LG 2026-05-20 reviewed

Token prioritization lifts task accuracy in wireless systems
TONIC: Token-Centric Semantic Communication for Task-Oriented Wireless Systems

Sige Liu +1
cs.LG 2026-05-20 reviewed

Expectation consistency suffices for calibration under covariate shift
Expectation Consistency Loss: Rethink Confidence Calibration under Covariate Shift

Jinzong Dong +2
cs.LG 2026-05-20 reviewed

Vector quantization builds local calibration maps for multiclass models
Divide et Calibra: Multiclass Local Calibration via Vector Quantization

Cesare Barbera +4
cs.CV 2026-05-20 reviewed

Pairwise data trains multimodal LLMs without full joint alignments
Multimodal LLMs under Pairwise Modalities

Yan Li +5
cs.LG 2026-05-20 reviewed

Causal constraints' power depends on the tasks they accompany
A Dialogue between Causal and Traditional Representation Learning: Toward Mutual Benefits in a Unified Formulation

Yan Li +6
cs.NE 2026-05-20 reviewed

Transformer mutation evolves improved approximate multipliers
Genetic Programming with Transformer-Based Mutation for Approximate Circuit Design

Ondrej Galeta +1
stat.ML 2026-05-20 reviewed

Diffusion link lets GPs condition on text or physics
Conditioning Gaussian Processes on Almost Anything

Henry Moss +7
cs.LG 2026-05-20 reviewed

Unified model links peak timing and intensity in electricity forecasts
PeakFocus: Bridging Peak Localization and Intensity Regression via a Unified Multi-Scale Framework for Electricity Load Forecasting

Wangzhi Yu +4
cs.LG 2026-05-20 reviewed

Dynamic programming computes exact Banzhaf values for kNN
Efficient Banzhaf-Based Data Valuation for $k$-Nearest Neighbors Classification

Guangyi Zhang +3
stat.ML 2026-05-20 reviewed

Local boundary finds valid adjustment sets for causal effects
Local Covariate Selection for Average Causal Effect Estimation without Pretreatment and Causal Sufficiency Assumptions

Zeyu Liu +5
cs.AI 2026-05-20 reviewed

Off-the-shelf persona vectors rival targeted sycophancy steering
Playing Devil's Advocate: Off-the-Shelf Persona Vectors Rival Targeted Steering for Sycophancy

Ishaan Kelkar +5
math.PR 2026-05-20 reviewed

SA error tails range from sub-Gaussian to near-Pareto with Markov noise
Concentration of General Stochastic Approximation Under Heavy-Tailed Markovian Noise

Shubhada Agrawal +2
cs.CV 2026-05-20 reviewed

Landsat addition cuts TanDEM-X forest height RMSE by 13.5%
Hybrid Machine Learning Model for Forest Height Estimation from TanDEM-X and Landsat Data

Islam Mansour +3
cs.LG 2026-05-20 reviewed

Pontryagin framework optimizes policies for non-exponential discounts
Beyond the Bellman Recursion: A Pontryagin-Guided Framework for Non-Exponential Discounting

Hojin Ko +1
cs.LG 2026-05-20 reviewed

Latent GP and optimal transport track cell changes over time
Modeling Temporal scRNA-seq Data with Latent Gaussian Process and Optimal Transport

Mehmet Yigit Balik +1
cs.LG 2026-05-20 reviewed

Flat minima enable non-vacuous bounds for transformers on sparse boolean tasks
A Sharper Picture of Generalization in Transformers

Paul Lintilhac +1
cs.DC 2026-05-20 reviewed

Routing imbalance in MoE stays fixed when expert parallelism scales
Diagnosing Overhead in Dispatch Operations: Cross-architecture Observatory

Bole Ma +3
cs.LG 2026-05-20 reviewed

Point cloud sequences adapt simulators to new materials
Point Cloud Sequence Encoding for Material-conditioned Graph Network Simulators

Philipp Dahlinger +8
cs.LG 2026-05-20 reviewed

Private mutual information selects better client groups for federated learning
Choose Wisely and Privately: Proactive Client Selection for Fair and Efficient Federated Learning

Adda Akram Bendoukha +3
cs.LG 2026-05-20 reviewed

Proactive client choice cuts rounds and boosts fairness in federated learning
Choose Wisely and Privately: Proactive Client Selection for Fair and Efficient Federated Learning

Adda Akram Bendoukha +3
cs.LG 2026-05-20 reviewed

TabPFN tops NIR regression calibration benchmarks
Tabular foundation models for robust calibration of near-infrared chemical sensing data

Robin Reiter +4
cs.LG 2026-05-20 reviewed

Conformal triage releases some event-positive cases at lower review
A Deployment Audit of Release-Side Risk in Conformal Triage under Prevalence Shift

Chengze Li +9
cs.LG 2026-05-20 reviewed

DASH discovers strong hybrid attention for LLMs in 20 minutes on one GPU
DASH: Fast Differentiable Architecture Search for Hybrid Attention in Minutes on a Single GPU

Weizhe Chen +5
cs.LG 2026-05-20 reviewed

Conformal method controls contamination in multi-LLM benchmarks
Provable Joint Decontamination for Benchmarking Multiple Large Language Models

Zhenlong Liu +2
cs.LG 2026-05-20 reviewed

Neural gate turns entity proxies into structural lag outputs
Discovering Entity-Conditioned Lag Heterogeneity: A Lag-Gated Neural Audit Framework for Panel Time Series

Andi Xu
cs.LG 2026-05-20 reviewed

Oscillatory network scales to ImageNet with high efficiency
Winfree Oscillatory Neural Network

Jiawen Dai +1
cs.LG 2026-05-20 reviewed

One program decodes bundles at 100% on four frozen embeddings
Sutra: Tensor-Op RNNs as a Compilation Target for Vector Symbolic Architectures

Emma Leonhart
cs.LG 2026-05-20 reviewed

Sutra compiles VSA programs to tensor graphs with exact decoding
Sutra: Tensor-Op RNNs as a Compilation Target for Vector Symbolic Architectures

Emma Leonhart
cs.CL 2026-05-20 reviewed

Unlearned models keep low calibration but lean on shortcuts
Calibration vs Decision Making: Revisiting the Reliability Paradox in Unlearned Language Models

Divyaksh Shukla +1
cs.AI 2026-05-20 reviewed

Fighting game AIs learn how long to hold each move
For How Long Should We Be Punching? Learning Action Duration in Fighting Games

Hoang Hai Nguyen +2
cs.CR 2026-05-20 reviewed

Agent surfaces novel threats in 15% of security incidents
GenAI-Driven Threat Detection with Microsoft Security Copilot

Scott Freitas +1
cs.CR 2026-05-20 reviewed

Agent finds hidden threats in 15% of security incidents
GenAI-Driven Threat Detection with Microsoft Security Copilot

Scott Freitas +1
cs.LG 2026-05-20 reviewed

Mechanism stratification lifts kinase inhibitor predictions
Training distribution determines the ceiling of drug-blind cancer sensitivity prediction

Taekyung Heo
cs.LG 2026-05-20 reviewed

Optimal transport learns fMRI dictionaries across individual brain shapes
Learning fMRI activations dictionaries across individual geometries via optimal transport

Sonia Mazelet +2
cs.LG 2026-05-20 reviewed

Neighbor variance spots graph anomalies with no training
NeighborDiv: Training-free Zero-shot Generalist Graph Anomaly Detection via Neighbor Diversity

Kaifeng Wei +4
cs.LG 2026-05-20 reviewed

CIG reward unifies lifelong and episodic exploration signals
CIG: Exploration via Conditional Information Gain

Tim Joseph +4
cs.CR 2026-05-20 reviewed

Frequency regularization lifts attack transfer to closed MLLMs
Frequency-Domain Regularized Adversarial Alignment for Transferable Attacks against Closed-Source MLLMs

Leitao Yuan +7