Some methods of classification and analysis of multivariate observations

James B McQueen · 1967

4 Pith papers cite this work. Polarity classification is still indexing.

4 Pith papers citing it

browse 4 citing papers

representative citing papers

Towards Real-world Human Behavior Simulation: Benchmarking Large Language Models on Long-horizon, Cross-scenario, Heterogeneous Behavior Traces

cs.CL · 2026-04-09 · unverdicted · novelty 7.0 · 2 refs

Introduces OmniBehavior benchmark from real-world data and shows LLMs exhibit hyper-activity, persona homogenization, and utopian bias in behavior simulation.

Capturing LLM Capabilities via Evidence-Calibrated Query Clustering

cs.AI · 2026-05-16 · unverdicted · novelty 6.0

ECC calibrates semantic embeddings with posterior model comparisons and Bradley-Terry capability profiles to create flexible, mixed-membership query clusters that improve LLM capability ranking.

MindLoom: Composing Thought Modes for Frontier-Level Reasoning Data Synthesis

cs.AI · 2026-05-20 · unverdicted · novelty 5.0

MindLoom synthesizes frontier-level reasoning data by decomposing solutions into thought mode chains, training a retrieval model for mode selection, composing new problems with distribution-aligned sampling, and applying rollout-based difficulty labeling for fine-tuning.

ConformaDecompose: Explaining Uncertainty via Calibration Localization

cs.LG · 2026-04-29 · unverdicted · novelty 5.0

ConformaDecompose decomposes conformal prediction uncertainty by progressively localizing calibration sets, revealing reducible epistemic components that align with model limitations across tasks.

citing papers explorer

Showing 4 of 4 citing papers.

Towards Real-world Human Behavior Simulation: Benchmarking Large Language Models on Long-horizon, Cross-scenario, Heterogeneous Behavior Traces cs.CL · 2026-04-09 · unverdicted · none · ref 31 · 2 links
Introduces OmniBehavior benchmark from real-world data and shows LLMs exhibit hyper-activity, persona homogenization, and utopian bias in behavior simulation.
Capturing LLM Capabilities via Evidence-Calibrated Query Clustering cs.AI · 2026-05-16 · unverdicted · none · ref 27
ECC calibrates semantic embeddings with posterior model comparisons and Bradley-Terry capability profiles to create flexible, mixed-membership query clusters that improve LLM capability ranking.
MindLoom: Composing Thought Modes for Frontier-Level Reasoning Data Synthesis cs.AI · 2026-05-20 · unverdicted · none · ref 23
MindLoom synthesizes frontier-level reasoning data by decomposing solutions into thought mode chains, training a retrieval model for mode selection, composing new problems with distribution-aligned sampling, and applying rollout-based difficulty labeling for fine-tuning.
ConformaDecompose: Explaining Uncertainty via Calibration Localization cs.LG · 2026-04-29 · unverdicted · none · ref 19
ConformaDecompose decomposes conformal prediction uncertainty by progressively localizing calibration sets, revealing reducible epistemic components that align with model limitations across tasks.

Some methods of classification and analysis of multivariate observations

fields

years

verdicts

representative citing papers

citing papers explorer