1, 3 [Ope26] OPENAI: Reasoning models | openai api

Rock Yuren Pang, KJ Feng, Shangbin Feng, Chu Li, Weijia Shi, Yulia Tsvetkov, Jeffrey Heer, Katharina Reinecke · 2025 · arXiv 2506.23678

5 Pith papers cite this work. Polarity classification is still indexing.

5 Pith papers citing it

read on arXiv browse 5 citing papers

citation-role summary

background 1

citation-polarity summary

background 1

representative citing papers

"What Are You Really Trying to Do?": Co-Creating Life Goals from Everyday Computer Use

cs.HC · 2026-05-01 · unverdicted · novelty 7.0

A co-creation process for inferring and refining personal strivings from computer activity logs yields more representative goals and higher user agency than baselines in a 14-person week-long study.

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations

cs.AI · 2026-04-20 · conditional · novelty 7.0

GROVE visualizes distributions of language model generations as overlapping paths through a text graph, with user studies showing that graph summaries aid structural judgments like diversity assessment while raw outputs remain better for details.

Multi-Turn Neural Transparency: Surfacing Neural Activations Improves User Calibration to LLM Behavioral Drift

cs.HC · 2026-05-14 · unverdicted · novelty 5.0

Multi-turn neural transparency using behavioral vectors and dynamic visualizations improves user anticipation and evaluation of LLM trait expression while reducing overconfidence, per a randomized study with 246 participants.

An Agentic AI Framework with Large Language Models and Chain-of-Thought for UAV-Assisted Logistics Scheduling with Mobile Edge Computing

cs.AI · 2026-05-13 · unverdicted · novelty 5.0

An agentic AI framework with LLMs generates formulations for coupled UAV product collection and MEC task scheduling, solved by hierarchical PPO that reaches 99.6% collection success and 100% deadline compliance in simulations.

When the Chain Breaks: Interactive Diagnosis of LLM Chain-of-Thought Reasoning Errors

cs.HC · 2026-03-22 · unverdicted · novelty 5.0

ReasonDiag combines automated error detection with interactive visualizations to help users identify and diagnose errors in LLM chain-of-thought reasoning traces.

citing papers explorer

Showing 1 of 1 citing paper after filters.

Beyond One Output: Visualizing and Comparing Distributions of Language Model Generations cs.AI · 2026-04-20 · conditional · none · ref 35
GROVE visualizes distributions of language model generations as overlapping paths through a text graph, with user studies showing that graph summaries aid structural judgments like diversity assessment while raw outputs remain better for details.

1, 3 [Ope26] OPENAI: Reasoning models | openai api

citation-role summary

citation-polarity summary

fields

years

verdicts

roles

polarities

representative citing papers

citing papers explorer