Josef Dai

Identifiers

name variant Josef Dai 0.60 · backfill

Papers (3)

Debate with Images: Detecting Deceptive Behaviors in Multimodal Large Language Models cs.AI · 2025 · author #7
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning cs.RO · 2025 · author #6
Safe RLHF: Safe Reinforcement Learning from Human Feedback cs.AI · 2023 · author #1

Mentions

2512.00349 #7 · arxiv_oai · confidence 0.70 Josef Dai

Frequent Coauthors

Jiaming Ji 3 shared papers
Yaodong Yang 3 shared papers
Borong Zhang 1 shared papers
Boyuan Chen 1 shared papers
Donghai Hong 1 shared papers
Jiayi Zhou 1 shared papers
Kaile Wang 1 shared papers
Mickel Liu 1 shared papers
Ruiyang Sun 1 shared papers
Shiyi Hou 1 shared papers
Sitong Fang 1 shared papers
Xinbo Xu 1 shared papers
Xuehai Pan 1 shared papers
Yingshan Lei 1 shared papers
Yishuai Cai 1 shared papers
Yizhou Wang 1 shared papers
Yuanpei Chen 1 shared papers
Yuhao Zhang 1 shared papers