Bin Bi

Identifiers

name variant Bin Bi 0.60 · backfill

Papers (5)

UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Function cs.CL · 2024 · author #2
UNA: A Unified Supervised Framework for Efficient LLM Alignment Across Feedback Types cs.LG · 2024 · author #2
Reinforcement Learning for LLM Post-Training: A Survey cs.CL · 2024 · author #3
A Neural Comprehensive Ranker (NCR) for Open-Domain Question Answering cs.CL · 2017 · author #1
KeyVec: Key-semantics Preserving Document Representations cs.CL · 2017 · author #1

Mentions

2407.16216 #3 · arxiv_oai · confidence 0.70 Bin Bi

Frequent Coauthors

Zhichao Wang 3 shared papers
Dong Nie 2 shared papers
Hao Ma 2 shared papers
Lingzi Hong 2 shared papers
Shiva Kumar Pentyala 2 shared papers
Sitaram Asur 2 shared papers
Can Huang 1 shared papers
Cheng Wan 1 shared papers
Cheng Wang 1 shared papers
Jun Wang 1 shared papers
Kiran Ramnath 1 shared papers
Na (Claire) Cheng 1 shared papers
Na Claire Cheng 1 shared papers
Shiyu Wang 1 shared papers
Shubham Mehrotra 1 shared papers
Sougata Chaudhuri 1 shared papers
Xiangbo Mao 1 shared papers
Xiang-Bo Mao 1 shared papers
Zixu (James) Zhu 1 shared papers
Zixu James Zhu 1 shared papers