Hui Yuan

huiyuan[at]princeton[dot]edu

Welcome! I am Hui Yuan [xweɪ ɥæn] and my name in Chinese is 袁慧. I'm currently a final-year ECE PhD student at Princeton University, fortunately advised by Mengdi Wang. Prior to Princeton, I got my Bachelor’s degree in Statistics from University of Science and Technology of China (USTC) in 2020. My research interests lie in the foundation of machine learning methods (recent focus on generative models) and their applications to real-world decision making.

In the past few years, I'm also fortunate to work with Yinyu Ye, Csaba Szepesvári and Yingyu Liang. In summer 2024, I interned at Meta.

Preprints

A Common Pitfall of Margin-based Language Model Alignment: Gradient Entanglement

Hui Yuan^*, Yifan Zeng^*, Yue Wu^*, Huazheng Wang, Mengdi Wang, Leqi Liu^* (* leading contributors)

paper / code (comming soon!)

(Topic) Training Guided Diffusion Solver for Combinatorial Optimization with Imperfect Data

My research intern project @Meta, in submission to ICLR 2025

Seleceted Publications

Gradient Guidance for Diffusion Models: An Optimization Perspective

Yingqing Guo^*, Hui Yuan^*, Yukang Yang, Minshuo Chen, Mengdi Wang (* equal contribution)

Neurips 2024

paper / code (comming soon!)

MaxMin-RLHF: Towards Equitable Alignment of Large Language Models with Diverse Human Preferences

Souradip Chakraborty, Jiahao Qiu,Hui Yuan, Alec Koppel, Dinesh Manocha, Furong Huang, Amrit Bedi, Mengdi Wang

ICML 2024

paper / code

Reward-Directed Conditional Diffusion: Provable Distribution Estimation and Reward Improvement

Hui Yuan, Kaixuan Huang, Chengzhuo Ni, Minshuo Chen, Mengdi Wang

Neurips 2023

paper / code

Unified Off-Policy Learning to Rank: a Reinforcement Learning Perspective

Zeyu Zhang, Yi Su, Hui Yuan, Yiran Wu, Rishab Balasubramanian, Qingyun Wu, Huazheng Wang, Mengdi Wang

Neurips 2023

paper / code

Bandit Theory and Thompson Sampling-Guided Directed Evolution for Sequence Optimization

Hui Yuan, Chengzhuo Ni, Huazheng Wang, Xuezhou Zhang, Le Cong, Csaba Szepesvári, Mengdi Wang

Neurips 2022

paper

Learning Entangled Single-Sample Gaussians in the Subset-of-Signals Model

Yingyu Liang, Hui Yuan

COLT 2020

paper