Search

Home
News
People
Publications
Recruitment

Light Dark Automatic
English
中文 (简体)

Yifan Yao

Latest

CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization
HiPO: Hybrid Policy Optimization for Dynamic Reasoning in LLMs
IF-VidCap: Can Video Caption Models Follow Instructions?

liujiaheng@nju.edu.cn

Nanjing University Xianlin Campus

GitHub

WeChat

© 2026 Nanjing University LINK Laboratory. All rights reserved.

Cite