搜索

首页
新闻
成员
研究成果
招生信息

浅色深色自动
中文 (简体)
English

Yifan Yao

最新

CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization
HiPO: Hybrid Policy Optimization for Dynamic Reasoning in LLMs
IF-VidCap: Can Video Caption Models Follow Instructions?

liujiaheng@nju.edu.cn

南京大学苏州校区

GitHub

微信公众号

© 2026 南京大学LINK 实验室. 版权所有.

引用