首页
新闻
成员
研究成果
招生信息
浅色
深色
自动
中文 (简体)
English
An Ping
最新
IF-VidCap: Can Video Caption Models Follow Instructions?
MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues
引用
×