AI在线 AI在线

VLM²-Bench

人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

本文来自港科与 MIT 教授团队。 本文有两个共同一作:张鉴殊为武汉大学本科四年级,本篇为其在港科大访问期间完成,将于 2025 秋季前往美国西北大学攻读 CS PhD。 姚栋宇目前就读于 CMU CS 系下的 MSCV 项目。
3/14/2025 3:48:00 PM
机器之心
  • 1