GPT-4o 差点没及格!首个多义务长视频评测基准,它有亿点难
难度大升级的多义务长视频了解评测基准 MLVU 来了!由智源联合北邮、北大和浙大等多所高校推出。究竟有多难呢?最终排名第一的 GPT-4o 单选正确率还不足 65%。而且研究发现,大部分模型的机能都会随着视频时长增加昭著下降。研究进一步证明,提拔上下文窗口,提拔图像了解能力,以及使用更强大的 LLM Backbone 对长视频了解的机能具有昭著的提拔作用。目前相关论文及数据集已公开,具体细节下面一…- 18
- 0
MLVU
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!