大视觉言语模型基准数据集ReForm-Eval:新瓶装旧酒,给旧有的基准数据集换个情势就能用来评价新的大视觉言语模型
概要复旦DISC实验室推出了ReForm-Eval,一个用于综合评价大视觉言语模型的基准数据集。ReForm-Eval通过对已有的、不同任意情势的多模态基准数据集从事重构,建立了一个具有统一且适用于大模型评测情势的基准数据集。所建立的ReForm-Eval具有如下特点:建立了横跨8个评价维度,并为每个维度供应足量的评测数据(平均每个维度4000余条);具有统一的评测题目情势(包括单选题和文本生成题…- 11
- 0
文本生成
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!