语言模型 - AI在线

Copilot 正在吞噬世界，与 ChatGPT 一起

机器之能报道编辑：SIa2023 年属于 AI （尤其是生成式 AI ），几乎每个人都或多或少尝试过大型语言模型 ( LLM )，无论是教师、政客、脱口秀甚至儿童活动支持人。凭借每周超过 1 亿的活跃用户，ChatGPT 跻身当之无愧的顶流。不过，很多日常用例只触及了可能性表面。透过表面，那些真正从事技术工作的人们正在使用广泛 AI 工具来改造产品、重构业务，或者以前所未有的方式提供客户体验.......至少，大家承诺如此。那么，真实情况是什么呢？8月，低代码开发平台独角兽 Retool 对 1,578 名技术人员

大视觉语言模型基准数据集ReForm-Eval：新瓶装旧酒，给旧有的基准数据集换个形式就能用来评估新的大视觉语言模型

概要复旦DISC实验室推出了ReForm-Eval，一个用于综合评估大视觉语言模型的基准数据集。ReForm-Eval通过对已有的、不同任务形式的多模态基准数据集进行重构，构建了一个具有统一且适用于大模型评测形式的基准数据集。所构建的ReForm-Eval具有如下特点：构建了横跨8个评估维度，并为每个维度提供足量的评测数据（平均每个维度4000余条）；具有统一的评测问题形式（包括单选题和文本生成问题）；方便易用，评测方法可靠高效，且无需依赖ChatGPT等外部服务；高效地利用了现存的数据资源，无需额外的人工标注，并