上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

IT之家从上海人工智能实验室获悉,其书生大模型今日获得重要版本升级——书生·浦语3.0(InternLM3)。据官方介绍,其通过精炼数据框架大幅提升了数据效率,实现思维密度的跃升。

AI在线从上海人工智能实验室获悉,其书生大模型今日获得重要版本升级 —— 书生・浦语 3.0(InternLM3)。据官方介绍,其通过精炼数据框架大幅提升了数据效率,实现思维密度的跃升。

InternLM3-8B-Instruct 仅使用 4T 数据训练,官方宣称其综合性能超过同量级开源模型,节约超 75% 训练成本;首次在通用模型中实现了常规对话与深度思考能力融合,可应对更多真实使用场景。

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

基于司南 OpenCompass 开源评测框架,该模型研究团队使用统一可复现的方法对该模型进行评测。评测采用 CMMLU、GPQA 等十多个权威评测集,维度包括推理、数学、编程、指令跟随、长文本、对话及综合表现等多方面性能,结果显示,书生・浦语 3.0 在大多数评测集得分领先,综合性能“十分接近 GPT-4o-mini”。

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

上海 AI 实验室披露了部分该模型的体验案例,如解答“箭头迷宫问题”等推理谜题,让模型在棋盘格中找到从起点到终点的可行路径。

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

以及“猜数字”问题:

上海 AI 实验室书生・浦语大模型升级:仅用 4T 数据训练而成,通用模型首次融合常规对话与深度思考

此外,其深度思考能力也拓展到了智能体任务,成为了开源社区内首个支持浏览器使用的通用对话模型,支持 20 步以上网页跳转以完成深度信息挖掘。

  • 体验页面:https://internlm-chat.intern-ai.org.cn

  • GitHub链接:https://github.com/InternLM/InternLM

  • HuggingFace链接:https://huggingface.co/internlm

  • ModelScope链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/internlm3-8b-instruct

相关资讯

中文大语言模型赶考:商汤与上海AI Lab等新发布「书生·浦语」

今天,一年一度的高考正式拉开帷幕。

彻底开源,免费商用,上海AI实验室把大模型门槛打下来

大模型领域,有人探索前沿技术,有人在加速落地,也有人正在推动整个社区进步。

书生・天际 3.0 实景三维大模型开源发布:城市级 100 平方公里全范围实时渲染,VR 设备可用

据“书生 Intern”官方公众号 28 日推文,书生・天际 3.0 实景三位大模型现已开源发布,渲染效率提速近 6 倍,同时将应用方式拓展至 VR 设备。此前在去年 7 月,上海人工智能实验室联合多家机构发布了书生・天际(LandMark)实景三维大模型,号称首次实现城市级 100 平方公里全范围实时渲染。据介绍,书生・天际 3.0 在 Web 端的基础上,将应用方式拓展至 VR 设备,用户戴上 VR 眼镜,既可在名胜古迹、城市街景或博物馆中自由穿梭、探索,也可在重建的三维实景中对场景进行更直观、更自由的编辑。此