商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅
感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。

文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅助;理科能力方面,其数理、代码及推理等方面能力也进行了增强,官方表示可为金融、数据分析等场景落地提供基础。

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

目前,日日新 5.0 大模型已经正式面向全网用户开放,点此直达

商汤方面表示,在小米汽车 SU7 的智能座舱内也应用了商汤大模型技术,小爱同学采用了基于商汤端云大模型的解决方案,可为车主提供智能化交互体验。

相关资讯

中美将举行人工智能政府间对话首次会议,交流科技风险及全球治理等问题

据外交部北美大洋洲司“宽广太平洋”公众号消息,为落实中美元首旧金山会晤共识,经双方商定,中美将于当地时间 5 月 14 日在瑞士日内瓦举行中美人工智能政府间对话首次会议,就人工智能科技风险、全球治理以及各自关切的其它问题进行交流。另外,根据英国机构 Tortoise Media 去年公布的 2023 年全球 AI 指数排名,该公司使用投资、创新和实践三个指标来确定各国在 AI 发展方面的排名,美国在这三项指标中均排名第一并获得 100 分的满分,尤其在投资方面表现突出,这很大程度上得益于商业投资方面获得的高分,即初

北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作

​IBM 推出小型AI模型 Granite 3.2 ,强调高效推理与实用性

IBM 最近发布了其最新的 Granite3.2大型语言模型,旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。 该模型不仅具备多模态和推理能力,还提升了灵活性和成本效益,使得用户更容易采用。 Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。