商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型接纳 MOE 混合专家架构,在知识、数学、推理和代码才能方面大幅提高。该模型鉴于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其供应自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及才能。文科才能方面,其在创意写作、推理总结等方面才能均有提高,可为教育、内容产业等垂直利用场景供应辅

感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型接纳 MOE 混合专家架构,在知识、数学、推理和代码才能方面大幅提高。

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

该模型鉴于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其供应自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及才能。

文科才能方面,其在创意写作、推理总结等方面才能均有提高,可为教育、内容产业等垂直利用场景供应辅助;文科才能方面,其数理、代码及推理等方面才能也进行了增强,官方表示可为金融、数据分析等场景落地供应基础。

商汤发布日日新 5.0 大模型:推理上下文窗口 200K,号称对标 GPT-4 Turbo

目前,日日新 5.0 大模型已经正式面向全网用户开放,点此直达

商汤方面表示,在小米汽车 SU7 的智能座舱内也利用了商汤大模型技术,小爱同学接纳了鉴于商汤端云大模型的解决方案,可为车主供应智能化交互体验。

给TA打赏
共{{data.count}}人
人已打赏
AI

腾讯发布汽车行业大模型“全域智能”计划,与文远知行合作打造智驾

2024-4-24 18:51:55

AI

苹果颁布 OpenELM,基于开源训练和推理框架的高效谈话模型

2024-4-24 22:30:54

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索