感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型接纳 MOE 混合专家架构,在知识、数学、推理和代码才能方面大幅提高。该模型鉴于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其供应自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及才能。文科才能方面,其在创意写作、推理总结等方面才能均有提高,可为教育、内容产业等垂直利用场景供应辅
感谢4 月 23 日,商汤科技发布了日日新 5.0 大模型。据介绍,该模型接纳 MOE 混合专家架构,在知识、数学、推理和代码才能方面大幅提高。
该模型鉴于超过 10TB tokens 训练,具备 200K 推理上下文窗口(IT之家注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其供应自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及才能。
文科才能方面,其在创意写作、推理总结等方面才能均有提高,可为教育、内容产业等垂直利用场景供应辅助;文科才能方面,其数理、代码及推理等方面才能也进行了增强,官方表示可为金融、数据分析等场景落地供应基础。
目前,日日新 5.0 大模型已经正式面向全网用户开放,点此直达
商汤方面表示,在小米汽车 SU7 的智能座舱内也利用了商汤大模型技术,小爱同学接纳了鉴于商汤端云大模型的解决方案,可为车主供应智能化交互体验。