交互效果对标 GPT-4o，商汤发布国内首个所见即所得模型“日日新 5o”

2024-07-05 01:51

商汤科技发布“日日新 SenseNova 5.5”大模型体系，并发布国内首个所见即所得模型“日日新 5o”，交互效果对标 GPT-4o。通过整合跨模态信息，基于声音、文本、图像和视频等多种形式，“日日新 5o”带来全新的 AI 交互模式 —— 实时的流式多模态交互。据介绍，“日日新 5o”能听、会看、更会找话题，就如同“真人聊天一般”，这种交互模式适用于实时对话和语音识别等应用，能够在同一模型中自然处理多种任务，且根据不同上下文自适应调整行为和输出。日日新 5.5 是国内首个正式发布的流式原生多模态交互模型，模型训

商汤科技发布“日日新 SenseNova 5.5”大模型体系，并发布国内首个所见即所得模型“日日新 5o”，交互效果对标 GPT-4o。

通过整合跨模态信息，基于声音、文本、图像和视频等多种形式，“日日新 5o”带来全新的 AI 交互模式 —— 实时的流式多模态交互。

据介绍，“日日新 5o”能听、会看、更会找话题，就如同“真人聊天一般”，这种交互模式适用于实时对话和语音识别等应用，能够在同一模型中自然处理多种任务，且根据不同上下文自适应调整行为和输出。

日日新 5.5 是国内首个正式发布的流式原生多模态交互模型，模型训练基于超过 10TB tokens 高质量训练数据，包括大量高质量的人工合成数据，构建了高阶思维链。模型采用混合端云协同架构，拥有 6000 亿参数，可最大限度发挥云边端协同，达到 109.5 字 / 秒的推理速度。

据IT之家此前报道，商汤科技在世界人工智能大会上还发布了首个“可控”人物视频生成大模型 Vimi，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，并支持多种驱动方式，可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

国内首个！商汤科技发布“日日新5o”，实时多模态流式交互对标GPT-4o

2024 年 7 月 5 日，上海 ——2024 世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2024）战略合作伙伴商汤科技召开 “大爱无疆・向新力” 人工智能论坛，发布国内首个所见即所得模型 “日日新 5o”，交互体验对标 GPT-4o，实现全新 AI 交互模式。通过整合跨模态信息，基于声音、文本、图像和视频等多种形式，国内首个所见即所得模型 “日日新 5o” 带来一种全新的 AI 交互模式，即实时的流式多模态交互。现场也为大家展示了这种创新交互模式 ——工作人员刚开始仅是和 “日日新 5o” 打个招

7/5/2024 3:02:00 PM

新闻助手

原生融合多模态上的突破，让商汤大模型打破Scaling Laws撞墙「魔咒」

基础模型的革新，才是通向未来之路。下一代 AI 的发展，似乎遇到了难以逾越的瓶颈。去年 12 月，OpenAI 在 ChatGPT 两周年期间连续发布了 12 天，我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。

1/21/2025 5:17:00 PM

机器之心

商汤科技拟募资 20.08 亿港元用于产品开发，7 月 5 日发布日日新 5.5 大模型

商汤科技今日发布公告，拟配售 B 类股份，总筹 20.08 亿港元（当前约 18.71 亿元人民币）。据《科创板日报》报道，商汤本次配售有多家战略投资人及头部海外基金入股，现有股东增持，募集资金将用于大模型研究及产品开发等。报道称，商汤将于 7 月 5 日世界人工智能大会上发布日日新 5.5 大模型。官方没有透露关于日日新 5.5 大模型的更多信息，而此前有国内媒体报道称，商汤日日新大模型“近期”将迎来重大升级。在长文本处理能力上，升级后的商汤大模型将最新支持 100 万字以上超长文本，同时最多一次支持 50 多个

6/21/2024 10:22:08 AM

清源

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练 DeepMind

顶部

交互效果对标 GPT-4o，商汤发布国内首个所见即所得模型“日日新 5o”

相关资讯

国内首个！商汤科技发布“日日新5o”，实时多模态流式交互对标GPT-4o

原生融合多模态上的突破，让商汤大模型打破Scaling Laws撞墙「魔咒」

商汤科技拟募资 20.08 亿港元用于产品开发，7 月 5 日发布日日新 5.5 大模型