AI在线 AI在线

百度文小言官宣支持多模型调度,升级端到端语音大模型、图片问答能力

作者:远洋
2025-03-31 03:22
百度文小言宣布品牌焕新与功能升级,支持多模型融合调度,全新语音大模型和图片问答能力大幅提升交互体验。#AI技术##百度文小言#

今日在新一期百度 AI DAY 上,文小言宣布完成品牌焕新与功能升级。除品牌视觉形象焕新外,文小言聚焦模型开放与功能创新,支持多模型融合调度,升级全新语音大模型、图片问答、AI 生图生视频等多项能力。

文小言此次升级的核心亮点在于“多模型融合调度”。通过整合百度自研的文心 X1、文心 4.5 等模型,并接入 DeepSeek-R1、可灵等第三方优质模型,文小言实现了多模型间的智能协同。用户只需选择“自动模式”,即可一键调用最优模型组合,或根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

据AI在线了解,此次功能升级,文小言进一步提升了全新语音大模型、图片问答、AI 生图生视频等能力。全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可进行语音知识问答或趣味角色扮演。

百度语音首席架构师贾磊透露,该模型是百度在业界首个推出、基于全新互相关注意力 (Cross-Attention) 的端到端语音语言大模型。在语音场景满足一定交互指标下,大模型调用成本比行业平均降低 50%-90%,推理响应速度极快,将语音交互等待时间压缩至 1 秒左右,极大提升了交互流畅性。同时,在大模型加持下,实现了流式逐字的 LLM 驱动的多情感语音合成,情感饱满、逼真、拟人,交互听感也得到极大提升。

图片问答功能让用户可以通过拍摄或上传图片,以文字或语音提问直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。

值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。

相关标签:

相关资讯

实测文小言升级:开始「卷体验」的百度都眉清目秀了

刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。 3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题讲解等多种新功能。 新功能听起来很厉害,但实际使用效果又如何?
4/7/2025 11:20:00 AM
郑佳美

百度副总裁薛苏:“文小言”月活超千万,今年 Q2 累计调用量达 20 亿次

百度今天早些时候官宣文心一言 App 正式升级为文小言,定位百度旗下“新搜索”智能助手。据新浪科技,在媒体沟通会上,百度副总裁、AI 创新业务负责人薛苏透露,文小言的 MAU(AI在线注:Monthly Active User,月活跃用户数量)已超千万,2024 年 Q2 累计调用量达到 20 亿次,季环比增速超过 70%。今天早些时候,百度文心一言 App(时名)获推 4.0.0 版本升级并更名为“文小言”。升级后的“文小言”是百度旗下新搜索智能助手,基于文心大模型,提供搜索、创作、聊天等 AI 能力。怎么问都可
9/4/2024 2:49:45 PM
清源

百度文小言(原文心一言)App 接入 DeepSeek-R1 模型

iOS 版百度文小言(原文心一言)App 日前迎来了 4.9.0 版本更新,更新描述称该版本已接入 DeepSeek-R1 模型,优化拍照解题功能。
2/11/2025 8:17:48 AM
远洋