字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品

作者：清源

2024-12-18 11:33

豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用，可完成智能训练、数据合成和数字资产制作，官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

AI在线从字节跳动官方获悉，在今日的火山引擎 Force 大会上，字节跳动正式发布豆包视觉理解模型，为企业提供多模态大模型能力。豆包视觉理解模型千 tokens 输入价格仅为 3 厘，一元钱就可处理 284 张 720P 的图片，官方宣称比行业价格便宜 85％。

豆包 3D 生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台 veOmniverse 结合使用，可完成智能训练、数据合成和数字资产制作，官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。

豆包大模型旗下多款产品也迎来了更新：

豆包通用模型 pro：全面对齐 GPT-4o，使用价格仅为后者的 1/8；
音乐模型：可生成 3 分钟的完整作品；
文生图模型 2.1 版本：精准生成汉字、一句话 P 图，已接入即梦 AI 和豆包 App。

此外，豆包将于明年春季推出具备更长视频生成能力的豆包视频生成模型 1.5 版，豆包端到端实时语音模型也将很快上线，从而解锁多角色演绎、方言转换等新能力。

字节发布豆包视觉理解、3D 生成等新模型，豆包音乐模型可生成 3 分钟作品

相关标签：

字节跳动豆包即梦

相关资讯

消息称字节跳动提升即梦产品优先级，尝试打造“AI 时代的抖音”

消息称字节跳动提升即梦产品优先级，尝试打造“AI 时代的抖音”

据“智能涌现”今日援引知情人士消息称，字节跳动已经提升了即梦的产品优先级，尝试用新的路径打造“AI时代的抖音”。

AI在用 | 穿越了！3款AI工具让梵高、莫扎特们「活」在当下

AI在用 | 穿越了！3款AI工具让梵高、莫扎特们「活」在当下

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。最近，有博主将一堆世界名人的自画像制成了动画，吸引了不少网友围观。例如，文森特・梵高略带忧郁地抚摸着红色的络腮胡子：一副贵族气质的莫扎特摆弄起礼服：写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑：贝多芬忘我地拉着小提琴：还有达芬

谨以此文，向飞天奖的AI整活视频「致敬」

谨以此文，向飞天奖的AI整活视频「致敬」

AI好好用报道编辑：杨文5款对口型的AI产品，总有一款适合你。AI 最大的受害者，原来是娱乐圈的明星们。咋回事呢？前段时间，飞天奖官方整了个花活儿，让明星和电视剧中的 AI 角色合唱了一首《中国梦・我的梦》。那效果，简直一言难尽……（视频来源：B 站博主神仙颜颜_)视频链接：「扎心」：这个东西一端上来就有种淡淡的疯感。台下明星笑得最真心的一次。天呐唐嫣那个... 我都想替她报警了。每一个都好离谱又恐怖，李沁都没牙齿了。不会整就不要整啊，太抽象了，我真的是哈哈哈哈哈哈哈。第一个胡歌出来我就没绷住。笑死我了，满脑子都是

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架阿里云与黑芝麻智能完成大模型车载芯片级适配类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云