豆包大模型

刚刚，豆包1.5·深度思考模型上线，特供「视觉版本」，大模型多模态推理的时代真来了

这几天的大模型圈子，特别热闹。凌晨是 OpenAI 的 o3 和 o4-mini，一觉醒来，国内这边的豆包大模型又上新了一波。巧合的是，都是能看懂图像、能调用工具的新一代推理模型。

4/17/2025 8:49:00 PM

机器之心

豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

豆包大模型近日发布了系列更新，其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API，供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平，并在视觉推理和图像生成方面取得了显著进展。豆包1.5·深度思考模型在专业领域推理任务中表现出色，数学推理 AIME2024测试得分追平 OpenAI o3-mini-high，编程竞赛 Codeforces pass@8得分接近 OpenAI o1，科学推理 GPQA 得分接近 o3-mini-high，均达到或接近全球第一梯队。

4/17/2025 2:01:15 PM

AI在线

推理能力飞跃?豆包1.5深度思考模型即将正式服务企业

火山引擎今日发布活动预热，正式宣布其新款豆包大模型将于明日（4月17日）在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示，此次发布会将带来豆包大模型家族的全新升级，并特别推出备受瞩目的豆包1.5深度思考模型。此前已有消息透露，豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。

4/16/2025 6:01:15 PM

AI在线

字节跳动豆包大模型团队召开全员会，探索 AI 新高度

在人工智能领域蓬勃发展的背景下，字节跳动的豆包大模型团队（Seed）近日召开了一次全员会议，标志着该团队在未来发展方向上的重要决策。会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持，这也是两位领导首次同台出席，吸引了业内的广泛关注。会议上，朱文佳和吴永辉明确表示，Seed 团队的首要目标是 “探索智能上限”，这将成为团队未来工作的核心导向。

3/19/2025 9:39:00 AM

AI在线

字节跳动豆包文生图技术报告发布：数据处理、预训练、RLHF 全流程公开

据介绍，豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线，已服务上亿 C 端用户。

3/12/2025 1:26:51 PM

问舟

字节音效生成模型来了，一键生成大片感音效！已上线即梦

在 AIGC 持续突破视频生成边界的当下，音效制作仍是制约行业发展的瓶颈。字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型，通过端到端架构实现了视频音效的智能生成，将 AI 视频创作带入「有声时代」。相关功能「AI 音效」已在即梦上线，用户使用即梦生成视频后，选择「AI 音效」功能，即可生成 3 个专业级音效方案。

3/11/2025 5:17:00 PM

机器之心

大模型效率狂飙：字节COMET技术开源，提速1.7倍

字节跳动旗下豆包大模型团队近日宣布，成功攻克混合专家模型（MoE）架构的关键瓶颈，并开源一项名为COMET的重大优化技术。该技术显著提升了大模型的训练效率，实现了高达1.7倍的效率提升，并有效降低了40%的训练成本。图源备注:图片由AI生成，图片授权服务商Midjourney据介绍，COMET技术已在字节跳动的万卡集群训练中得到实际应用，累计节省了数百万GPU小时的训练算力。

3/10/2025 5:59:00 PM

AI在线

字节跳动豆包上线「深度思考」推理模式，覆盖问答、搜索、写作和阅读场景

2025 年 3 月 5 日，豆包宣布上线「深度思考」推理模式，全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式，用户只需在输入框打开「深度思考Beta」开关即可。

3/6/2025 10:24:47 AM

问舟

字节跳动豆包小范围测试深度思考模型，并非接入 DeepSeek

字节跳动旗下AI助手豆包正小范围测试自研深度思考模型，非DeepSeek接入。部分用户已体验思维链功能，官方确认正在测试不同实验版本。

2/25/2025 3:56:09 PM

问舟

超越DeepSeek-ProverV1.5！豆包首个形式化数学推理模型BFS-Prover来了，直接开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/25/2025 2:11:00 PM

机器之心

豆包：视频生成模型 “VideoWorld” 已开源实现纯视觉学习

据豆包大模型团队官方公众号消息，在北京交通大学和中国科学技术大学的联合研究下，由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。这个模型的最大亮点在于，它不再依赖传统的语言模型，而是仅凭视觉信息就能认知和理解世界。这一突破性的研究灵感来源于李飞飞教授在 TED 演讲中提到的 “幼儿可以不依靠语言理解真实世界” 的理念。

2/10/2025 2:22:00 PM

AI在线

Video Depth Anything来了！字节开源首款10分钟级长视频深度估计模型，性能SOTA

1/27/2025 8:33:00 PM

机器之心

百万tokens仅需8毛，不蒸馏造出世界一流大模型，豆包全新1.5Pro不走捷径

马上就要进入蛇年了，国内的 AI 厂商们却完全没有闲下来的意思，正在春节前扎堆发布各自的新一代大模型。本周一，豆包刚刚上线了全新的实时语音功能，可说是在中文语音对话方面做到了断崖式领先，为终端用户带来了智商与情商双高的实时语音助手和聊天伙伴。第二天，月之暗面与 DeepSeek 都各自推出了可比肩满血版 o1 的推理模型，吸引了中外无数眼球。

1/23/2025 12:01:00 PM

机器之心