AI在线 AI在线

豆包大模型

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

这几天的大模型圈子,特别热闹。 凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。
4/17/2025 8:49:00 PM
机器之心

豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。 这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。 豆包1.5·深度思考模型在专业领域推理任务中表现出色,数学推理 AIME2024测试得分追平 OpenAI o3-mini-high,编程竞赛 Codeforces pass@8得分接近 OpenAI o1,科学推理 GPQA 得分接近 o3-mini-high,均达到或接近全球第一梯队。
4/17/2025 2:01:15 PM
AI在线

推理能力飞跃?豆包1.5深度思考模型即将正式服务企业

火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。 官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。 此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。
4/16/2025 6:01:15 PM
AI在线

字节跳动豆包大模型团队召开全员会,探索 AI 新高度

在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。 会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。 会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。
3/19/2025 9:39:00 AM
AI在线

字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开

据介绍,豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线,已服务上亿 C 端用户。
3/12/2025 1:26:51 PM
问舟

字节音效生成模型来了,一键生成大片感音效!已上线即梦

在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
3/11/2025 5:17:00 PM
机器之心

大模型效率狂飙:字节COMET技术开源,提速1.7倍

字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。 该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。 图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。
3/10/2025 5:59:00 PM
AI在线

字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景

2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
3/6/2025 10:24:47 AM
问舟

字节跳动豆包小范围测试深度思考模型,并非接入 DeepSeek

字节跳动旗下AI助手豆包正小范围测试自研深度思考模型,非DeepSeek接入。部分用户已体验思维链功能,官方确认正在测试不同实验版本。
2/25/2025 3:56:09 PM
问舟

超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 2:11:00 PM
机器之心

豆包:视频生成模型 “VideoWorld” 已开源 实现纯视觉学习

据豆包大模型团队官方公众号消息,在北京交通大学和中国科学技术大学的联合研究下,由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。 这个模型的最大亮点在于,它不再依赖传统的语言模型,而是仅凭视觉信息就能认知和理解世界。 这一突破性的研究灵感来源于李飞飞教授在 TED 演讲中提到的 “幼儿可以不依靠语言理解真实世界” 的理念。
2/10/2025 2:22:00 PM
AI在线

Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/27/2025 8:33:00 PM
机器之心

百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

马上就要进入蛇年了,国内的 AI 厂商们却完全没有闲下来的意思,正在春节前扎堆发布各自的新一代大模型。 本周一,豆包刚刚上线了全新的实时语音功能,可说是在中文语音对话方面做到了断崖式领先,为终端用户带来了智商与情商双高的实时语音助手和聊天伙伴。 第二天,月之暗面与 DeepSeek 都各自推出了可比肩满血版 o1 的推理模型,吸引了中外无数眼球。
1/23/2025 12:01:00 PM
机器之心

百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%

据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。
1/22/2025 6:13:02 PM
清源

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

12月30日,字节豆包大模型对外披露2024全领域技术进展。 距5月15日首次亮相仅7个月,豆包大模型在通用语言、视频生成、语音对话、视觉理解等方面模型能力均已跨入国际第一梯队。 豆包大模型团队表示,“从孩童般学语,到懵懂看世界,到为创作者绘出想象中的奇幻梦境,一切依然处于最早期。
12/30/2024 3:15:07 PM

豆包视觉理解模型惊艳亮相:首次评测就排名全球第二

12 月 18 日-19 日,火山引擎 FORCE 原动力大会・冬正式在上海举行。本次大会最引人关注的看点,无疑就是豆包大模型家族的全线升级,以及全新豆包视觉理解模型的发布
12/23/2024 2:50:02 PM
汐元

豆包说要「普惠」,于是大模型处理图片按「厘」计价了

这段时间,OpenAI 宣告连续 12 轮轰炸,让 2024 年底的大模型领域热闹起来了。 但坚持每个凌晨看直播的话会发现,越到后面的发布越平淡,内心的波动也越少了。 今年的大模型就卷到这里了吗?
12/23/2024 1:06:00 PM
机器之心

抖音副总裁李亮:希望用更低成本推动 AI 技术普惠和应用发展

在昨日举行的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。
12/19/2024 3:35:58 PM
浩渺