字节跳动
字节跳动豆包新版深度思考开启测试,支持边想边搜
据介绍,和之前的深度思考不同,新版功能将推理过程的思维链与搜索深度结合,支持边想边搜。思考过程中,豆包可基于推理多次调用工具、搜索信息,提供更加全面、准确的结果。
前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人
近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。 据悉,解浚源目前任职千寻智能具身智能部负责人,全面负责具身大模型的研发工作。 解浚源,本科毕业于中国科学技术大学,博士毕业于美国华盛顿大学。
字节跳动豆包大模型团队召开全员会,探索 AI 新高度
在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。 会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。 会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。
告别“无声视频”尴尬!字节AI音效生成模型SeedFoley上线即梦 一键生成大片感音效
还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核心奥秘在于它采用了革命性的端到端架构,如同一个精密的声音魔术师,巧妙地融合了视频的时空特征与强大的扩散生成模型,实现了音效与视频内容的高度同步和完美契合。 简单来说,SeedFoley首先会对视频进行抽帧分析,就像给视频做CT扫描一样,提取出每一帧画面的关键信息,再通过一个视频编码器深度解读视频内容,理解视频中发生了什么,然后将这些视频理解投射到条件空间,为后续的音效生成指明方向。 在音效生成的高速公路上,SeedFoley采用了改进的扩散模型框架,如同拥有无限创意的声音设计师,根据视频内容,智能生成与之完美匹配的音效方案。
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
据介绍,豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线,已服务上亿 C 端用户。
字节音效生成模型来了,一键生成大片感音效!已上线即梦
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。 实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。 北大博士瑞晨曾经不得已搁置的想法,也在这里实现了大规模验证。
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。 全网一片夸赞,很少能看见批评的声音。 现在,虽然 Trae 的热度已经有所退减,但仍旧是非常值得我们关注的 AI IDE。
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
即梦 AI 上线 “动作模仿” 功能:照片 + 参考视频即可让人物动起来
用户从“数字人”入口进入,只需上传一张人物图片和一条参考视频,就能生成一条动态视频,让图片里的人物模拟参考视频中的人物动作,亦能实现情绪的一比一还原。
DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
字节旗下又一应用“悟空浏览器”接入 DeepSeek,下一步或是抖音
尽管此前,字节跳动旗下飞书和火山引擎相继宣布接入 DeepSeek,但与这些产品有所不同,悟空浏览器更偏向 C 端用户,并且是融合了抖音 + 番茄小说的内容端 App。
报道称字节跳动旗下AI产品 “即梦” 考虑接入 DeepSeek
据“晚点 LatePost”报道,字节跳动旗下的 AI 产品 “即梦” 正在考虑接入热门 AI 工具 DeepSeek。 报道提到,用户可以先利用 DeepSeek 生成更加精细的视频脚本,然后再将其输入即梦进行视频制作。 这种结合将为用户带来更高效、更专业的创作体验。
消息称字节跳动 AI 视频生成产品“即梦”考虑接入 DeepSeek
据“晚点LatePost”昨日报道,继飞书之后,字节跳动AI视频生成产品“即梦”正在考虑使用DeepSeek。
字节跳动豆包小范围测试深度思考模型,并非接入 DeepSeek
字节跳动旗下AI助手豆包正小范围测试自研深度思考模型,非DeepSeek接入。部分用户已体验思维链功能,官方确认正在测试不同实验版本。
超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
消息称字节AI 核心部门Seed大调整 ,吴永辉博士或成核心人物
据多位接近字节跳动的人士透露,字节跳动的 AI 核心部门 Seed 正在经历快速的战略调整和人事变动。 刚刚从谷歌加入字节跳动的 AI 领域权威专家、曾参与 Gemini 开发的 Google Fellow 吴永辉博士,将接替原 LLM 团队及 Seed 总负责人朱文佳,成为 Seed 部门的新负责人。 目前,团队内部正在进行汇报关系的梳理和调整。