字节跳动
前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人
近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。 据悉,解浚源目前任职千寻智能具身智能部负责人,全面负责具身大模型的研发工作。 解浚源,本科毕业于中国科学技术大学,博士毕业于美国华盛顿大学。
3/21/2025 1:01:00 PM
机器之心
字节跳动豆包大模型团队召开全员会,探索 AI 新高度
在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。 会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。 会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。
3/19/2025 9:39:00 AM
AI在线
告别“无声视频”尴尬!字节AI音效生成模型SeedFoley上线即梦 一键生成大片感音效
还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核心奥秘在于它采用了革命性的端到端架构,如同一个精密的声音魔术师,巧妙地融合了视频的时空特征与强大的扩散生成模型,实现了音效与视频内容的高度同步和完美契合。 简单来说,SeedFoley首先会对视频进行抽帧分析,就像给视频做CT扫描一样,提取出每一帧画面的关键信息,再通过一个视频编码器深度解读视频内容,理解视频中发生了什么,然后将这些视频理解投射到条件空间,为后续的音效生成指明方向。 在音效生成的高速公路上,SeedFoley采用了改进的扩散模型框架,如同拥有无限创意的声音设计师,根据视频内容,智能生成与之完美匹配的音效方案。
3/13/2025 10:27:00 AM
AI在线
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
据介绍,豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线,已服务上亿 C 端用户。
3/12/2025 1:26:51 PM
问舟
字节音效生成模型来了,一键生成大片感音效!已上线即梦
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
3/11/2025 5:17:00 PM
机器之心
“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。 实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。 北大博士瑞晨曾经不得已搁置的想法,也在这里实现了大规模验证。
3/10/2025 6:46:00 PM
机器之心
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋
字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。 全网一片夸赞,很少能看见批评的声音。 现在,虽然 Trae 的热度已经有所退减,但仍旧是非常值得我们关注的 AI IDE。
3/8/2025 3:28:00 PM
机器之心
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
3/6/2025 10:24:47 AM
问舟
即梦 AI 上线 “动作模仿” 功能:照片 + 参考视频即可让人物动起来
用户从“数字人”入口进入,只需上传一张人物图片和一条参考视频,就能生成一条动态视频,让图片里的人物模拟参考视频中的人物动作,亦能实现情绪的一比一还原。
3/5/2025 3:53:26 PM
清源
DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴
字节旗下又一应用“悟空浏览器”接入 DeepSeek,下一步或是抖音
尽管此前,字节跳动旗下飞书和火山引擎相继宣布接入 DeepSeek,但与这些产品有所不同,悟空浏览器更偏向 C 端用户,并且是融合了抖音 + 番茄小说的内容端 App。
2/27/2025 8:11:48 AM
罗宁
报道称字节跳动旗下AI产品 “即梦” 考虑接入 DeepSeek
据“晚点 LatePost”报道,字节跳动旗下的 AI 产品 “即梦” 正在考虑接入热门 AI 工具 DeepSeek。 报道提到,用户可以先利用 DeepSeek 生成更加精细的视频脚本,然后再将其输入即梦进行视频制作。 这种结合将为用户带来更高效、更专业的创作体验。
2/26/2025 10:06:00 AM
AI在线
消息称字节跳动 AI 视频生成产品“即梦”考虑接入 DeepSeek
据“晚点LatePost”昨日报道,继飞书之后,字节跳动AI视频生成产品“即梦”正在考虑使用DeepSeek。
2/26/2025 7:39:07 AM
清源
字节跳动豆包小范围测试深度思考模型,并非接入 DeepSeek
字节跳动旗下AI助手豆包正小范围测试自研深度思考模型,非DeepSeek接入。部分用户已体验思维链功能,官方确认正在测试不同实验版本。
2/25/2025 3:56:09 PM
问舟
超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 2:11:00 PM
机器之心
消息称字节AI 核心部门Seed大调整 ,吴永辉博士或成核心人物
据多位接近字节跳动的人士透露,字节跳动的 AI 核心部门 Seed 正在经历快速的战略调整和人事变动。 刚刚从谷歌加入字节跳动的 AI 领域权威专家、曾参与 Gemini 开发的 Google Fellow 吴永辉博士,将接替原 LLM 团队及 Seed 总负责人朱文佳,成为 Seed 部门的新负责人。 目前,团队内部正在进行汇报关系的梳理和调整。
2/21/2025 1:57:00 PM
AI在线
字节跳动豆包UltraMem架构将大模型推理成本降低83%
字节跳动豆包大模型团队今日宣布,成功研发出全新稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家)模型推理时的高额访存问题,推理速度较MoE提升2-6倍,推理成本最高可降低83%。 这一突破性进展为大模型的高效推理开辟了新路径。 UltraMem架构在保证模型效果的前提下,成功解决了MoE架构推理时的访存瓶颈。
2/12/2025 2:04:00 PM
AI在线
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
人形机器人
深度学习
AI视频
模态
字节跳动
xAI
驾驶
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型