资讯列表
字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频
字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒|Adobe&MIT新研究
AI生成视频,边生成边实时播放,再不用等了! Adobe与MIT联手推出自回归实时视频生成技术——CausVid。 思路就像从下载整部电影到直接观看流媒体的转变,在模型生成首帧画面后,视频便可以即时播放,后续内容则动态生成并无缝衔接。
看3.2亿帧视频学会3D生成,智源开源See3D:只需单图即可生成3D场景
近日,著名AI学者、斯坦福大学教授李飞飞团队WorldLabs推出首个「空间智能」模型,仅输入单张图片,即可生成一个逼真的3D世界,这被认为是迈向空间智能的第一步。 几乎同时,国内智源研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D—See Video, Get 3D。 △See3D支持从文本、单视图和稀疏视图到3D的生成,同时还可支持3D编辑与高斯渲染不同于传统依赖相机参数(pose-condition)的3D生成模型,See3D采用全新的视觉条件(visual-condition)技术,仅依赖视频中的视觉线索,生成相机方向可控且几何一致的多视角图像。
2025年企业对AI的期望
AI驱动的变革即将到来,但2025年将是缓慢而稳步进展的一年。 今年,随着更现实的期望占据主导,围绕AI的初步炒作和兴奋已经平息。 对于企业部署而言,这一点尤其明显,因为现有模型的能力与许多业务工作流的复杂性相结合,导致进展比许多人预期的要慢。
扎克伯格:Meta AI 全球月活跃用户逼近 6 亿
Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)于 3 天前在 Threads 上发布动态,表示在 Llama 3.3 模型的帮助下,目前 Meta AI 的月活用户数量逼近 6 亿。
ChatGPT 高级语音模式主创“自立门户”:新公司估值达 2 亿美元,打造有情感的 AI 语音交互
前 OpenAI 研究员 Alexis Conneau 最新创立 WaveForms AI,目前已获 a16z 4000 万美元种子轮融资,剑指音频 AI 交互领域。
和 DALL-E 交锋:X 向 Premium 用户开放 Aurora 文生图 AI 模型
科技媒体 testingcatalog 昨日(12 月 9 日)发布博文,报道称埃隆・马斯克旗下的 xAI 公司面向 X 平台 Premium 订阅用户,开放了名为 Aurora 的 AI 文生图模型。
Meta 推出 SPDL 工具:突破训练 AI 模型数据效率瓶颈,吞吐量提升 2-3 倍
训练 AI 模型的瓶颈,目前不再仅仅是架构设计,数据管理效率也至关重要。Meta AI 最新推出了开源可扩展且高性能的数据加载(SPDL)工具,通过提升数据加载效率,最终加快 AI 训练速度。
重磅!谷歌Willow量子芯片横空出世:解决量子计算三十年难题,马斯克惊叹,Altman祝贺
刚刚谷歌 CEO 劈柴哥激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! Willow 在基准测试中取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!
马斯克机器人蒙眼户外溜达,45°斜坡跑着下!网友:只有一点小“脚滑”
眼睛唰一下就亮了! ! 特斯拉Optimus机器人又又又更新视频了。
小雨智造:小米系首家工业具身大模型公司崛起,国家队助力产业化落地
近日,小米投资的首家大模型机器人公司——北京小雨智造科技有限公司(以下简称“小雨智造”)宣布完成亿元A轮融资。 本轮融资由北京信息产业发展投资基金独家投资,这是继天使轮获得小米集团、王田苗教授、北京智源研究院等亿元投资后,小雨智造再次获得亿元级别的融资。 小雨智造:工业具身大模型的领军者小雨智造专注于开发适用于工业领域的大模型机器人技术,旨在为机器人打造能够适应各种任务的“通用大脑”。
无惧大平移!MMLab最新FreeSim:渐进迭代拿下3m平移新视角
写在前面 & 笔者的个人理解最新重建方面的工作是真多啊,基本上大家都在卷仿真重建。 今天分享MMLab最新的工作,提出了FreeSim。 一种用于自动驾驶的相机仿真方法。
特斯拉的 Optimus 人形机器人征服崎岖地形,不依赖视觉系统
特斯拉发布了一段视频,展示了其人形机器人 Optimus 在复杂地形上行走的最新进展。视频显示,Optimus 能够在布满护根物的山丘斜坡上稳步行走。特斯拉 CEO 埃隆・马斯克在社交媒体上表示,该机器人能够通过神经网络控制其电动肢体,无需远程操控即可实现在这种崎岖的地形上行走。
马云现身支付宝20周年纪念日:AI将改变一切,但不意味着决定一切
12月8日,支付宝和蚂蚁集团迎来了20周年纪念日。 在这个特别的日子里,马云,这位阿里巴巴集团的创始人,罕见地公开露面,亲自前往蚂蚁集团的园区,向员工们表达了他的鼓励和支持。 马云首先向蚂蚁集团表达了他的祝福,他提到:“我很高兴能与大家共同庆祝支付宝的20岁生日。
LLM很难变成AGI?科学家:创造AGI理论上可行
今年9月份OpenAI对外宣称,AI能力达到新等级,相比之前的LLM,新AI更接近人类的思考能力。 OpenAI的断言引起争论:到底还要等多久机器才能具备人类大脑一样的认知能力?大家争论的智能就是所谓的AGI,它可以帮助人类解决复杂问题,比如气候变化、大流行、癌症治疗等等。 AGI充满不确定,它也会给人类带来风险。
刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!
OpenAI 12 天连更的第三个工作日,重磅发布终于来了! 正如直播之前大家在评论区预想的一样,视频生成大模型 Sora 正式版终于露面! 算起来,距离今年 2 月 16 日 Sora 的发布已经过去了近 10 个月的时间。
多榜单SOTA!SplatAD:首个实现Lidar & 视觉重建大一统框架,仿真闭环再下一城~
写在前面&笔者的个人理解在实际部署之前,大规模测试对于确保自动驾驶汽车 (SDV) 等自主机器人的安全至关重要。 从收集的日志中生成数字孪生的数据驱动方法提供了一种可扩展的方式来构建多样化、逼真的测试仿真环境。 与成本高昂、耗时且受物理约束限制的实际测试不同,模拟可以快速、低成本地探索多种场景,有助于优化自动驾驶车辆的安全性、舒适性和效率。
AI Agent重塑微服务治理
1.项目背景传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。 大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。 商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。