AI
陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战
今天,谷歌DeepMind重磅发起「AI赋能数学计划」,集结了全球五大顶尖机构。 他们将用上谷歌最强数学AI,去探索发现新的疆域。 这其中,有夺下IMO金牌的Gemini Deep Think,有算法发现AI智能体AlphaEvolve,还有形式化证明自动补全AlphaProof。
10/30/2025 4:08:28 PM
Meta AI部门大地震!小扎急派心腹干将「救火」
Meta AI部门再现人事大地震! 刚刚,Meta传出重大人事调整:前元宇宙负责人Vishal Shah将转岗至Meta超级智能实验室,担任人工智能产品副总裁,并向Nat Friedman汇报。 这是Meta AI部门最新一次高管调整。
10/30/2025 4:05:42 PM
中科院联合清华等发布视觉语言行动推理模型VLA-R1,让机器人先思考再行动
还记得 DeepSeek R1吗? 它实现了大语言模型先思考再回答。 刚刚,中科院自动化所、清华和GigaAI联合发布视觉-语言-行动(Vision-Language-Action, VLA)模型的R1推理版本。
10/30/2025 4:04:35 PM
英伟达市值突破5万亿美元,推动 AI 行业蓬勃发展
英伟达(Nvidia)近日成为全球最有价值的公司,其市值突破了5万亿美元。 这一里程碑不仅标志着英伟达在市场中的主导地位,更反映了整个人工智能(AI)行业的蓬勃发展。 英伟达的图形处理单元(GPU)在过去三年里驱动了 AI 技术的快速增长,其创始人兼分析师 R "Ray" Wang 表示:“AI 的开始和结束都与英伟达息息相关。
10/30/2025 3:36:19 PM
AI在线
大模型去全球接单平台赚外快,98%惨遭老板退货!ScaleAI宣布新智能体基准:AI绝对自动化几乎为0,大多知名基准过时、封闭
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)如果让大模型去外包平台去接单,它真的可以赚到钱吗? 现在终于有专业的评测机构站出来公布答案了。 不用硬夸AI,事实是让它接单,它会饿死。
10/30/2025 1:30:49 PM
云昭
当“骆驼打包行李”难倒AI:ImagerySearch如何让视频模型学会想象?
大家好,我是肆〇柒。 今天我们一起阅读一篇来自中国科学院大学(UCAS)、阿里巴巴高德地图(AMAP)与中科院智能系统与工程研究中心(CRISE) 联合团队的最新工作——《ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints》。 这项研究直面当前视频生成模型在“想象力任务”中的系统性失效,提出了一种无需额外训练、仅靠测试时自适应策略即可显著提升长距离语义生成能力的新范式。
10/30/2025 9:18:59 AM
肆零柒
英伟达,全球首个5万亿美元公司诞生!「GPU帝国」超日本德国GDP
今夜,英伟达再次创造历史! 受GTC大会的影响,英伟达股价上涨4.15%,成为首家市值突破5万亿美元的公司! 这是一个前所未有的里程碑,不仅是英伟达,不仅是GPU芯片,更是AI时代的里程碑。
10/30/2025 9:18:35 AM
阿里新研究:统一了VLA和世界模型
如果说视觉让AI看见世界,动作让AI改变世界,那么——WorldVLA正在让AI理解世界。 顾名思义,WorldVLA是一个将视觉语言动作模型(VLA)与世界模型相融合的统一框架,由阿里巴巴达摩院、湖畔实验室和浙江大学共同提出。 在该框架下,世界模型通过结合对动作与图像的理解来预测未来图像,旨在学习环境的潜在物理规律,以提升动作生成的准确性;动作模型则基于图像观测生成后续动作,不仅有助于视觉理解,还反向促进世界模型的视觉生成能力。
10/30/2025 8:53:34 AM
估值上万亿、现金流见底:AI盛宴背后的真相没人敢说
最具价值的私有AI初创,都有谁? 投资人Deedy Das总结了目前估值最高的15家AI初创,以及最新的公开的营收和增长情况。 图片OpenAI、xAI和Anthropic毫无意外霸榜前三。
10/30/2025 8:10:03 AM
新智元
一文讲透AI Agent开发中的human-in-the-loop
前段时间确实有点忙,好久没有发文了。 不过最近有好多AI技术方面的想法要跟大家分享:-)今天我们主要聊一聊在AI Agent开发中非常重要的一个特性:human-in-the-loop。 为什么需要human-in-the-loop?
10/30/2025 12:55:00 AM
张铁蕾
GEEKCON上的那一拳,击碎了具身智能的安全幻觉
如果上一代网络病毒的破坏还停留在“删光你的文件”,那么具身智能时代的安全威胁,可能已经升级为“砸烂你的家,甚至伤害你的人”。 当AI拥有了身体,从数字世界踏入物理世界,其安全问题也从屏幕后的隐忧,变成了房间里的“大象”——我们无法忽视,且刻不容缓。 “GEEKCON 2025”上的一拳上周的10月24号,发生在“GEEKCON 2025”安全极客大赛上的真实一幕引发了热议:两名“白帽黑客”——屈师培和徐梓凯,通过漏洞成功劫持了主办方提供的某知名品牌人形机器人,控制了机器人的“行为”。
10/29/2025 6:08:00 PM
新闻资讯
单条演示即可抓取一切:北大团队突破通用抓取,适配所有灵巧手本体
在灵巧手通用抓取的研究中,由于动作空间维度高、任务具有长程探索特征且涉及多样化物体,传统强化学习(RL)面临探索效率低、奖励函数及训练过程设计复杂等挑战。 基于此,北京大学及BeingBeyond团队提出DemoGrasp框架——一种简单且高效的通用灵巧手抓取学习方法。 该方法以一次成功的抓取演示轨迹为起点,通过对轨迹中的机器人动作进行编辑,以适应不同物体与姿态:改变腕部位姿用于确定“抓取位置”,调整手指关节角度用于确定“抓取方式”。
10/29/2025 4:38:26 PM
MetaAI解锁Transformer潜意识,仅额外3%计算开销,性能提升最高55%
Meta FAIR部门的研究员François Fleuret发布了一篇名为《The Free Transformer》的论文,提出了一种对现有解码器Transformer模型的精妙扩展。 这项技术的核心,是让模型在生成每个字之前,能先在内部形成一个类似计划或草稿的隐性决策,而不是像过去那样,只能边写边想。 实验证明,这种先计划,后执行的模式,在编程、数学和推理等任务上带来了显著的性能提升。
10/29/2025 4:20:57 PM
AI「上班流」首次完整曝光!不点鼠标,只写代码,PPT也当函数调
AI可以写代码、做PPT、生成图片,甚至梳理财务表格,早就屡见不鲜。 但人们关注的,往往只是结果:代码能不能运行? 图片有没有AI痕迹?
10/29/2025 4:16:58 PM
新智元
清华姚班团队,开源具身智能视觉语言动作(VLA)模型工具箱,打造行业通用技术底座
一群来自清华姚班、前旷视科技的核心人物,决定为具身智能领域建立一套通用准则,叫Dexbotic。 Dexbotic是基于PyTorch的视觉语言动作(Vision-Language-Action,VLA)模型工具箱。 目的是为具身智能领域的专业人士提供一站式VLA研究服务,由一家叫原力灵机(Dexmal)的具身智能公司开发。
10/29/2025 4:11:39 PM
美团杀入视频生成模型赛道,LongCat-Video 136亿参数媲美顶尖模型,效率提升10倍
又是美团! 美团最近在AI领域的开源动作,真是令人刮目相看。 刚刚,美团LongCat团队发布了LongCat-Video的基础视频生成模型,它拥有136亿的参数量,能在数分钟内生成720p、30帧每秒的高质量视频,并且在文本转视频、图像转视频和长视频续写等多个任务上都表现出色。
10/29/2025 4:10:41 PM
天下苦VAE久矣:阿里高德提出像素空间生成模型训练范式, 彻底告别VAE依赖
近年来,基于扩散模型的图像生成技术发展迅猛,催生了Stable Diffusion、Midjourney等一系列强大的文生图应用。 然而,当前主流的训练范式普遍依赖一个核心组件——变分自编码器(VAE),这也带来了长久以来困扰研究者们的几个问题:训练复杂性:VAE旨在将高维图像压缩至低维隐空间,并能从中重建图像。 但其训练过程需要在压缩率和重建质量之间取得精妙平衡,本身就极具挑战。
10/29/2025 4:06:10 PM
刚刚,最佳VLA模型GigaBrain-0开源:世界模型驱动10倍数据,真机碾压SOTA
近日,在湖北武汉东湖高新区,极佳视界与湖北人形机器人创新中心完成战略合作签约,并联合发布端到端VLA「具身基础模型」GigaBrain-0。 这是国内首个利用「世界模型」生成数据实现真机泛化的视觉-语言-动作(VLA)基础模型,旨在通过世界模型为中心,无论在数据侧还是模型侧,彻底改变通用机器人大脑的开发方式。 GigaBrain-0拥有当前最先进的VLA模型架构,同时支持图像、点云、文本、本体状态的输入,输出结构化的任务规划和运动规划,并在大规模的数据上完成预训练,可以实现更精准的移动导航和长序列的复杂操作。
10/29/2025 4:04:51 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测