AI在线 AI在线

资讯列表

LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘

视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。 图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
11/8/2024 1:29:00 PM
机器之心

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/8/2024 1:18:00 PM
机器之心

无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升

随着大语言模型在长文本场景下的需求不断涌现,其核心的注意力机制(Attention Mechanism)也获得了非常多的关注。 注意力机制会计算一定跨度内输入文本(令牌,Token)之间的交互,从而实现对上下文的理解。 随着应用的发展,高效处理更长输入的需求也随之增长 [1][2],这带来了计算代价的挑战:注意力高昂的计算成本和不断增长的键值缓存(KV-Cache)代价。
11/8/2024 1:12:00 PM
机器之心

智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板

前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。 为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。 这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问题(不过依然还相对简单)。
11/8/2024 1:06:00 PM
机器之心

聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/8/2024 1:03:00 PM
机器之心

云服务用户,实际在用真金白银帮助厂商构建AI成果

这才是堪称终极的商业模式。 云计算最天才的核心构想,就是让一家掌握大量IT预算(每年可能高达数亿美元)且拥有一定专业知识的大企业,先建立起规模远超自身需求的IT部门,为此砸下数十亿美元(到如今的AI时代,投资额甚至可能高达数百亿美元),再将绝大部分容量出租给第三方客户。 如此一来,单凭第三方租金基本就足以抵平云服务商自身的IT运营成本。
11/8/2024 12:46:04 PM

谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形

近日,谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面,研究人员开发了一种名为 SynthID-Text 的水印方案,已经在自家的 Gemini 上投入使用,跟踪 AI 生成的文本内容,使其无所遁形。
11/8/2024 12:32:02 PM
汪淼

谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形

君可知,我们每天在网上的见闻,有多少是出自AI之手? 图片除了「注意看! 这个男人叫小帅」让人头皮发麻,真正的问题是,我们无法辨别哪些内容是AI生成的。
11/8/2024 12:18:39 PM
新智元

杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了

弹窗攻击很有效,控制计算机的智能体根本顶不住。 前些天,Anthropic 为 Claude 带来一个极具变革意义的功能:Computer Use,也就是控制用户的计算机。 当时,Anthropic 在博客中写到:「在 OSWorld 这项测试模型使用计算机的能力的评估基准上,Claude 当前的准确度为 14.9%,虽然远远不及人类水平(通常为 70-75%),但却远高于排名第二的 AI 模型(7.8%)。
11/8/2024 11:02:00 AM
机器之心

Seed校招博士自述:我为什么选择来字节做大模型

原文来自知乎博主张逸霄对“大家能分享一下当前博士就业的情况吗”的回答。 人在英国,刚过答辩。 今年拿了腾讯 AI Lab(青云计划)、字节跳动(Seed) ,国外有之前实习的 Sony Research 和 Yamaha 的 return offer,国外也有正在面试的 Adobe 和 Meta。
11/8/2024 10:55:00 AM
机器之心

英伟达稳坐全球第一,成为新霸主!回顾这波AI潮的起源:辛顿、黄仁勋、李飞飞的历史交汇

出品 | 51CTO技术栈(微信号:blog51cto)“过去12年的AI热潮得益于三位在面对广泛批评时依然追求非传统理念的先驱。 一位是多伦多大学的Geoffrey Hinton,他几十年如一日地推广神经网络,尽管几乎所有人都怀疑它。 第二位是Nvidia的CEO黄仁勋,他早早意识到GPU不仅仅能用于图形处理。
11/8/2024 10:47:32 AM

程序员不应被AI取代写代码,而是写文档!谷歌大牛呼吁:老板们应该倾听开发者心声,现在的AI代码生成器操之过急,风险太大!

编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto)对于“AI帮助生产力提高”这件事情上,开发人员与他们的老板,意见其实非常不一致。 最近, Atlassian-DX DevEx 进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为 AI 是提高开发人员生产力和满意度的最有效方法,但高达三分之二的开发人员却不这么想,他们认为实际上没有任何显著的 AI 生产力提升。 众所周知,目前最热门的软件开发 AI 用例属于代码生成。
11/8/2024 10:25:58 AM
言征

AMD 发布首个 10 亿开源 AI 模型 OLMo,用 Instinct MI250 GPU 集群训练而成

AMD 公司于 10 月 31 日发布博文,宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo,为开发者和研究人员提供强大的 AI 研究工具。
11/8/2024 10:13:11 AM
故渊

三款出色的无代码LLM应用程序构建神器

译者 | 布加迪审校 | 重楼通过轻松地挑选和丢弃组件并连接组件来构建LLM应用程序,比如矢量存储区、web搜索、存储内容和自定义提示等组件。 许多商业人士和非技术人士向我询问如何在缺乏技术知识的情况下构建AI应用程序。 我总是告诉他们,市面上有许多非代码解决方案,它们易于使用,可以帮助他们为公司中的任何人构建原型并部署解决方案。
11/8/2024 9:53:01 AM
布加迪

免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍

现在,视频生成模型无需训练即可加速了? ! Meta提出了一种新方法AdaCache,能够加速DiT模型,而且是无需额外训练的那种(即插即用)。
11/8/2024 9:30:00 AM
量子位

类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!

Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有人做了这个尝试!
11/8/2024 9:24:00 AM
新闻助手

玩转「智能体魔方」!清华推出AgentSquare模块化搜索框架,开启AI智能体高速进化时代

优秀基因的演化和重组,是生命体适应环境、永葆活力的自然法则。 AI智能体能否像有机生命一样,实现适应任务环境的高效自我演化? 大模型智能体的快速发展在数学、医疗、个人助手等各领域产生了突破性应用,但依赖专家知识的手工设计方法制约了它们的任务自适应能力。
11/8/2024 9:20:00 AM
新智元

微软华人领衔AI²BMD登Nature,AI生物分子模拟双突破!继AlphaFold后又一里程碑

一个月前,诺贝尔化学奖颁给了AlphaFold,给全世界带来了一场认知地震。 人们开始意识到,近年来,AI在解析蛋白质结构与设计方面的应用进展迅速。 凭借AlphaFold和其他前沿算法,研究人员能够以惊人的速度预测和分析蛋白质的三维结构,破解了这个长期以来困扰生物学界的难题。
11/8/2024 9:00:00 AM
新智元