AI资讯列表 - AI在线

Hinton发2024末日预警：10年内人类灭绝！奥特曼预言18个月ASI降临

2024年，注定是AI历史上浓墨重彩的一年。站在2024年的尾声，各位大佬也给出了自己对于未来的预测。 OpenAI CEO奥特曼看来，我们即将迎接超级智能的到来，而且很快了！

迅雷将在杭州成立 AI 全球总部

在今日的浙江省杭州市余杭区第四季度重点项目集中签约活动中，迅雷集团与杭州未来科技城管委会签署合作协议，宣布迅雷将在余杭区设立 AI 全球总部，进一步深化双方在数字经济领域的合作。

英伟达2025祭出「迷你大脑」，雷神「Thor」剑指千亿机器人市场！

英伟达下一个万亿美元赌注就是——机器人！ FT独家报道，英伟达计划在2025年上半年，推出新一代人形机器人专用紧凑型计算平台Jetson Thor。在2025年，英伟达会更侧重于发展机器人技术。

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

暨南大学通用机器学习课题组由网络空间安全学院和信息科学技术学院的多名青年教师、博士生、硕士生和本科生共同组成，研究方向包括通用逼近理论、分布外泛化、非凸优化、稀疏学习、深度学习框架的基础模块开发、优化器开发、隐私保护与增强等。自 2024 年 4 月至 12 月，课题组作为第一单位已获得所有 CCF A 机器学习国际顶级会议 ICML（2 篇）、NeurIPS 和人工智能国际顶级会议 IJCAI、AAAI 录用论文共 5 篇。本文第一作者为课题组负责人赖兆荣，通讯作者为博士生李程，其他合作作者为课题组教师吴小天、方良达、陈子良。

科学家尝试用 AI 开发世界上第一个虚拟人类细胞

细胞对于理解健康和疾病至关重要，但传统模型无法建模和模拟它们的功能和行为。该论文提出结合人工智能和组学技术构建的人工智能虚拟细胞（AI virtual cell，AIVC），提供了模拟细胞功能和行为的新途径。AIVC 通过构建多尺度、多模态模型，有助于加速科研发现、指导实验研究，并促进跨学科合作，推动生物学研究的变革。

港科大开源VideoVAE+，视频重建质量全面超越最新模型

港科大团队重磅开源 VideoVAE ，提出了一种强大的跨模态的视频变分自编码器（Video VAE），通过提出新的时空分离的压缩机制和创新性引入文本指导，实现了对大幅运动视频的高效压缩与精准重建，同时保持很好的时间一致性和运动恢复。论文地址：：模型大幅超过最新模型包括英伟达在 2024.11 发布的 Cosmos Tokenizer，同时也超越一众方法包括腾讯在 2024.12 发布的 Hunyuan Video，CogvideoX VAE，WF-VAE，CV-VAE，Open Sora，Open Sora Plan, Easy Animate-VAE。什么是 VideoVAE 模型VideoVAE 模型（Video Variational Autoencoder）是一种基于深度学习的生成模型，用于对视频数据进行压缩、重建和生成，讲视频从 RGB 像素空间投影到低维度的 latent 空间。

“机器人 ChatGPT 时刻即将到来”，英伟达计划 2025 上半年发布新一代人形机器人芯片 Jetson Thor

英伟达负责机器人业务的副总裁 Deepu Talla 表示：“物理人工智能和机器人技术的 ChatGPT 时刻即将到来。”他补充称，他认为这个市场已达到一个“临界点”。

「源神」稚晖君又双叒叕开源，这一次机器人直接进入人类生活！

近期开源的 Deepseek V3，让国产 MoE 大模型在全球圈粉无数，一跃成为中国 AI 圈的顶流担当。而作为中国具身智能的领军企业，智元也在2024年底放了个大招，携手上海人工智能实验室等单位重磅开源了AgiBot World，具身智能领域也迎来了「ImageNet」时刻！ AgiBot World（智元世界）—— 一个汇集百万真实机器人数据的开源数据集。

SCOPE：面向大语言模型长序列生成的双阶段KV缓存优化框架

Key-Value (KV)缓存已成为大语言模型(LLM)长文本处理的关键性能瓶颈。当前研究尚未充分关注解码阶段的优化，这一阶段具有同等重要性，因为：1、对需要完整上下文的场景，预填充阶段的过度压缩会显著降低模型的推理理解能力2、在长输出推理任务中存在重要特征的显著偏移现象这篇论文提出SCOPE框架，通过分离预填充与解码阶段的KV缓存优化策略，实现高效的缓存管理。该框架保留预填充阶段的关键KV缓存信息，同时引入基于滑动窗口的新型策略，用于解码阶段重要特征的高效选取。

拿下近3亿元融资后，爱诗上线新模型，AI视频生成速度杀入10秒大关

我们实测16个Prompt：生成速度比Sora还快，动漫效果行业SOTA。前段时间，AI 毒液特效爆火，迅速攻占抖音小红书。而想出这个「鬼点子」的正是爱诗科技。

2024年人工智能年终总结报告｜Artificial Analysis

临近年末，在人们都开始着手于年终总结的时候，Artificial Analysis也给出了关于2024年AI变革式发展的回顾。令人欣喜的是，我国的Qwen2.5 Instruct 72B与DeepSeek V2.5还有可灵AI等也名列其中。毫无疑问的是，2024年对于AI的发展是里程碑式的一年。

稚晖君开源百万机器人真机数据集

年末大礼包，稚晖君他又双叒来开源了！百万真机数据集开源项目AgiBot World，也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。该项目由稚晖君具身智能创业项目智元机器人，携手上海AI Lab、国家地方共建人形机器人创新中心以及上海库帕思联合发布。

九大基准全面领先，性能暴涨10.8%！视觉价值模型VisVM成「图像描述」新宠

在现代多模态视觉语言模型（VLM）的发展中，提高图像描述的准确性和细节丰富性始终是一个挑战。尽管基于大规模数据的训练极大推动了模型性能，但在实际应用中，模型仍面临识别细微图像区域和减少「幻觉」现象的问题。推理时搜索（inference time search）作为一种提升响应质量的有效方法，已在大型语言模型中展现出巨大潜力。

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

让 Llama 2 在 Windows 98 奔腾 2（Pentium II）机器上运行，不但成功了，输出达到 39.31 tok / 秒。这台 PC 可能比你的年龄还大，要知道它已经是 26 年前的硬件了，配备英特尔奔腾 2 CPU 和 128MB 的内存。该项目是一个名为 EXO Labs 组织的一次大胆尝试，其证明了如果 Llama 模型能在 26 年前的硬件上跑通，那么它可以在任何地方运行。

南大周志华：百万模型进入学件基座系统，很多我们没预期过的事也有可能实现 | MEET 2025

大模型时代，全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇，但也有人，坚持深耕在国产原创的另一条大模型之路上。南京大学副校长、国际人工智能联合会理事会主席周志华教授，就是其中代表。他提出的“学件范式”，旨在从数据隐私角度着手，通过模型规约的方式构建基座系统，让用户的需求能被自动匹配到合适的模型、模型组合上，安全、可靠地复用他人开发的模型工具。

全球首个：智元机器人宣布开源 AgiBot World 百万真机数据集，大幅超越谷歌 Open X-Embodiment

智元机器人将按计划在 HuggingFace、Github 以及 agibot-world.com 项目主页上分批上传数据。

26 岁 OpenAI 举报人离奇身亡：其母亲不接受自杀结论，要求 FBI 介入调查

26 岁印度裔科技研究员、前 OpenAI 员工 Suchir Balaji 离奇死亡一案引起轩然大波，死者母亲 Poornima Ramarao 质疑警方结论，并要求联邦调查局 (FBI) 介入调查。

意念操控电脑，如手掌般精准！MIT脑机接口新技术登Nature子刊

编辑 | 2049想象一下，仅凭思维就能自如地操控电脑鼠标，就像健全人使用手部一样精准和流畅。这听起来像科幻片中的场景，但在加州理工学院（MIT）的最新研究中，这样的未来正在成为现实。研究人员开发出了一种名为「FENet」的突破性技术，让瘫痪患者能够更精准地用意念控制电脑设备。