AI资讯列表 - AI在线

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索，显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展，正前所未有地交织在一起。前段时间，著名数学家陶哲轩在牛津数学公开讲座中做了主题为「AI 在科学和数学中的潜力」的主题分享。他指出，将 AI 整合到数学领域将使形式化证明的编写速度超过人类证明（人类证明容易出错）。这将成为一个关键转折点，意味着形式化证明的使用将不仅限于验证现有的证明，还将用于创造新的数学知识。这将通过广泛的人类数学家与 AI 数学家之间的协作来实现。我们将迎来一个

Nature子刊 | 基于内生复杂性，自动化所新类脑网络构筑人工智能与神经科科学的桥梁

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本篇工作发表在《Nature Computational Science》上，共同通讯作者是中国科学院自动化所李国齐研究员、徐波研究员，北京大学田永鸿教授。共同一作是清华大学钱学森班的本科

AI成为「耗电大户」，除了新能源，还需要芯片创新

人工智能的普及造成了一场能源危机，但并不是无法解决。人工智能（AI）的爆炸式增长促使科技巨头（包括 Google、Meta、亚马逊和微软等）开始构建超大规模数据中心，这些数据中心需要的电力非常多 —— 是以千兆瓦计算而不是兆瓦。有分析师表示，这些巨型数据中心使用现有的半导体技术来挑战美国老化的电网基础设施，以满足其能源消耗需求。例如，高盛估计仅对 ChatGPT 的一次查询所消耗的数据中心电能就比语音识别等传统人工智能功能多 10 倍，因此我们需要更强大的数据中心来支持这种需求。如今，生成式 AI（GenAI）处于

马斯克畅想未来：人类记忆可上传至云端并下载至机器人

特斯拉 CEO 埃隆・马斯克于当地时间 8 月 17 日在社交媒体上表示，未来人类可能能够将自己的记忆和意识上传到云端，并下载到人形机器人身上。马斯克是在回应一位特斯拉粉丝关于是否可以将大脑复制到 Optimus 上以延长生命的问题时做出上述表述的，他称，“最终，你可能能够将自己的大部分记忆和思维状态上传到‘云端’，并能够将其下载到一个人形机器人身上。显然，你不会完全和现在一样。”特斯拉于 2021 年首次推出 Optimus，最初目标是处理危险、重复或繁琐的任务。但马斯克随后表示，Optimus 还可以作为伴侣、

AIGC大厂实战！京东家政如何将AI融入设计流程？

AIGC作为现阶段设计领域的潮流风向标，正快速的影响着设计行业。本次为大家带来京东家政AIGC的实践经验与思考，探讨如何将AI工具引入设计流程之中。通过一系列尝试，不仅实现了工作效率的大幅提升，更在保持设计独特性与高质量输出的同时，为业务项目注入了新的可能性与竞争力。

因未经许可抓取 YouTube 内容训练模型，英伟达遭视频创作者起诉

感谢综合 Legal Dive 及 404 Media 16 日报道，当地时间周三，YouTube 创作者大卫・米勒特 (David Millette) 对英伟达公司提起集体诉讼，声称英伟达从他和其他人的视频中获取丰厚利润，违反了加州的《不正当竞争法》，并以牺牲他和其他创作者的利益为代价，使公司“不当得利”。这名 YouTube 创作者声称，英伟达未经他和其他创作者的许可，基于从 YouTube 上抓取的内容建立了一个新的视频模型，不公正地敛财并违反了《联邦劳动法》。而在两周前，这名创作者对 OpenAI 提起了类

蜘蛛侠妖娆起舞，下一代 ControlNet 来了！贾佳亚团队推出，即插即用，还能控制视频生成

只用不到 10% 的训练参数，就能实现 ControlNet 一样的可控生成！而且 SDXL、SD1.5 等 Stable Diffusion 家族的常见模型都能适配，还是即插即用。同时还能搭配 SVD 控制视频生成，动作细节控制得精准到手指。在这些图像和视频的背后，就是港中文贾佳亚团队推出的开源图像 / 视频生成引导工具 ——ControlNeXt。从这个名字当中就能看出，研发团队给它的定位，就是下一代的 ControlNet。像大神何恺明与谢赛宁的经典大作 ResNeXt（ResNet 的一种扩展），起名字也是

Exists 发布新 AI 平台：零编程经验者也可制作高质量 3D 游戏

AI 初创公司 Exists 于 8 月 15 日发布新闻稿，介绍最新上线的生成式 AI 平台，没有任何编程经验的用户通过文本输入，就能创建高质量的 3D 游戏。该公司创始人兼首席执行官约塔姆・赫特林格博士（Dr. Yotam Hechtlinger）表示：我们的目标是像文本、图像、视频和音频创作一样，让生成式 AI 在游戏领域带来范式转变。根据官方公布的宣传视频，整个游戏 AI 工具易于上手，在生成后用户还能指令调整细节。不过这款 AI 目前也有局限性，人脸建模看起来有点不自然，这一点可以在 0:43 分钟体现

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

中科院联合清华北大构建新型类脑网络，构筑 AI 和神经科学的桥梁

据“中国科学院自动化研究所”消息，该所李国齐、徐波研究团队联合清华大学、北京大学等借鉴大脑神经元复杂动力学特性，提出了“基于内生复杂性”的类脑神经元模型构建方法，改善了传统模型通过向外拓展规模带来的计算资源消耗问题，为有效利用神经科学发展人工智能提供了示例。相关研究论文今日在线发表于《自然・计算科学》（Nature Computational Science）。AI在线附研究主要内容：据介绍，本研究首先展示了脉冲神经网络神经元 LIF（Leaky Integrate and Fire）模型和 HH（Hodgkin-

准确率97%，将大脑信号转化为语音，新型脑机接口让失语者「说话」

编辑 | 萝卜皮肌萎缩性脊髓侧索硬化症又称渐冻人症（ALS），会影响控制全身运动的神经细胞。这种疾病会导致患者逐渐丧失站立、行走和使用双手的能力。它还会导致患者失去对说话肌肉的控制，从而无法进行语言表达。加州大学戴维斯分校的研究团队开发了一项新技术旨在帮助因瘫痪或 ALS 等神经系统疾病而无法说话的人恢复交流能力。它可以解读用户说话时的脑信号，并将其转换成计算机大声朗读的文本。其准确率高达 97%，是同类系统中最准确的。该团队的研究人员在一名因 ALS 而导致语言能力严重受损的男子的大脑中植入了传感器。这名男子在启

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

编辑 | KXAI 技术在辅助抗体设计方面取得了巨大进步。然而，抗体设计仍然严重依赖于从血清中分离抗原特异性抗体，这是一个资源密集且耗时的过程。为了解决这个问题，腾讯 AI Lab、北京大学深圳研究生院和西京消化病医院研究团队提出了一种预训练抗体生成大语言模型 (PALM-H3)，用于从头生成具有所需抗原结合特异性的人工抗体 CDRH3，减少对天然抗体的依赖。此外，还设计了一个高精度的抗原-抗体结合预测模型 A2binder，将抗原表位序列与抗体序列配对，从而预测结合特异性和亲和力。总之，该研究建立了一个用于抗体生

何必死磕人形，云迹科技押注复合多态机器人「UP」：让具身智能走进百姓生活

人工智能时代，我们需要什么样的AI？

独家 | 银河通用机器人最新一轮估值 4.25 亿美元

作者 | 赖文昕编辑 | 陈彩娴AI 科技评论独家获悉，在新一轮融资后，银河通用的最新估值为 4.25 亿美元。此前在 7月19日，「港版淡马锡」香港投资管理有限公司正式宣布投资银河通用机器人。而在 6 月，这家具身智能创企宣布获得了超 7 亿人民币天使轮融资，被称为「年度最大天使轮」——投资方包括美团战投、北汽产投、商汤国香资本、讯飞创投等战略及产业投资方，以及启明创投、蓝驰创投、经纬创投、源码资本、IDG资本等头部财务机构。

收到中国知网 28 页侵权告知函，秘塔称多家数据库主动合作、后续服务不受影响

秘塔公司今天上午通过官方公众号发文称，昨天收到《中国学术期刊（光盘版）》电子杂志社有限公司（即“知网”）长达 28 页的侵权告知函。据每日经济新闻报道，秘塔方面今天下午表示，后续提供服务完全不受影响，已经有多家数据库主动表示愿意和秘塔合作。秘塔科技首席运营官王益为回应称，秘塔 AI 搜索的收录内容均为公开的摘要和题录，并无任何收录知网文章内容本身的行为。他进一步表示，数据所有权属于知网，但是侵权前提是要有损害，其对“侵犯知网合法权益”指控表示困惑。据AI在线今天上午的报道，秘塔方面宣布，对知网的选择“不理解但尊重”

具身智能构型之争：人形、灵巧手、双足，谁是最终 C 位？

作者 | 赖文昕编辑 | 陈彩娴上个月初，上海世界人工智能大会（WAIC 2024）展出人形机器人「十八金刚」引爆会场。一个月后，世界机器人大会（WRC 2024）又即将在北京拉开帷幕。再回到 5 月，在国际顶级机器人学术会议（ICRA 2024）的机器人方阵中，参与的双足人形机器人大多都来自中国企业。

以「垂直模型」引领AIGC商业化落地，FancyTech的技术路径是什么？

我们正在见证又一轮技术革新，这一次是 AIGC 为个体提供表达自我的工具，让创作变得更加容易和普及，但背后的推动力却并不是「大」模型。两年以来，AIGC 技术的发展速度超过所有人的想象，席卷了从文本、图像到视频的各个领域。关于 AIGC 商业化路径的讨论从来没有停止过，其中，有共识也有路线分化。一方面，通用模型的强大能力令人惊叹，在各行各业展示出应用潜力。特别是 DiT、VAR 等架构的提出，让 Scaling Law 实现了从文本到视觉生成领域的跨越。在这一法则的指引下，很多大模型厂商朝着增加训练数据、算力投入和

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

小模型崛起了。上个月，Meta 发布了 Llama 3.1 系列模型，其中包括 Meta 迄今为止最大的 405B 模型，以及两个较小的模型，参数量分别为 700 亿和 80 亿。Llama 3.1 被认为是引领了开源新时代。然而，新一代的模型虽然性能强大，但部署时仍需要大量计算资源。因此，业界出现了另一种趋势，即开发小型语言模型 (SLM)，这种模型在许多语言任务中表现足够出色，部署起来也非常便宜。最近，英伟达研究表明，结构化权重剪枝与知识蒸馏相结合，可以从初始较大的模型中逐步获得较小的语言模型。