AI资讯列表 - AI在线

英伟达 NVLM 1.0 引领多模态 AI 变革：媲美 GPT-4o，不牺牲性能平衡文本和图像处理难题

科技媒体 marktechpost 昨日（9 月 20 日）发布博文，报道了英伟达（Nvidia）最新发布的论文，介绍了多模态大语言模型系列 NVLM 1.0。多模态大型语言模型（MLLM）多模态大型语言模型（MLLM）所创建的 AI 系统，能够无缝解读文本和视觉数据等，弥合自然语言理解和视觉理解之间的差距，让机器能够连贯地处理从文本文档到图像等各种形式的输入。多模态大型语言模型在图像识别、自然语言处理和计算机视觉等领域拥有广阔应用前景，改进人工智能整合和处理不同数据源的方式，帮助 AI 朝着更复杂的应用方向发展。

OpenAI 笑傲 AI 江湖：新 50-70 亿美元融资将完成，估值有望破 1500 亿美元

科技媒体 The Decoder 昨日（9 月 20 日）发布博文，报道称 OpenAI 公司即将完成一轮价值 50 亿至 70 亿美元（当前约 352.76 亿至 493.86 亿元人民币）的大规模融资，公司估值有望达到 1500 亿美元（当前约 1.06 万亿元人民币）。消息称在本次融资中，OpenAI 设定的最低投资额为 2.5 亿美元（当前约 17.64 亿元人民币）。本次融资由 Thrive Capital 领投，承诺投资 10 亿美元（当前约 70.55 亿元人民币），AI在线附上其他参投的企业如下：微

突发！高通准备收购英特尔

我们可能会见证一场世纪收购。Arm 与 X86 的战争会以这种方式终结？本周五，据《华尔街日报》援引知情人士的话称，高通已对芯片巨头英特尔提出了收购要约。此次收购若能成功，以手机芯片闻名的高通将创造历史，接管这家世界闻名的硅谷芯片公司。在 PC 的发展历史上，英特尔的大名无处不在，英特尔成立于 1968 年，它构建了大部分现代个人电脑的核心，但最近也一直在努力转向支持人工智能的芯片。高通目前市值约 1882 亿美元，英特尔市值约为 934 亿美

有手就能学！如何用字节跳动 Coze 搭建小红书二创工作流？

小结：懒人救星！Coze工作流，让内容创作更简单，躺着也能高产！目录：可根据自己感兴趣的内容进行查看或实操使用小攻略：不熟悉 Coze：建议从头开始看；熟悉 Coze：可直接跳过「一」，去看实操部分「二」；一、Coze 平台 1. Coze 是什么官方介绍：Coze 是字节跳动推出的新一代一站式 AI Bot 开发平台。无论你是否有编程基础，都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot，从解决简单的问答到处理复杂逻辑的对话。你可以将搭建的 Bot 发布到各类社交平台和通讯软件上，

微软启动第二波 Copilot AI 更新：全新 Pages、Excel 支持 Python、上线 Agents 等

感谢微软公司于 9 月 18 日发布新闻稿，宣布启动 Microsoft 365 Copilot 第二波更新，引入了全新的 Pages，为 Excel 支持 Python 语言，以及上线 Copilot Agents 等。Copilot PagesCopilot Pages 能够将暂时生成的 AI 内容记录下来，随时进行编辑、补充或与他人共用。团队成员与 Copilot 可在同一个页面上展开协作，即时查看每个人的工作进度，如同将它视为团队中的一员般进行对话，向 Copilot 提出要求，从资料、档案和网络中添加新

古农文垂直领域大语言模型“齐民”发布，基于我国大量农业古籍文本训练

综合新华社、中国网消息，由农业农村部农业大数据重点实验室、中国农业科学院农业信息研究所联合湖北省图书馆、华中农业大学图书馆、郑州师范学院传播学院、中华书局古联（北京）数字传媒科技有限公司等单位开发的古农文垂直领域大语言模型“齐民”今天在北京发布。AI在线从报道中获悉，中国具备历史悠久的农业文明和耕读文化，孕育了众多的农学家、产生了大量的古农书，古农书是中国传统农业精髓的重要载体，也是我国文化遗产的重要组成部分。“齐民”古农文大语言模型基于我国古代大量农业古籍文本训练，从农业古籍中汲取智慧，深入挖掘古代农业技术、农耕

摩尔线程开源 OpenCV-MUSA：支持绝大部分 cv::cuda 命名空间下数据结构及 API

感谢摩尔线程宣布其自研统一系统架构 MUSA 已完成与开源计算机视觉库 OpenCV 的适配，并正式发布 OpenCV-MUSA 开源项目。OpenCV 作为计算机视觉领域最重要的开源库之一，为图像和视频处理的开发者和研究人员提供了强大且灵活的工具。OpenCV 在自动驾驶、医疗影像、安防监控、机器人视觉、增强现实和图像识别等多个领域得到广泛应用。在现有 OpenCV 代码的基础上，摩尔线程新增了 MUSA 设备后端，并为多个算法模块提供了 MUSA 加速支持，同时对编译脚本也进行了适配。目前 OpenCV-MUS

武汉大学首个人形机器人“天问”亮相：身长 1.7m、体重 65kg、36 个自由度

武汉大学首个人形机器人“天问”亮相。据武汉大学工业科学研究院副教授李淼介绍，“天问”一名的取名灵感来源于《楚辞》中屈原的千古名篇《天问》。▲ 图源武汉大学，下同AI在线获悉，今年 3 月 18 日，人形机器人“天问”项目正式立项；6 月完成样机组装、启动联调联试；如今熟练掌握走、跑、跳等基本技能。经过数月的不断调试和修复，团队从整体结构、电路、算法等层面确定了下肢用强化 sim2real 和上肢用模仿扩散模型的技术路线，并初步实现了机器人稳定行走的功能。“天问”机器人身长 1.7m、体重 65kg，拥有一双引人瞩目

真·AI程序员来了，阿里云「通义灵码」全面进化，全流程开发仅用几分钟

5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下，一个几乎没有专业编程经验的初中生，在人头攒动的展台上从零开始，两分钟就做出了一个倒计时网页。他需要做的，只是输入包含几句话的提示词。数秒钟后，大模型就生成了代码，还列出了环境需求，复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目，而是人人都可以尝试的事。在大模型的帮助下，代码正在成为低门槛的设计工具。昨天，阿里云完成了「可能是历史上最大规模的模型开源发布」，开源了通义千问 Qwen2.5 系列模型，又在云栖大会的年度重磅发布中

o1带火的CoT到底行不行？新论文引发了论战

To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也‍提到 o1 在某些任务上的表现并不比 GPT-4o 强，尤其是以语言为中心的任务。近日，一篇来自德克萨斯大学奥斯汀分校、约翰·霍普金斯大学和普林斯顿大学的论文引发了热议，其模仿莎士比亚《哈姆雷特》的台词提出了一个对 AI 研究者和实践者来说至关重要的问题：To CoT or not to

别Cursor了，集成o1的GitHub Copilot让网友直呼要回归

waitlist 挤爆了。草莓大模型又来了。昨天，GitHub CEO Thomas Dohmke 预告了一则关于草莓模型的推文，一时间勾起了很多人的好奇心。很多人猜测 GitHub Copilot 要集成 OpenAI 最新的 o1 系列模型了，毕竟再不升级就可能要被最近势头很猛的 Cursor 抢走更多用户了。果不其然，今天一大早，GitHub 便官宣了在 VSCode 中为 GitHub Copilot Chat 开放 o1-preview 和 o1-mini 的早期访问权。同时，用户也可以在 Github

OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜：数学能力碾压 Claude 和谷歌 Gemini 模型，o1-mini 并列第一

o1 模型发布 1 周，lmsys 的 6k 投票就将 o1-preview 送上了排行榜榜首。同时，为了满足大家对模型「IOI 金牌水平」的好奇心，OpenAI 放出了 o1 测评时提交的所有代码。万众瞩目的最新模型 OpenAI o1，终于迎来了 lmsys 竞技场的测评结果。不出意外，o1-preview 在各种领域绝对登顶，超过了最新版的 GPT-4o，在数学、困难提示和编码领域表现出色；而 o1-mini 虽然名字中自带「mini」，但也和最新版的 GPT-4o 并列综合排名第二，困难提示、编码、数学

从架构、工艺到能效表现，全面了解LLM硬件加速，这篇综述就够了

大语言模型（LLM）的发展同时往往伴随着硬件加速技术的进化，本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程，研究人员花了几十年的时间才开发出来。这项技术最早可追溯于 1950 年，当时克劳德・香农将信息理论应用于人类语言。从那时起，翻译和语音识别等任务取得了长足的进步。在这个过程中，人工智能 (AI) 和机器学习 (ML) 是技术进步的关键。ML 作为 AI 的一个子集，其允许计算机从数据中进行学习。一般来说，ML 模型要么是有监督的，要么是无监

华为云AI原生基础设施CloudMatrix亮相全联接大会

今天，在华为全联接大会 2024 上，华为云发布了 AI 原生云基础设施架构 CloudMatrix，以满足 AI 时代企业对于算力的大规模、高效稳定、弹性灵活的需求。华为云 AI 原生云基础设施架构 CloudMatrix 正式发布如今，AI 算力需求高速增长，正在超越对通用算力的需求。构建弹性、高效的多元算力基础设施是 AI 发展的关键。为了进一步提升 AI 原生基础设施的效能，华为云推出 AI 原生云基础设施 CloudMatrix，将 CPU、NPU、DPU、存储和内存等资源全部互联和池化，构建「一切可池化

病毒从何而来？AlphaFold等AI正在寻找答案

图示：登革热病毒蛋白的结构。（来源：Spyros Lytras 和 Joe Grove）编译 | 白菜叶人工智能 (AI) 正在帮助重新绘制病毒家族树。AlphaFold 生成的预测蛋白质结构和受聊天机器人启发的「蛋白质语言模型」揭示了病毒家族中的一些令人惊讶的联系，其中包括感染人类的病原体以及新出现的威胁。科学家对病毒进化的理解大多基于基因组比较。但病毒（尤其是那些基因组以 RNA 编写的病毒）的闪电般快速进化以及它们从其他生物体获取遗传物质的倾向意味着基因序列可以隐藏病毒之间深远的关系，而这种关系也可能因所检查

原子、分子、复合物级性质预测均最佳，清华分子预训练框架登Nature子刊

编辑 | KXAI 已广泛用于药物发现和材料设计中的分子筛选。当前的自监督分子预训练方法往往忽略了分子的基本化学特性和物理原理。为了解决这个问题，来自清华大学的研究人员提出了一种称为分数去噪（Fractional denoising，Frad）的分子预训练框架，以学习有效的分子表示。通过这种方式，噪声变得可自定义，允许纳入化学先验，从而大大改善分子分布建模。实验表明，Frad 始终优于现有方法，在力预测、量子化学特性和结合亲和力任务中，取得最先进的结果。改进的噪声设计提高了力准确性和采样覆盖范围，这有助于创建物理一

OpenAI 再成“榜一大哥”：o1-preview AI 模型更轻松驾驭数学、编程等任务

科技媒体 The Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。结果结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1

Runway Gen-3的视频转绘功能太牛了！大片制作0门槛！

大家好我是花生~ Runway 在推出 Gen-3 Alpha 视频生成模型后，还一直有一些小的更新，比如推出了新的 Turbo 模型，生成速度比原来快了 7 倍；支持尾帧控制；支持将视频延长至 40s 等，都是非常符合用户需求的优化提升。而它前几天推出的 V2V （Video to Video）功能，更是将 AI 视频在风格转绘上的水平提升到了一个新的高度，再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞，并迅速衍生出多种玩法，很有潜力成为一个新的流量风口，喜欢