AI资讯列表 - AI在线

端侧最强开源 AI 模型 Llama 3.2 登场：可在手机运行，从 1B 纯文本到 90B 多模态，挑战 OpenAI 4o mini

Meta 公司昨日（9 月 25 日）发布博文，正式推出了 Llama 3.2 AI 模型，其特点是开放和可定制，开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型，代表了 Meta 在大型语言模型（LLMs）方面的最新进展，在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs （11B 和 90B），以及轻量级纯文本模型（1B 和 3B），此外提供预训练和指令微调（instruction-tuned）版本。AI在线附

字节全新发布豆包AI视频模型：再见了Sora，你的时代过去了

刚刚，字节的火山引擎的发布会基本结束了。我现在有点过于激动。虽然发布会结束了，但是我觉得，一个颠覆行业的全新的起点，在这一刻，正式到来了。字节正式发布了他们全新的两款 AI 视频模型：豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次，我想说这个豆包 PixelDance 模型，因为太屌了，屌炸了，我真的是全程惊叹着看完的。他们正式宣布这玩意的那一刻，现场掌声雷动，我隔着屏幕都感觉快特么把房顶掀翻了。真的，如果要给这个豆包 PixelDance

惠普报告称生成式 AI 正被用于创建网络攻击恶意软件，可被藏匿在 svg 图像中

当地时间 24 日，惠普发布的《威胁洞察（Threat Insights）》报告指出，不良行为者、黑客和网络犯罪分子正在利用生成式 AI 开发复杂的恶意软件，目标是法语用户。“恶意软件的结构、解释每行代码的注释以及母语函数名和变量都表明，威胁行为者使用生成式 AI 创建了该恶意软件。”受害者通常通过网络钓鱼电子邮件或恶意广告成为攻击目标，从而进入恶意网站。这些网站看似专业可信，通常提供假冒的工具或服务，例如 PDF 转换器。但是，这个 ChromeLoader 活动在用户被引向假冒 PDF 工具后，最终安装了恶意代

华章廿载新质未来 ——2024第二十届全国高性能计算学术年会在武汉成功举行

“九省通衢达天下，超算之光耀楚天”，9月24日至26日，第20届CCF全国高性能计算学术年会(CCF HPC China 2024)在武汉市中国光谷科技会展中心盛大举行。大会由中国计算机学会主办，中国计算机学会高性能计算专业委员会、华中科技大学、上海交通大学承办，中国地质大学(武汉)、北京并行科技股份有限公司协办。以“华章廿载新质未来”为主题，本届大会由12位院士领衔，携手来自算力领域的400多位顶尖学者，进行学术交流和专题分享。

李彦宏数千万元投资大模型创业公司鼓励创业者坚持长期主义

李彦宏表示，智能体最明显的特点是门槛足够低，谁都能上手，但同时天花板又足够高，可以做出非常复杂，非常强大的应用。未来，将会有数以百万量级的智能体出现，形成庞大的智能体生态。值得一提的是，在今年文心杯创业大赛中，有超过60%参赛团队聚焦智能体的应用，超过30%参赛团队没有专业程序员。

百度全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0

感谢2024 百度云智大会今日在北京召开，百度在大会上宣布全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0 两大 AI 基础设施，并升级代码助手、智能客服、数字人三大 AI 原生应用产品。百度智能云事业群总裁沈抖表示：“2024 年大模型的产业落地正在加速，目前在千帆大模型平台上，文心大模型日均调用量超过 7 亿次，累计帮助用户精调了 3 万个大模型，开发出 70 多万个企业级应用。过去一年，文心旗舰大模型降价幅度超过 90%，主力模型全面免费。”升级百舸 4.0为满足企业落地大模型从集群创建、开发

百度李彦宏：智能体是我最看好的 AI 应用方向

在今日的 2024 百度云智大会上，“文心杯”创业大赛第二季结果揭晓。百度创始人李彦宏发表颁奖致辞时指出，智能体是他最看好的 AI 原生应用发展方向，相当于 PC 时代的网站和自媒体时代的账号。李彦宏表示，智能体最明显的特点是门槛足够低，谁都能上手，但同时天花板又足够高，可以做出非常复杂，非常强大的应用。未来，将会有数以百万量级的智能体出现，形成庞大的智能体生态。AI在线注意到，在今年文心杯创业大赛中，有超过 60% 参赛团队聚焦智能体的应用，超过 30% 参赛团队没有专业程序员。“百度希望能与所有的创业领域企业共

“稚晖君”创业项目，智元自主研发的机器人中间件 AimRT 开源

智元自主研发的机器人中间件 AimRT 开源上线。▲ AimRT 架构图官方表示，AimRT 是一个更现代、轻量易用，且高效稳定的通信开发框架，具备机器人开发流程所必备的许多实用特性，并解决了主流开源中间件的一些痛点：在软件开发效率方面，AimRT 基于现代 C 新标准开发，轻量易部署，将现代化设计模式应用在资源管控、异步编程、部署配置等方面，使得机器人应用的开发更加快捷和高效。在工具链与调测效率方面，AimRT 提供了完善的调试、性能分析工具，以及良好的可观测性支持，有助于快速发现并解决系统中的问题，相比较传

星纪魅族正在开发星纪战车、机器人等新品

星纪魅族 AI 生态发布会于今日下午举行，在发布会尾声，星纪魅族预热了两款正在研发的新品 —— 星纪战车、机器人。从图中可以看到，星纪战车采用剪刀门设计，整体底盘很高；机器人是人形机器人风格，整体造型犀利，目前尚不清楚是概念图还是实物设计图。据AI在线此前报道，星纪魅族今日还公布了自己的智能生态产品体系：将基于 FlymeAIOS 技术底座，以 Star 和魅族两大品牌承载 AI 终端落地体验。星纪魅族 AI 生态发布会专题

Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

编辑 | 萝卜皮变构药物为现代药物设计提供了一条新途径。然而，识别隐蔽的变构位点是一项艰巨的挑战。四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程，结合残基驱动的混合机器学习模型（RHML）和分子动力学（MD）模拟，成功识别出了变构位点、变构调节剂，并揭示了它们的调控机制。具体而言，在 β2 肾上腺素能受体（β2AR）中，团队发现了位于残基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一个新的变构位点及潜在调节剂 ZINC5042。通过分子力学/广义 Born 表

微软发布新工具，检测和纠正 AI 幻觉内容

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道称微软以预览版的形式，在 Azure AI Content Safety 中推出 Groundedness Detection，用于“纠正” AI 幻觉。AI 幻觉在人工智能领域中，幻觉是由人工智能生成的一种回应，它含有貌似事实的虚假或误导性资讯。该术语源自幻觉的心理学概念，因为它们具有相似的特征。人工智能幻觉的危险之处之一是模型的输出看起来是正确的，而它实际上是错误的。Groundedness Detection微软的 Groundednes

当大模型Scaling Law继续，万卡集群算力释放在「百舸」这里找到一条通途

在电影《天下无贼》中，葛优扮演的黎叔有这样一句经典的台词，「二十一世纪什么最贵？人才！」而随着人工智能行业进入到大模型时代，这一问题的答案已然变成了「算力」。随着模型规模急剧扩张，参数已经飙升到了千亿甚至万亿级，业界开启了千模大战，AI 算力需求不可避免迎来爆炸式增长，无论是前期训练还是后期推理，都是如此。在训练层面，OpenAI 曾在 2018 年做过估算，自 2012 年以来，AI 模型训练算力需求每 3.5 个月翻一番，每年所需算力增幅高达 10 倍，增速远远超出了芯片产业长期存在的摩尔定律（性能每 18 个

终于来了！OpenAI开放GPT-4o高级语音，还用中文说「对不起」

这项高级语音功能，大家可是等了好久。谷歌又被 OpenAI 截胡了。前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。「高级语音功能今天推出！（将在本周内完成），希望您的等待值得。」奥特曼表示道，最后还不忘加一个委屈、小桃心的表情。这次，OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了，因为 OpenAI 暂时没有这个计划。据了解，Plus 用户每月需支付

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

在当今大模型技术日新月异的背景下，数据已跃升为构建企业大模型知识库、优化训练与微调，乃至驱动模型创新不可或缺的核心要素。对于企业来说，积累的宝贵知识广泛散布于形式多样的电子文档之中，这些文档不仅格式多样，其内容质量亦呈现出显著的差异性。对海量数据进行精细化的清洗与预处理工作，已成为提升数据价值、确保模型精准高效的关键一环，如何有效提取并利用这些宝贵的知识资源，成为了摆在所有企业面前的一道难题。9 月 20 日，老牌数字化转型技术服务提供商浩鲸科技在云栖大会期间，成功举行鲸智大模型技术体系发布会，作为企业内部的 “资

自动化机器学习研究MLR-Copilot：利用大型语言模型进行研究加速

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]该论文的第一作者及指导作者均来自德克萨斯大学达拉斯分校，第一作者为博士生 Ruochen Li，指导作者为其博士生导师 Xinya Du，专注于自然语言处理、深度学习和大语言模型的研究。X

英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

英伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型，共有 510 亿参数。该 AI 模型主要采用了神经架构搜索（NAS）技术微调，平衡性能和效率，在高工作负

OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录

来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中，OpenAI 的 o1 模型准确率达到 97.8%，大大超过了之前的最佳语言模型 LLaMA

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模型的速率限制，并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内

资讯列表