英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。

Llama Nemotron 系列开放推理 AI 模型共有 Nano、Super 和 Ultra 三种规模,AI在线援引博文简单介绍如下:

  • Nano:专为 PC 和边缘设备设计,提供高精度推理。

  • Super:单 GPU 部署,兼顾顶级准确率与处理速度。

  • Ultra:多 GPU 服务器优化,确保复杂任务的最高精度。

三种不同规模适用于不同部署环境,可按需激活深度推理模式,简化任务时节省算力,降低推理成本。Llama Nemotron 系列开放推理 AI 模型还通过 NVIDIA NIM 微服务,支持从数据中心到边缘计算的全场景应用。

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达还介绍了 Cosmos Nemotron 新成员,这是专注视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展 NVIDIA 此前的 Cosmos World Foundation Model(WFM)平台能力,主要应用于自动驾驶、工业机器人等需多模态推理的领域,实现“文本 + 视觉”协同决策。

英伟达 GTC 2025 大会专题

相关资讯

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:很显然,这里最佳的答案应该是直行,但预先提供的 4 个选项中并没有这个答案。 也因此,目前的大多数 AI 在面临这个问题时往往并不能识别题中陷阱,会试图从选项中找到正确答案。 比如下面展示了 ChatGPT 的回答:当然,在日常的视觉问答任务中,这样的错误无伤大雅,但一旦涉及到真实的任务场景(比如真正的自动驾驶),这样的错误就是无法容忍的了。

英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer

tokenizer对于图像、视频生成的重要性值得重视。 在讨论图像、视频生成模型时,人们的焦点更多地集中在模型所采用的架构,比如大名鼎鼎的 DiT。 但其实,tokenizer 也是非常重要的组件。

​英伟达计划在美国投资数千亿推动半导体供应链发展

全球市值最高的半导体公司英伟达近日宣布,将在未来四年内在美国的供应链上投资数千亿美元。 根据《金融时报》的报道,英伟达预计将在电子产品领域支出约 5000 亿美元,其中很大一部分将用于美国的运营。 这一重大投资计划被认为是对特朗普 “美国优先” 贸易政策的响应,同时也跟随了苹果等其他科技巨头的类似公告。