AI在线 AI在线

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

作者:故渊
2025-03-20 11:17
英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型,支持“智能体 AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现 AI 自主化升级。

Llama Nemotron 系列开放推理 AI 模型共有 Nano、Super 和 Ultra 三种规模,AI在线援引博文简单介绍如下:

  • Nano:专为 PC 和边缘设备设计,提供高精度推理。

  • Super:单 GPU 部署,兼顾顶级准确率与处理速度。

  • Ultra:多 GPU 服务器优化,确保复杂任务的最高精度。

三种不同规模适用于不同部署环境,可按需激活深度推理模式,简化任务时节省算力,降低推理成本。Llama Nemotron 系列开放推理 AI 模型还通过 NVIDIA NIM 微服务,支持从数据中心到边缘计算的全场景应用。

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达还介绍了 Cosmos Nemotron 新成员,这是专注视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展 NVIDIA 此前的 Cosmos World Foundation Model(WFM)平台能力,主要应用于自动驾驶、工业机器人等需多模态推理的领域,实现“文本 + 视觉”协同决策。

英伟达 GTC 2025 大会专题

相关资讯

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:很显然,这里最佳的答案应该是直行,但预先提供的 4 个选项中并没有这个答案。 也因此,目前的大多数 AI 在面临这个问题时往往并不能识别题中陷阱,会试图从选项中找到正确答案。 比如下面展示了 ChatGPT 的回答:当然,在日常的视觉问答任务中,这样的错误无伤大雅,但一旦涉及到真实的任务场景(比如真正的自动驾驶),这样的错误就是无法容忍的了。
3/25/2025 12:38:00 PM
机器之心

英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer

tokenizer对于图像、视频生成的重要性值得重视。 在讨论图像、视频生成模型时,人们的焦点更多地集中在模型所采用的架构,比如大名鼎鼎的 DiT。 但其实,tokenizer 也是非常重要的组件。
11/23/2024 11:27:00 PM
机器之心

英伟达开源最强通用模型Nemotron-4 340B

性能超越 Llama-3,主要用于合成数据。英伟达的通用大模型 Nemotron,开源了最新的 3400 亿参数版本。本周五,英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),可用于医疗健康、金融、制造、零售等所有行业的商业应用。高质量的训练数据在自定义 LLM 的响应性能、准确性和质量中起着至关重要的作用 —— 但强大的数据集经常是昂贵且难以访问的。通过独特的开放模型许可,Nemotron-4 340B 为开发人员提供了一种免
6/16/2024 6:26:00 PM
机器之心