英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推动 AI 高效部署

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1，这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。

科技媒体 marktechpost 昨日（4 月 11 日）发布博文，报道称英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1，这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。

随着 AI 在数字基础设施中的普及，企业与开发者需在计算成本、性能与扩展性间寻找平衡。大型语言模型（LLM）的快速发展提升了自然语言理解和对话能力，但其庞大规模常导致效率低下，限制大规模部署。

英伟达最新发布的 Llama-3.1-Nemotron-Ultra-253B-v1（简称 Nemotron Ultra）直面这一挑战，该模型基于 Meta 的 Llama-3.1-405B-Instruct 架构，专为商业和企业需求设计，支持从工具使用到多轮复杂指令执行等任务。

AI在线援引博文介绍，Nemotron Ultra 采用仅解码器的密集 Transformer 结构，通过神经架构搜索（NAS）算法优化，其创新之处在于采用跳跃注意力机制，在部分层中省略注意力模块或替换为简单线性层。

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推动 AI 高效部署

此外，前馈网络（FFN）融合技术将多层 FFN 合并为更宽但更少的层，大幅缩短推理时间，同时保持性能。模型支持 128K token 的上下文窗口，可处理长篇文本，适合高级 RAG 系统和多文档分析。

在部署效率上，Nemotron Ultra 也实现突破。它能在单 8xH100 节点上运行推理，显著降低数据中心成本，提升企业开发者的可及性。

英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推动 AI 高效部署

英伟达通过多阶段后训练进一步优化模型，包括在代码生成、数学、对话和工具调用等任务上的监督微调，以及使用群体相对策略优化（GRPO）算法进行强化学习（RL）。这些步骤确保模型在基准测试中表现出色，并与人类交互偏好高度契合。

英伟达推出 NIM AI 护栏服务，防止模型遭用户“越狱”

英伟达宣布推出一项名为“NIM”的 AI 护栏服务，该服务现已以英伟达 NeMo 护栏（NeMo Guardrails）套件的形式提供，可以让开发人员为大语言模型（LLM）添加一系列护栏规则，旨在解决用户通过提示词“越狱”大模型。防止 AI 生成不符合预期的内容。

1/18/2025 10:39:35 PM

漾仔

科技媒体 WinBuzzer 昨日（2 月 20 日）发布博文，报道称英伟达携手美国聋童协会（ASDC）和数字代理公司 Hello Monday，推出了一款名为 Signs 的 AI 平台，帮助更多人学习和应用美式手语（ASL）。

2/21/2025 11:22:10 AM

故渊

NVIDIA ACE与NVIGI的结合，为游戏开发带来了革命性的变化。它不仅能够提升游戏角色的智能化水平，还能显著增强游戏的互动性和沉浸感。借助ACE先进的生成式AI模型和NVIGI的无缝集成，游戏开发者可以创造出更具吸引力和生命力的游戏世界。

2/22/2025 10:47:00 AM

故渊

资讯热榜

标签云

顶部