英伟达推出 NIM AI 护栏服务，防止模型遭用户“越狱”

英伟达宣布推出一项名为“NIM”的 AI 护栏服务，该服务现已以英伟达 NeMo 护栏（NeMo Guardrails）套件的形式提供，可以让开发人员为大语言模型（LLM）添加一系列护栏规则，旨在解决用户通过提示词“越狱”大模型。防止 AI 生成不符合预期的内容。

英伟达宣布推出一项名为“NIM”的 AI 护栏服务，该服务现已以英伟达 NeMo 护栏（NeMo Guardrails）套件的形式提供，可以让开发人员为大语言模型（LLM）添加一系列护栏规则，旨在解决用户通过提示词“越狱”大模型，防止 AI 生成不符合预期的内容。

英伟达表示，相应 AI 护栏服务套件基于英伟达的 Aegis 内容安全数据集进行训练而成，该数据集包含了 3.5 万个标注的数据样本，并已在 Hugging Face 上公开，AI在线附地址如下（点此访问）。

英伟达指出，相应 AI 护栏套件具有体积小、效率高的特点，在大部分场合中都能流畅运行，企业可以在开发 AI 模型时直接嵌入相应安全套件，可以改善医疗、汽车、制造业等领域部署的 AI 安全性。

此外，英伟达还提供了公布了一项名为 Garak 的漏洞扫描工具，用于检测模型的安全性，防止模型可能输出幻觉内容或泄露企业内部机密信息。

看完ChatGPT的回答，AI大佬们不满了

ChatGPT 的技术上个星期被微软装上必应搜索，击败谷歌，创造新时代的时候似乎已经到来了。然而随着越来越多的人开始试用，一些问题也被摆上前台。

2/14/2023 3:18:00 PM

机器之心

科技媒体 WinBuzzer 昨日（2 月 20 日）发布博文，报道称英伟达携手美国聋童协会（ASDC）和数字代理公司 Hello Monday，推出了一款名为 Signs 的 AI 平台，帮助更多人学习和应用美式手语（ASL）。

2/21/2025 11:22:10 AM

故渊

NVIDIA ACE与NVIGI的结合，为游戏开发带来了革命性的变化。它不仅能够提升游戏角色的智能化水平，还能显著增强游戏的互动性和沉浸感。借助ACE先进的生成式AI模型和NVIGI的无缝集成，游戏开发者可以创造出更具吸引力和生命力的游戏世界。

2/22/2025 10:47:00 AM

故渊

资讯热榜

标签云

顶部