伟达

英伟达要求 SK 海力士提前 6 个月供应 HBM4 芯片

据路透社今日报道,韩国 SK 集团会长崔泰源表示,英伟达 CEO 黄仁勋要求 SK 海力士提前六个月供应被称为 HBM4 的下一代高带宽内存芯片。 SK 海力士计划在 2025 年下半年推出采用 12 层 DRAM 堆叠的首批 HBM4 产品,而 16 层堆叠 HBM 稍晚于 2026 年推出。 SK 海力士和台积电双方于今年 4 月签署了合作谅解备忘录,宣布将就 HBM 内存的基础裸片加强合作。

丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动

丹麦推出了该国首台 AI 超级计算机,以丹麦神话中的女神 Gefion 命名,旨在推动量子计算、清洁能源、生物技术等领域取得突破,英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。 ▲ 图源英伟达Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机,使用英伟达 Quantum-2 InfiniBand 网络进行互连。 AI在线获悉,Gefion AI 超级计算机位于哥本哈根,为产业界、初创企业和学术界服务。

李开复:目前 AI 的经济状况“极其不健康”,英伟达除外

据“AI 机器人茶馆”10 月 22 日报道,创新工场董事长兼首席执行官李开复最近在一次私密论坛上表达了对当前 AI 形势的看法:当前的 AI 生态系统可能正在逐渐走向“不可持续”。 在他看来,现阶段除了显卡巨头英伟达在经济上收获满满,其他 AI 领域的玩家,包括应用开发者和企业,则挣扎在微薄的利润边缘,整个 AI 生态链表现出严重的“失衡”。 李开复指出,通常情况下,应用开发商赚的钱要多于硬件提供商,然而在 AI 领域,这种格局被颠倒了,反而是底层基础设施赚得最多。

黄仁勋:英伟达已将 AI 应用于芯片设计、软件编写和供应链管理等领域

感谢据《华尔街日报》今日报道,英伟达 CEO 黄仁勋对数千名企业技术领导者表示,企业必须转型为依靠人工智能驱动的组织,以迎接他所称的“新工业革命”。黄仁勋说,英伟达已经将这种理念付诸实践,积极地将 AI 应用于芯片设计、软件编写和供应链管理等领域。黄仁勋表示,从长远来看,英伟达正在打造他所述的“AI 大脑”。

TrendForce:英伟达将 Blackwell Ultra 产品更名为 B300 系列,预计 2025 年将推动 CoWoS-L 增长

TrendForce 集邦咨询今日发文,称英伟达近期将其所有 Blackwell Ultra 产品更名为 B300 系列,预估明年将策略性主推 B300 和 GB300 等采用 CoWoS-L 的 GPU 产品,这将提升对先进封装技术的需求量。AI在线注:CoWoS(Chip On Wafer On Substrate)是一种 2.5D 的整合生产技术,由 CoW 和 WoS 组合而来。CoW 就是将芯片堆叠在晶圆上 (Chip on Wafer),而 WoS 就是基板上的晶圆 (Wafer on Substrate),整合成 CoWoS。

微软携手英伟达“撒钱”,海量 AI 资源助推医疗、健康领域突破

科技媒体 NeoWin 昨日(10 月 21 日)发布博文,报道称微软和英伟达两大巨头联手,放出海量资源扶持健康和生命科学领域的人工智能(AI)初创企业。微软微软宣布启动“Microsoft for Startups”计划,为符合条件的初创企业提供最高 15 万美元(AI在线备注:当前约 106.9 万元人民币)的 Azure 信用额度,持续四年。这些企业可以接入多种 AI 大型语言模型,包括 Azure OpenAI Service、Meta 的 Llama 和 Phi。

英伟达开源模型 Nemotron-70B 超越 GPT-4o 和 Claude 3.5,仅次于 OpenAI o1

刚刚,英伟达开源了超强模型 Nemotron-70B,后者一经发布就超越了 GPT-4o 和 Claude 3.5 Sonnet,仅次于 OpenAI o1!AI 社区惊呼:新的开源王者又来了?业内直呼:用 Llama 3.1 训出小模型吊打 GPT-4o,简直是神来之笔!

联想与英伟达扩大合作,联合发布全新液冷 AI 服务器

感谢在今天的联想 2024 年度全球创新活动 Tech World 上,联想集团推出了第六代垂直液冷产品 ThinkSystem N1380 Neptune,为生成式 AI 的计算提供动力。大会上,联想集团宣布与英伟达合作推出联想混合式 AI 全面优势集,并推出 ThinkSystem SC777 V4 Neptune,进一步扩大了与英伟达的长期合作。这个新系统利用新的 ThinkSystem N1380 Neptune,号称在紧凑的设计中实现万亿参数的 AI 模型。

英伟达 CEO 黄仁勋展望公司未来:坐拥 5 万名员工、部署 1 亿个 AI 助手

英伟达 CEO 黄仁勋(Jensen Huang)昨日在“Bg 2”播客中表示,他希望英伟达有一天能够成为一家拥有 5 万名员工的公司,同时部署 1 亿个 AI 助手,从而“进一步提高公司的生产力”,他同时还强调,这并不会导致公司裁员。黄仁勋还畅想了这样一个未来:英伟达将在公司的每个部门大规模部署 AI 助手,以提高产出。AI 助理能够帮助员工高速处理琐碎的事务,同时“AI 也会招募其他 AI 来解决问题、AI 之间也能够相互交流,并与人类沟通”,从而提升公司协同效率。

微软“炫耀”新装备:内置英伟达最新 GB200 AI 芯片的服务器

微软 Azure 官方 X 账号昨晚发文“炫耀”了自家的新装备:公司已经拿到了搭载英伟达 GB200 超级芯片的 AI 服务器,成为全球云服务供应商中首个用上 Blackwell 体系的公司。今年 3 月,据AI在线报道,英伟达在 GTC 2024 开发者大会上发布了旗下最强 AI 加速卡 GB200,该卡采用新一代 AI 图形处理器架构 Blackwell,采用台积电的 4 纳米(4NP)工艺蚀刻而成。Blackwell 的 AI 性能可达 20 petaflops,而 H100 仅为 4 petaflops。英

英伟达:若各行业运用 AI,将为其带来高达 20 万亿美元的经济影响

当地时间周二,英伟达在美国召开了为期三天的“AI 峰会”,英伟达企业平台部门副总裁兼总经理 Bob Pette 表示,此次峰会的焦点更多在于 AI 的实际应用,而非新产品发布。Bob Pette 称全球各行业正逐步迈入 AI 的广泛应用阶段,并预测 AI 将为各个领域带来高达 20 万亿美元(AI在线备注:当前约 141 万亿元人民币)的经济影响。此次峰会重点介绍了 AI 的下一阶段发展,包括从先进的 AI 智能体,到机器人工厂、天气预报、癌症治疗及外太空探索等应用场景。据介绍,目前已有数千个预训练的“ AI 智能

富士康计划在墨西哥建造全球最大的英伟达 GB200 AI 芯片制造工厂

感谢据路透社今日报道,富士康高级副总裁 Benjamin Ting 在 2024 鸿海科技日上宣布,富士康计划在墨西哥建造全球最大的英伟达 GB200 芯片制造工厂,不过他没有透露该设施具体将建在哪里。富士康当前作为苹果的主要供应商,正在扩大业务制造其他电子产品。随着 AI 初创公司训练大模型的需求飙升,训练这些模型需要大量的计算能力,富士康也因此想争夺新的市场,搭上英伟达的巨轮自然是首选。据AI在线今年 3 月报道,英伟达在 GTC 2024 开发者大会上发布了旗下最强 AI 加速卡 GB200,该卡采用新一代

“终结者”雏形将登场,英伟达预测未来 2-3 年机器人领域迎来“GPT-3 时刻”

科技媒体 The Decoder 昨日(9 月 18 日)发布博文,报道称英伟达高级科学家 Jim Fan 预测,未来几年机器人领域将迎来“GPT-3 时刻”。Jim Fan 简介Jim Fan 在斯坦福大学视觉实验室获得了博士学位,师从李飞飞教授。他的研究领域十分广泛,包括了多模态基础模型、强化学习以及计算机视觉,曾实习于谷歌云 AI、OpenAI、百度硅谷人工智能实验室等知名组织。Jim Fan 目前在英伟达公司领导 AI 相关研究,其团队正致力于开发“Project Groot”,这是公司为创建人形机器人基础

英伟达 GeForce RTX 显卡包装标志变更,添加 AI 相关字样

英伟达更新了 GeForce RTX 的官方标志样式,添加了一行字“Powering Advanced AI”(为先进 AI 提供动力)。该标志用于展示在显卡、台式整机和笔记本电脑的零售包装盒上。英伟达是 AI 加速领域的领先硬件品牌,这一标志变更也代表着英伟达将向更多消费者展现其在 AI 方面的影响力。不过,新口号也让 GeForce RTX 标志变得更长了,AI在线小伙伴买到新显卡、笔记本后可以留意一下是否用上了新标志。英伟达第二财季营收 300 亿美元(AI在线备注:当前约 2133.39 亿元人民币),同比

英伟达发布 80 亿参数新 AI 模型:精度、效率高,可在 RTX 工作站上部署

英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12

因未经许可抓取 YouTube 内容训练模型,英伟达遭视频创作者起诉

感谢综合 Legal Dive 及 404 Media 16 日报道,当地时间周三,YouTube 创作者大卫・米勒特 (David Millette) 对英伟达公司提起集体诉讼,声称英伟达从他和其他人的视频中获取丰厚利润,违反了加州的《不正当竞争法》,并以牺牲他和其他创作者的利益为代价,使公司“不当得利”。这名 YouTube 创作者声称,英伟达未经他和其他创作者的许可,基于从 YouTube 上抓取的内容建立了一个新的视频模型,不公正地敛财并违反了《联邦劳动法》。而在两周前,这名创作者对 OpenAI 提起了类

小而强,英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出 40 亿参数的“小而强”模型。图源:英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来,英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注:剪枝是一种删除网络中不那么重要的层或神经元的技术,保留其性能的情况下,目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

科技媒体 404Media 披露的文件显示,英伟达收集了大量受版权包含的内容,用于训练人工智能(AI)。该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示,英伟达从 YouTube 等多个来源收集视频素材,用于扩充训练 AI 的数据集。该媒体披露的对话显示参与该项目的员工曾提出质疑,认为擅自使用 YouTube 视频以及研究目的编译的数据集,在法律层面可能会存在问题。不过项目经理的回复是,这种收集模式已经获得了公司最高层的许可,可以使用这些内容训练 AI,并认为“完全符合版权法的文字描述和精神”。一位