英伟达

英伟达、软银深化 AI 合作,后者将接收全球首个正式版 DGX B200 系统

软银将基于英伟达硬件构建全日本最强 AI 超级计算机;双方合作的 AI-RAN 技术可充分利用无线接入网的空闲容量。

英伟达稳坐全球第一,成为新霸主!回顾这波AI潮的起源:辛顿、黄仁勋、李飞飞的历史交汇

出品 | 51CTO技术栈(微信号:blog51cto)“过去12年的AI热潮得益于三位在面对广泛批评时依然追求非传统理念的先驱。 一位是多伦多大学的Geoffrey Hinton,他几十年如一日地推广神经网络,尽管几乎所有人都怀疑它。 第二位是Nvidia的CEO黄仁勋,他早早意识到GPU不仅仅能用于图形处理。

史上第一次,英特尔在数据中心市场输给了AMD

然而两家都远远落后于英伟达。 在消费级芯片市场形势逆转之前,服务器芯片的市场已经先喊出 AMD yes 了。 史上第一次,AMD 从数据中心处理器市场中获得的利润超越了英特尔。

英伟达3.4万亿市值稳坐全球第一!苹果12年霸主地位终结

再次见证历史! 美东时间周二,英伟达股价收涨2.84%,至139.91美元,市值达到3.43万亿美元,超越苹果市值为3.38万亿美元。 今年以来,英伟达股价了186%,而苹果仅上涨了17%。

100%英伟达的错:黄仁勋确认Blackwell缺陷修复,明年初出货

老黄:科技公司的芯片需求让我夜不能寐。 「我们的 Blackwell 芯片存在设计缺陷,虽然可以正常使用,但该设计缺陷导致良率低下,」黄仁勋表示。 「这 100% 是英伟达的错。

黄仁勋新访谈:OpenAI是这个时代最具影响力公司之一,马斯克19天创造工程奇迹

10 月 4 日,播客节目 BG2(Brad Gerstner 和 Clark Tang)邀请到了英伟达 CEO 黄仁勋,他们一起讨论了 AGI、机器学习加速、英伟达的竞争优势、推理与训练的重要性、AI 领域未来的市场动态、AI 对各个行业的影响、工作的未来、AI 提高生产力的潜力、开源与闭源之间的平衡、马斯克的 Memphis 超级集群、X.ai、OpenAI、AI 的安全开发等。近日,BG2 发布了这期播客节目。AI在线简要整理了其中的关键信息。

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

英伟达不仅要做显卡领域的领先者,还要在大模型领域逐渐建立起自己的优势。今天,英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。

英伟达RTX 5090功耗高达600W,32G显存,核心比5080多一倍

RTX 50 系列的发布日期可能会在明年初。英伟达的 RTX 50 系列会整出什么新活?随着芯片发布日期的临近,人们的猜测也越来越密集起来。最近,海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息,让我们对新 GPU 有了一些初步的概念。如果消息正确,那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率(TGP)的怪物。这些规格中的许多与之前的曝光内容一致,不过也有一些新的消息。根据最新消息,

英伟达 Jim Fan:复刻NLP的成功路,用通用模型开启具身智能的GPT-3时刻

还记得那只“骑”瑜伽球的机械狗吗? 过马路,走草地都稳稳当当,就算瑜伽球被放气也能如履平地。 怪不得之前有网友惊叹:机器人马上就要统治世界了吧?

英伟达市值一周蒸发4060亿美元,AI时代「卖铲人」怎么就不香了?

「卖铲人」英伟达股价又又又跌了。江湖上流传着一张梗图,说美国经济有两大支柱:一个是创下巡演纪录的泰勒・斯威夫特,一个是人工智能时代的「卖铲人」英伟达。英伟达也确实不负众望,8 月底出炉的 2024 年第二季度财报,成绩相当亮眼。财报显示,英伟达在该季度收入 300.4 亿美元,高于去年同期的 135.1 亿美元,超出了普遍预期的 207.5 亿美元。净利润达到了 166 亿美元,比去年同期增长了 152%。然而,逆天的业绩并未带来股价的狂飙,而是再三暴跌。英伟达股价跌跌跌8 月 29 日,英伟达交出「炸裂」财报后,

AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的

都很贵。AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。当然,答案通常都偏向于英伟达,尤其是在 AI 算力方面,正如前些天李沐在上海交大演讲时谈到的那样:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案,比如在同一个演讲中,李沐还提到了这两家 GPU 的内存情况,对此他表示:「在这一块,虽然英伟

英伟达全新视觉语音模型 NVEagle,可看图聊天;六个月亏了 5 个亿,寒武纪上半年营收仅 6476 万丨AI情报局

今日融资快报无问芯穹完成近5亿元A轮融资无问芯穹致力于提供AGI算力解决方案,以无穹大模型能效优化工具包为基础,旨在解决大模型算法向大算力芯片的高效统一部署问题。 本轮融资联合领投方为社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金,跟投方包括联想创投、小米、软通高科等战略投资方,国开科创、上海人工智能产业投资基金(临港科创投担任管理人)、徐汇科创投等国资基金,以及顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构。 过往投资方包括红杉中国、百度、智谱、同歌创投等。

英伟达首个AI NPC入驻游戏,国产大作,4B模型只需2G显存

玩家都在问:游戏什么时候上线?大模型驱动的游戏 NPC 终于落地了。今天凌晨,英伟达放出一段游戏 demo。现在打游戏,你可以用语音对话的方式和 NPC 交流,了解关卡目标、优化装备配置,随后调整武器配色开始战斗。备受期待的 AI NPC 引擎在多人机甲战斗游戏《解限机》Mecha BREAK 中首次亮相了。全球首次,是国产游戏。作为一款重 PVP 游戏,解限机目标成为全球级电竞产品。它在 8 月份刚刚结束先行测试,不少人表示「封测结束得太早」。目前该游戏在 Steam 平台上愿望单收藏量已超过百万,国内外也出现了

英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强

小模型崛起了。上个月,Meta 发布了 Llama 3.1 系列模型,其中包括 Meta 迄今为止最大的 405B 模型,以及两个较小的模型,参数量分别为 700 亿和 80 亿。Llama 3.1 被认为是引领了开源新时代。然而,新一代的模型虽然性能强大,但部署时仍需要大量计算资源。因此,业界出现了另一种趋势,即开发小型语言模型 (SLM),这种模型在许多语言任务中表现足够出色,部署起来也非常便宜。最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结合,可以从初始较大的模型中逐步获得较小的语言模型。       

谷歌超 25 亿美金收购 Character AI;曝英伟达 AI 芯片遇重大设计缺陷,数百亿美元订单将受影响丨AI情报局

今日融资快报谷歌超 25 亿美金收购 Character AI 并收编团队Character.AI 在官方博客 C.AI 上宣布了与 Google 的并购协议。 谷歌已同意支付模型授权费,并聘请其核心创始人 Noam Shazeer 和 Daniel De Freitas ,以及Character 从事模型训练和语音人工智能工作的员工(约130名员工中的30名),参与Gemini AI项目。 谷歌以25亿美元的估值向Character.AI 的投资者支付等数额的股权价值,未跟随进入谷歌的员工手里的期权将会以每股 88 美元的价格回购,这大约是Character.AI2023 年 A 轮融资股票价值的 2.5 倍。

在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI

「第一波是加速计算,它降低了能耗,下一代 AI 是企业级客户服务。我们希望让每个组织都有机会创建自己的 AI。」

英伟达对话模型ChatQA进化到2.0版本,上下文长度提到128K

开放 LLM 社区正是百花齐放、竞相争鸣的时代,你能看到 Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 等许多表现优良的模型。但是,相比于以 GPT-4-Turbo 为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的 DeepSeek-Coder-V2、用于视觉 - 语言任务的 InternVL

科大讯飞将在港投资 4 亿港元,专注大语言模型等开发;英伟达 Mistral AI 联手发布 12B 参数小模型丨AI情报局

今日融资快报科大讯飞将在香港投资 4 亿港元,并设立国际总部科大讯飞公布了一项为期 5 年的 4 亿港元、投资计划,并在香港设立了国际总部。 公司表示,这项投资计划将支持其组建一支 150 人的研发团队,专注于大语言模型的开发,以及智能语音、教育和医疗等领域的 AI 应用。 科大讯飞副总裁段大为表示:“我们的初期预算是 4 亿港元。