虽然 ChatGPT API 开放之后,应用本钱降低了九成,但对于 OpenAI 和集成 ChatGPT 的科技公司来讲,情况却大不相同。
众所周知,在google搜刮的时代,搜刮引擎的工作原理是建立巨大的网络索引,在用户进行搜刮时,这些索引条目会被扫描、排名和分类,随后结果显示出最相关的条目。google的搜刮结果页面实际上会告诉用户搜刮所须要的时间(通常不到一秒)。
而 ChatGPT 式的搜刮引擎会在每次搜刮时启动一个模仿人脑的巨大神经网络,生成一堆文本,能够还会查问庞大搜刮索引以获取事实信息。这意味着用户与其交互的时间能够远远超过几分之一秒,并且这些额外的处理须要花费更多的本钱。
据路透社报道,Alphabet(google的母公司)的董事长 John Hennessy 及几位分析师交谈之后写道:「与 AI 庞大谈话模型交流询问的本钱能够是标准关键字搜刮的 10 倍以上」。对于致力于推行 ChatGPT 式搜刮引擎的google、微软来讲,这能够意味着「数十亿美元的额外本钱」。
Alphabet 董事长 John Hennessy。
虽然 ChatGPT 这个研发热点肯定是要跟的,但付出的本钱是各家公司能够承担的吗?
微软:上万块 A100,为 OpenAI 造超算
微软的答案是肯定的,而且它还要进一步增加相关的研发投入。
彭博社报道,微软花费了数亿美元为 OpenAI 建造了一台巨大的超级算计机,应用了「成千上万块 GPU」以推动 OpenAI 的 ChatGPT 谈天机器人。
据彭博社获得的回复,微软人工智能和云算计副总裁 Scott Guthrie 说,公司在该项目上花费了数亿美元的资金。虽然这对微软来讲能够不值一提,毕竟它最近延长了对 OpenAI 的多年、数十亿美元的投资,但这无疑表明,微软愿意在人工智能领域投入更多资金。
在本周一的博客中,微软介绍了它是如何创建 OpenAI 应用的强大的 Azure 人工智能基础设施,以及其系统如何变得更加强大。
比如微软推出了新的虚拟机 —— 应用英伟达 H100 和 A100 Tensor Core GPU 以及 Quantum-2 InfiniBand 网络,这是两家公司去年就预告过的项目。这将允许 OpenAI 和其他依赖 Azure 的公司训练更大、更复杂的 AI 模型。
「大约五年前,OpenAI 向微软提出了一个大胆的想法,即它可以构建将永远改变人们与算计机交互方式的人工智能系统。」John Roach 写道。
当时,没有人知道这将意味着什么。现在,我们理解了这种设想 ——ChatGPT,并体验到了它的魔力:AI 系统可以创建人们用简单谈话描述的任何图片,谈天机器人可以根据少量单词编写说唱歌词、起草电子邮件和规划整个菜单。
像这样的技术,在当时看来未必不能够。只是为了构建它,OpenAI 须要真正大规模的算计能力。
2019 年,微软公司宣布向 OpenAI 投资 10 亿美元,同意为这家 AI 研究初创公司建造一台大规模的前沿超级算计机。当时唯一的问题是:微软没有 OpenAI 所须要的东西,也不完全确定能在自己的 Azure 云服务中建造这么大的东西而不崩溃。现在,这个承诺终于兑现了。
微软表示,为了建立给 OpenAI 项目提供动力的超级算计机,它在 Azure 云算计平台上「将成千上万的英伟达 GPU 连接在一起」。反过来,这使得 OpenAI 能够训练出越来越强大的模型,并「释放出 AI 能力」,比如 ChatGPT 和必应工具。
这些突破的关键是学习如何构建、操作和维护数万个在高吞吐量、低延迟 InfiniBand 网络上相互连接的共置 GPU。这个规模甚至比 GPU 和网络设备供应商测试过的还要大。这是一片未知的领域,没有人确切知道硬件是否可以在不损坏的情况下被推到那么远。为了训练一个庞大谈话模型,算计工作量被分配到一个集群中的数千个 GPU 上。在算计的某些阶段(称为 allreduce),GPU 会交换有关它们已完成工作的信息。InfiniBand 网络加速了这一阶段,该阶段必须在 GPU 开始下一个算计块之前完成。
「我们看到的是,我们将须要建立专注于实现庞大训练工作负载的特殊用途集群,而 OpenAI 是这一点的早期证明之一,」微软 Azure AI 企业副总裁 Eric Boyd 在一份声明中说。「我们与他们紧密合作,了解他们在建立训练环境时寻找的、须要的关键是什么。」
google:加紧内测 Big Bard
相比于微软,google的搜刮本钱问题无疑更大。微软之所以如此渴望撼动google搜刮引擎,部分原因就是在大多数市场份额估计中,必应只占全球搜刮市场的 3%,而google约占 93%。搜刮是google的主要业务,而微软并不须要担心这一点。
根据 Morgan Stanley 的估算 —— 假设「类 ChatGPT 的 AI 能够用 50 个词(word)的答案处理一半的查问」,google每年的本钱将增加 60 亿美元。
有趣的是,google从一开始就对模型规模持谨慎态度。google表示 Bard 谈天机器人最初发布的是 LaMDA 轻量级模型版本,原因是「这个更小的模型须要更少的算计能力,才能够扩展到更多的用户,得到更多的反馈。」要知道这不是google的常见操作,google经常在模型规模方面让其他公司相形见绌,在算计资源方面也是极具优势。「规模」只是google花点钱就能解决的问题,除非本钱增加的不是一点半点。
根据 Insider 的最新消息,google正在测试一个名为 Big Bard 的模型,它是 Bard 的高级版本,应用了与 Bard 相同的谈话模型 LaMDA。
根据内测示例显示,对于相同的问题,Big Bard 给出了更丰富、更人性化的回答,它通常也更健谈、更随意。不过不是所有员工都可以内测 Big Bard ,它是有限制的,仅供部分员工应用,而 Bard 则对所有google员工开放。
除此以外,Big Bard 应用更大规模的 LaMDA,AI 技术为其谈天机器人提供支持。google表示 Big Bard 是其在布局对话模型计划中的一部分,该计划旨在创建一个通用谈天机器人,可以回答用户在其产品和服务中提出的任何问题或请求。
出于本钱考虑,google能够会推出 Bard 的限量版。然而,这场人工智能竞赛并没有放缓的迹象。上周有消息传出,多模态的 GPT-4 将于本周发布。看来微软和google的对打一时半会儿还停不下来。
商业模式如何跑通?
类 ChatGPT 产品能为科技公司带来多大的收益,目前很难衡量。有一个已知的例子,google和亚马逊的语音助手多年来一直保持「以后再想办法」的盈利思路,目前都未能产生利润,而且它们是比 ChatGPT 更受限制的谈天机器人。OpenAI 在开放 ChatGPT API 之后,以 token 为单位收取费用,但这对搜刮引擎来讲并不适用。
微软方面已经准备「在必应谈天机器人生成的回复中插入广告」,补偿其高昂的服务器运行本钱。
在开放 API 之后,越来越多的企业用户将与 OpenAI 合作,将其 ChatGPT 服务集成到自己的产品中。大多数公司应用 ChatGPT 等庞大谈话模型来帮助客户制作企业博客、营销电子邮件等等,而工作量比以前少得多。然而,这些公司的产品几乎都是给庞大谈话模型套了一个简单的「外壳」,因此很难实现差异化竞争优势。
实际上,OpenAI 最近还推出了 4 个 GPT-3 模型 ——Davinci、Curie、Babbage 和 Ada。其中 Davinci 是功能最强大的模型,Ada 则是速度最快的。Davinci 被一些公司认为是开发产品的更好选择,它的输出往往比 ChatGPT 的更简洁、更直接,并且在某些类别的 prompt 下也表现更好。而 ChatGPT 在一些关键领域优于 Davinci,包括数学、情绪分析等等。
值得注意的是,OpenAI 为 Davinci API 设置的定价是 ChatGPT 的十倍。因此近几周内,大多数 Davinci 用户能够会涌向 ChatGPT。对于 OpenAI 和其竞争对手(包括 Cohere、AI21、Anthropic、Hugging Face)来讲,Davinci 的定价似乎更加合理。至于 ChatGPT,它的超低定价会让行业内的同类产品价格大幅下跌,包括 OpenAI 自己的产品。
将 ChatGPT API 的价格设置得如此低的水平(只有原来的十分之一)之后,很难说 OpenAI 会从 ChatGPT 或其他任何模型中获利还是亏损,因为这些超大规模的模型查问本钱非常高。有人猜测:OpenAI 能够已经通过剔除自 11 月首次亮相以来全世界提出的无数 ChatGPT 查问中很少激活的参数,修剪了支持 ChatGPT 的模型以降低模型本钱。但这只是一个猜测。
接下来的一段时间,OpenAI 能够会因为 ChatGPT 被大量应用而亏损。这听起来有点反直觉,但庞大谈话模型的训练和运行本钱确实非常高。但对于获得微软 100 亿美元和 GPU 全力支持的 OpenAI 来讲,「薄利多销」也能让它比其他竞争对手走得更远。
参考链接:
https://news.microsoft.com/source/features/ai/how-microsofts-bet-on-azure-unlocked-an-ai-revolution/
https://www.bloomberg.com/news/articles/2023-03-13/microsoft-built-an-expensive-supercomputer-to-power-openai-s-chatgpt?srnd=technology-vp#xj4y7vzkg
https://arstechnica.com/gadgets/2023/02/chatgpt-style-search-represents-a-10x-cost-increase-for-google-microsoft/
https://arstechnica.com/gadgets/2023/03/has-the-generative-ai-pricing-collapse-already-started/
https://www.businessinsider.com/google-employees-test-smarter-chatbot-big-bard-2023-3