访谈 | 陈彩娴
撰文丨朱可轩、赖文昕
编辑丨陈彩娴
本月初,美国知名 AI 芯片创业公司 Cerebras Systems 官宣,其已经向美国证券交易委员会 (“SEC”) 提交了一份有关其普通股首次公开发行的表格 S-1 登记声明草案——这一声明,进一步证实了外界对其今年计划上市的猜想。
Cerebras Systems 成立于 2015 年,创始人是 Andrew Feldman,是一家以打破英伟达垄断为目标的美国 AI 芯片创业公司。它们为业内熟知的标签有二:一是研发了世界上最大的芯片,从最初的 WSE-1到今年新发布的 WSE-3 均体量庞大;二是曾在 2018 年 D 轮获得 OpenAI CEO Sam Altman 的注资。
在过去的数年,Sam Altman 一共参与投资了 3 家芯片公司,除了 Cerebras Systems,还有 Rain Neuromorphics 与 Atomic Semi。这三家都是英伟达在 AI 芯片上的有力助手,而其中 Cerebras Systems 在海内外知名度最高的一个重要原因是:
在一众 AI 芯片创业公司中,Cerebras Systems 是少数商业化比较成功的团队。从公开信息看到自2023 年年底开始,它们的经营现金流已经能持平;也就是说,现在 Cerebras Systems 这家公司已经不怎么烧钱了——这在创业公司中已属难得,在硬件芯片行业则是难上加难。
因此,Cerebras Systems 在资本市场受到热捧,一票难求,除了Open AI 的 Sam Altman外,硅谷数得出名字的VC包括Benchmark、Sequoia、Coatue,之类都成为股东,但国内的 PE 却是寥寥无几。
但不久前,Cerebras Systems 华丽的投资方阵列中出现了一个崭新的名字——3 Capital Investment(以下简称“3Cap”)。值得注意的是,这是一家由华人创立的 AGI 投资基金;更令人诧异的是,这家基金的成立时间不超过一年——2023 年年底筹备、2024 年年初才成立。这是一家开曼注册的纯美元基金,创始人背景相当独特。
3Cap 的创始人兼首席投资官王康曼是一位“跨界天才”:
王康曼祖籍上海,幼年迁居香港,本科在瑞士攻读酒店管理专业,后转向美国攻读物理与政治经济学,毕业后在美工作,当过程序员,后进入华尔街投行工作二十年,在嘉诚国际(现摩根大通)、中金公司、巴克莱银行与交银国际担任资本市场部门主管等职务。
2018 年,王康曼加入商汤科技,担任战略投资和资本市场负责人,主导了商汤从 B 轮融资到 IPO 的融资过程,这段经历为她积累 AI 技术认知、打磨 AI 产业经验作出了不可磨灭的贡献。
王康曼
2023 年 ChatGPT 爆火后,王康曼看到 AI 领域的全球性机会,于是创立了 3Cap,立志做“AGI 时代的投资者”,并在基金创立之初就拿到了开门红——以跟 Sam Altman 同样的估值,投资了 Cerebras Systems。
王康曼判断,AGI 时代的创业与投资机遇主要在数据(Data)、硬件(Hardware)、软件(Software)与反馈循环(Feedback loop)这四块。而据 AI 科技评论了解,3Cap 在起步阶段会首先聚焦于硬件层中 AI Infra 领域的投资。
围绕 AI Infra 的创业与投资,AI 科技评论与王康曼进行了一次深度访谈。对于 AI Infra,王康曼认为,“目前所有的数据中心,其潜在的硬件与软件、尤其是硬件,在未来都需要进行置换。而在这个市场中,玩家肯定不会只有英伟达。”在这一点上,她与 Andrew Feldman 的观点一致。
以下是 AI 科技评论与王康曼的对话实录:
投资 Cerebras Systems 的过程
AI 科技评论:能否谈谈您投资 Cerebras Systems 的契机?
王康曼:Cerebras 是一个很有趣的案例。大家可能都听说,它研发制造了世界上最大的芯片。
我对 Cerebras 的兴趣实际始于六年前。2018 年那,我在一次朋友聚会上遇到 Cerebras 的创始人 Andrew Feldman,他跟我展开了深入的交流,让我印象很深刻。他当时跟我说,他的目标是要挑战英伟达,因为他并不认为 GPU 是用于训练 Foundation Model(基础模型)的最佳方案,而他们的方案(当时已经做了两年)才是最可行。
也就是说,在Transformer架构出来之前,他就已经在思考做基础模型训练需要有一个围绕芯片的完整解决方案。Andrew Feldman 是第一个跟我提到「Foundation Model」的人。
那时候我就知道 Cerebras 这个初创企业在做 AI 芯片相关的事情值得关注。我知道他们发表了很多论文、特别是在提高计算效率方面(的论文),也知道他们逐渐实现商业化,疫情几年他们也没停下来,他们研发的芯片被用于美国国家实验室和 GSK 的疫苗研发。
后来 2023 年我自己创立基金时,我就联系了 Andrew,询问了他们的商业化进展。当时他非常兴奋地告诉我,他们最近跟中东 G42 签署了合同,成为世界上最大的人工智能数据中心解决方案提供商之一。在那个项目中,他们的卡与英伟达的卡各占一半,相当于平分市场。
然后我替他高兴之余,也跟 Andrew 说 3Cap了我们基金的背景(开曼美元基金,海外LP)希望加入他们的投资者行列。当时我去面访他,跟他和他们团队都聊了好久。他考虑后同意给我们份额,至于估值,当时宏观原因,大家对于上市还是有很多不确定性,所以同意了一个现在回头看来特别理想的数字,Sam Altman 是在 2018 年投的他们、我也是 2018 年认识他的,我们估值一样也很合理(笑)。
对创业者来说,他们其实也很看重投资者是否懂他们、懂 AI。除了经济利益外,他们其实也希望跟投资人在项目上合作。也是机缘巧合,我们基金成立后的第一个投资项目就是 Cerebras Systems。
Cerebras Systems 所研发的芯片
AI 科技评论:你们大概什么时候开始投的?
王康曼:去年年底,和 3Cap 的成立几乎同期。
AI 科技评论:那这会是你们回报比较高的一个项目。
王康曼:我相信如果半导体二级市场估值没有太大变动,Cerebras 的上市将为我们的股东带来非常可观的回报。对于我们这样的新基金来说,能够投资这样有潜力并爆发性强的项目是非常重要的,它可以帮助我们建立声誉、并吸引更多志同道合的 LP加入我们。
作为 3Cap 的第一个投资项目,尤其相对现在私人市场的成交,我们在半年内的浮盈已经好几倍。当然,资本市场变化万千,一切都要等 IPO 后才能盖棺定论。Cerebras 上周宣布会在年内上市,希望一切顺利。
我也希望以后所有的项目都这样:一是很难拿到额度;二是要真正专家才懂,但一般财务投资人不一定太熟悉;三是资本市场将会非常认可,这样 3Cap 作为 AGI 时代的一个新基金才能打响名堂。
AI 科技评论:3Cap 是一家比较新的基金,能投到 Cerebras 这样的明星项目,给外界的反差感还挺大的。
王康曼:我当时跟 LP 说我们有 Cerebras Systems 的额度时,他们也都觉得有点难以置信,第一个反应就是“这样的公司这样的估值,怎么可能拿得到”。但Andrew一直特别支持,后来我的一个LP还在硅谷见了Andrew聊了一个下午,这时候大家才反应过来,原来亚洲真的有这么一家新开张的VC有这些独特资源。
其实我和 Andrew 认识多年,几乎是见证了他们成长。同时他也很了解我的经历。我们都创过业,都知道创业背后的辛酸与苦楚,他也知道我对 AI 的算法技术与产业落地有多年的认知积累,在创业初期与创业后期提供的帮助,含金量是不一样的,我很幸运的是我跟 Cerebras 结缘是在早期。
像Cerebras 这样的案例不是个案,只是我们投的第一家。希望以后还有这些独特,有趣的项目带进来我们基金里面。
AI 科技评论:Cerebras 的投资方里华人背景的机构多吗?
王康曼:有,但正式在 Cap Table 上面的寥寥可数。
AI 科技评论: Cerebras Systems 快要上市了,他们的商业化情况如何?
王康曼:Cerebras 是少数在AI芯片初创企业中,商业化已经比较成功的。公开信息里面也提到,他们去年年底已经在经营性现金流层面打平,也就是说基本上不烧钱,这点很少创业公司能做到,更不要说在硬件芯片行业了。
他们落地案例有很多,包括了各地政府和企业龙头,除了欧美还有全球。当中最为有代表性应是他们和中东 G42 的合作,阿联酋要打造全世界最大的 AI 智算中心,当中一半用的是英伟达,另一半是 Cerebras 的方案。
他们的集群 Condor Galaxy 一共6个,加起来36个 exaflop,这个是相当可观的。给大家一个概念,中国预计在 2024 年全年算力大概有 230 个 exaflop,2025 年大概 300 个 exaflop。Cerebras 的产品已经投入在线而且大量应用,这些都是类似起跑线竞争对手没有具备的。所以它们经常被外媒号称“Nvidia challenger”。
其实美国这几年 IPO 市场都比较安静,Cerebras 作为 AI 初创芯片公司第一股,也说明了他们的实力。
AI 科技评论:G42 为什么会选择一半英伟达,一半 Cerebras?
王康曼:原因很简单,G42一直对前沿科技特别感兴趣,建立国家级别云的话,也不能只是用单一系统,一定要有后备系统。他们一直和多家芯片公司保持合作,但Cerebras是当中比较突出成功的案例。
我和 G42 当时做评估的人也有聊过。他们觉得,在性能方面,Cerebras 用的方案跟其他几家完全不一样,他们做大的晶圆片,所以从冗余的角度来说更加安全、高效。G42 在选择供应商时其实测试了很多其他芯片厂商,最后选择了Cerebras。用下来觉得确实不错,去年他们合作又加深了,这也很能说明 Cerebras 的技术含量。
AI科技评论:那您看好 Cerebras 能和英伟达形成竞争的点主要在哪些方面呢?
王康曼: Cerebras的每个组件都针对 AI 工作进行了优化,对软件框架,如PyTorch 2.0,以及常用的AI大模型和技术,比如Diffusion、多模态、ViT、MoE等,提供原生支持。因此在做AI大型模型训练的时候Cerebras 比 H100 快很多也易用很多。举个例子说明,由于Cerebras 不需要进行parallel programming,在它的机器上训练 1750 亿参数的 GPT-3大小的模型,用NV GPU 需要 20507 行综合Python、C/C++、CUDA 和其他代码,而一片 WSE-3 只需 565 行代码。
图片来自网络
AI 科技评论:Cerebras 以芯片“大”而闻名,就您对 Cerebras 的了解,对于 AI 的发展而言,这种更“大”的芯片在性能上有什么优势或壁垒吗?
王康曼:我觉得在大模型时代主要有几方面的优势:
一是能进行大规模并行处理,Cerebras 晶圆级大尺寸芯片的内核数量相比H100增加了 52 倍,增强了并行处理能力,非常适合需要大量计算能力的大模型训练场景;二是大芯片尺寸允许更多的片上内存,减少了对外部内存访问的需求,这样可以加快处理速度。
其余的优势还有简单高速的架构、高带宽、在解决 Sparsity 问题上的表现优异等。
配备 WSE-3 的 CS-3 计算机理论上可以处理 24 万亿参数的大型语言模型,这比 OpenAI 的 GPT-4 等顶级生成式 AI 模型的参数高出一个数量级(据传有 1 万亿参数),在 CS-3 上训练 1 万亿参数模型就像在 GPU 上训练 10 亿参数模型一样简单。
Cerebras 在 AI day 上展示了他们的一个 4 个系统的集群可以在一天内微调 Llama 70B,2048 个系统的 cluster 可以在一天内从头开始训练 Llama 70B。这个的意义就是大模型的迭代可以非常快,可以快速试错和迭代。
AI科技评论:成本这块 Cerebras 有优势吗?
王康曼:Cerebras 每个系统比英伟达要高,确实是一笔较大的初始投入。但由于效率的提升,随着时间的推移,总拥有成本(TCO)会有竞争力。
数据中心运营商非常重视高效的电力使用,因为这直接影响到总拥有成本。AI 硬件由于其巨大的计算密度,特别耗电。CS-3 的峰值功耗为 23kW,而 DGX B200 的峰值功耗为 14.3kW。然而,CS-3 的速度显著更快,可达 125 petaflops,而 DGX B200 则为 36 petaflops,每瓦性能提高2.2倍,这样一个 CS-3 系统的整个生命周期将电力费用减少一半以上。
Cerebras 的 WSE 可以完成多个 GPU 的工作,能减少所需硬件的总数,那么由于需要管理的单元数量减少,运营成本如电力消耗和冷却也可能降低,更不用提构建集群所需的人力物力成本了。
3Cap 如何做 AI 投资?
AI 科技评论:去年 12 月您创立了 3Cap,您为什么会选择在这个时间点创立一个基金?
王康曼:早些年,AI 是个新领域,大家都在探索产品如何理论变实践,如何成功落地。而去年是 AI 2.0 的元年,AI 技术开始普及,成为大家都可以使用的工具。
我认为 2.0 时代存在很多机会,我创立 3Cap,其实也是希望通过自己的经验积累,更灵活地捕捉全球 AI 2.0 时代的机会。我相信亚洲有我这类背景的投资人不算多,我90年代几乎刚毕业就在华尔街,当时比较少华人在 front office, 所以给到我的机会与挑战都特别多,同时有幸在资本市场很早就接触科技项目,对当地资源有比较深厚积累,同时,在过去六年,也就是AI1.0时代,投资了几十个AI 相关项目,并有幸在AI巨头里面见证创业并成功退出。
AI 科技评论:现在你们一共投了多少个项目?
王康曼:暂时只投了两个,包括 Cerebras 在内。另一个是一家运营做得比较好的公司,是华人在西雅图创立的公司,偏应用层,但是这块以后不是 3Cap 的投资重点,只是因为团队非常出色,所以投了他们。
AI 科技评论:在澳门 Beyond Expo 上,您有谈到 3Cap 最早是注重 AI Infra 与硬件上。
王康曼:作为一家美元基金,我们的投资视野不局限于国内项目,而是扩展到东南亚、日本、美国等地。那我们的首要任务就是确保所有投资项目都能存活下来,因为我们基金的结构是 4+4 模式,即四年投资期加四年退出期。
在互联网周期中,有些公司一开始可能估值很高,但一两年后可能就会迅速衰落。AI 领域的周期可能会更加剧烈。在移动互联网时代,比如京东、美团这样的企业,即使十年不盈利,市场也能接受,但在 AI 时代,投资者可能无法忍受这样的长期不盈利。因此,从我们基金的角度来看,必须投资那些在未来四五年内依然能够存续的公司。
每个赛道都有其投资机会,但从我的角度来看,AI Infra 部分的确定性相对较高,因为 AI 行业真正意义上从 2.0 开始算,实际上发展才刚刚开始一年半。其实所有的基础设施都还未完全准备好,这就是为什么英伟达的股价能够如此快速上涨。我非常认同这样的观点——目前所有的数据中心,其潜在的硬件和软件,主要是硬件,都需要进行置换,其中肯定不会只是英伟达。
你可以想象,如果在 150 年前,工业 1.0 时代到来时,从马车转向蒸汽汽车,我们会考虑投资哪些公司,肯定优先考虑那些制造发动机的公司,因为未来将需要大量的发动机。
那推溯到今天,AI infrastructure 这一层应该有一些未来五年一直在的公司,在芯片上会取代英伟达本身的一些设计,可能不会完全吃掉英伟达,但肯定会降低它的市占率。所以,在投资的角度,我会先聚焦在 infrastructure 这一块。
其实我最近看了一个特别有趣的数据,是说对比过去一两年,今年 AI 的投资是暴涨,亚洲在 AI 这块投了挺多 Data Center(数据中心)。Data Center 在这里的定义是基建,这类投资周期较长,大概十年左右,但比较稳定,所以对很多大基金有吸引力。
因为我们的基金刚刚成立,这些动不动几十亿美金的项目不会是我们这个阶段的重点,所以我们要投 Data Center 上面有附加值的项目。
AI 科技评论:对比来看,海外的 AI 投资有什么趋势吗?
王康曼:海外市场在 AI 领域的投资趋势显示,大模型非常受欢迎,例如,OpenAI 获得了 100 亿美元的估值,早阵子xAI 种子轮也相当多知名投资人参与。过去几周二级市场对AI板块稍有调整,我觉得这很正常,也健康。整体一级市场还算相对理性,头部效应也比较明显。
此外,海外投资者对能源领域也表现出浓厚兴趣,因为 AI 的耗电量巨大。中国拥有众多核电站,但美国近年来新增的核电站并不多,AI 的耗电量却在急剧上升。因此,海外市场对如何为 AI 提供绿色能源的项目也表现出了浓厚的兴趣,这块是AI Infra的上游。
AI 科技评论:从 AI 1.0 发展到 AI 2.0,您有感受到行业在迅速变快吗?
王康曼:这个问题很好。其实 PC 时代持续了几十年,移动互联网时代大约十几年,而 AI 时代可能只有几年。行业的波动变得更加剧烈,高峰和低谷的差距越来越大,这意味着行业的洗牌可能会更快。
从我们投资人角度来看,这有好处也有坏处,好处就在于不好的企业可以更快地被淘汰,而能够在 AI 2.0 浪潮中生存下来的企业,其最终估值可能会比以前的企业高。如果你错过了第一波,并不一定意味着为时已晚。
但作为风险投资者,我们更关注早期项目,希望这些公司四年后仍然存在。我们认为,能够在快速变化中生存的公司,应该还是在 Infra 这一块。
AI 科技评论:所以您觉得投资的风险会增高吗?3Cap 怎么规避风险?
王康曼:会。所以我们就投两种,一种是非常前期的项目,一种是我们知道可以相对比较快商业化落地的项目。投资的话,一定要看能不能够在最快的时间内体现价值,而且能在合理商业条款下退出。
AI 科技评论:AI 投资需要既懂 AI、又懂投融资。您认为您在 AI 产业的积累对您与 AI 技术创业者交流有什么帮助?
王康曼:我觉得每一个浪潮都会有一波新的投资人进来。从 80 年代的 PC 浪潮到互联网、移动互联网,每个时代的科技背后都有特别懂它的投资人出现,所以我觉得 AI 2.0 时代也会有一波特别懂 AI 的人成为投资人,我希望 3Cap 能成为其中之一。
我年纪大了 (笑)经历了三个大周期,包括互联网泡沫、亚洲金融风暴和全球金融危机,对资本市场熟悉之余也有敬畏之心,加上我也亲自参与了 AI 行业的发展,从企业的成功和失败中学到了很多。有这种经验组合的投资人不多,在这方面,3Cap 有自己的优势。
投资其实是很反人性的。所有的投资的热点一开始的时候都是有一窝蜂的人去做,无论是投资人、创业者,还是现有的公司,但真正懂得在里面挑的还是少数。你可以参考一个网页叫 AI Graveyard,里面都是去年一窝蜂成立现在不能存活下去的公司。
AI Infra 重构正在加速
AI 科技评论:您认为是什么在支撑一个 AI 公司的估值?
王康曼:首先要看是在 AI 的哪一个领域,因为现在很多事物都能和 AI 扯上关系。但在 AI 2.0 时代,我觉得创业与投资的机会是在四个方面:数据、硬件、软件和反馈循环(feedback loop)。
第一个是数据。数据收集和创建是一种艺术和科学的结合,比如 OpenAI 和 Anthropic 在数据收集和创建上有不同的方法,所以结果不同。还有就是 Organic 和 Synthetic (人类和机器产生)数据的占比,后者可以引致 model collapse 要调动的函数很多。
第二是硬件。GPU 本身是用来打游戏而不是做运算的,虽然在训练和推理中很快,但架构需要优化,现在有很多团队在提高 GPU 效率或开发新的芯片架构。我相信英伟达的市场占有率会被新的创业团队占领、削少,这是很大的一块市场。
第三个就是软件层。每个国家最终可能只需要几个大模型,关键在于找到那些能够存活下来的公司。
反馈循环也很重要,即看产品应用出来后的效果,能否快速知道并改进。
中国在这方面有优势,可以在半周内根据反馈做出新的原型,而国外公司可能需要三个月。就 AI 这一块而言,首先中国人多,所以试错成本低,其次中国在运营方面比很多国外公司都有优势。
因为投资人爱看如何商业化落地,但如果没有运营、没有反馈循环,商业化是做不好的。
AI 科技评论:Feedback loop 可以理解为应用吗?还是说要加上运营?
王康曼:应用加运营。比如现在做得很好的抖音、美团,他们有运营的基因,AI 是个帮助他们运营得更好的工具,AI 本身不是一个产品,如何把 AI 用在你的产品上面,让大家无论是企业、政府还是个人都离不开它,这就是运营,这个是很重要的。我觉得在这一点上,国内会有很多优秀的公司出来。
AI 科技评论:像 Etched AI 现在也很热门,但是有业内观点认为,这种专门基于 Transformer 设计的 ASIC 芯片不能 make sense,一旦出现新的架构替代 Transformer,他们就会失去存在价值。
王康曼:我们首先要思考:Transformer 是不是一个可持续的技术浪潮?如果是,这个问题不言自明;如果不是,那么这个团队有没有可持续能力和资源去面对以后新的架构生态?
Etched 是 ASIC设计,专门针对 Transformer 架构进行了优化,目前还是会有较好效果的,但是由于缺乏通用性,一旦新的架构出现并替代了Transformer,它们就会失去竞争力。
而我个人认为新的范式出现只是时间问题。纵横历史,每 5 到 10 年,人工智能就会有大牛给出新的范式。从专家系统到决策树,到 SVM (support vector machine),到神经网络、深度学习,都是阶段性的技术。十年后我们还用不用 Transformer 真的不好说。
而历史上,每一个新的范式出现,之前的范式都会被拍死。我相信新的芯片范式也可能潜在颠覆人工智能算法。这个回复,我们可以十年回头看看对不对。但就目前的模型发展趋势来看,Transformer 还是比较难撼动的。
我们在研判是否投资这类公司的时候,同时也需要进一步考察公司的研发团队背景和实力,了解他们是否具备持续创新的能力,以及在其他潜在替代架构上的研究和储备。
AI 科技评论:您觉得在 AI 2.0 时代,硬件计算这块的创业公司有出现什么新的机遇吗?
王康曼:我们接触了解了几十家公司,包括大家可能比较熟悉的 Graphcore、Samba Nova、Tenstorrent、Groq、Untether、Mythic 等,它们各有特色。
AI 2.0 Act One 会有更多训练场景,我们相信 Cerebras 是很好的标的,而 Act Two 会有两个大主题,一个是会更看重推理,另一个就是相对训练英伟达垄断,推理会有更多芯片公司,这块会百花齐放。
Groq 就是很好的案例,他们在Meta Llama 3.1反馈很好。Samba Nova也很不错,和Groq一样也是ASIC 架构,他们存储用了HBM + SRAM 混合方案。成本比Groq要低不少,产品成熟度也高,Oracle、Stanford、高盛都在用,也值得关注。当然还有很多,譬如脑机芯片等等,到最后都是一个技术、商业化、回报的平衡。
AI 2.0 无论创业,投资专业门槛都比之前要高,我们团队既然有这个背景,那就该利用自己的优势,创造超预期收益。
AI 科技评论:从 Cerebras Systems 的投资来看,感觉您是一个长期主义者。
王康曼:我觉得无论做人做事情都要长期主义,因为信用是需要长年累月积累下来的。真正的长期主义要陪跑,在好的时候要陪跑,在坏的时候更加要陪跑。
投钱是重要的第一步,可以说是马拉松里面的第一公里,但第一公里不是最辛苦的,第二,三十公里才是。对VC来说,之后更加重要的给到创始人怎么样的资源、包括招人、对接潜在客户、投资人,如何退出等等,这些都是不可或缺的过程,当中需要的是耐心,意志力和责任心。这些做好了,给LP的回报才会高。