作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。
这把火原本由 Perplexity 引燃,在美国烧及 Google 和微软,在中国引发了百度、360 的追随,又带动一批创业者跟上,已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话,那么 AI 搜索之争,就可以步其后尘,称之为“百搜大战”了。
在这场竞赛中,AI 搜索和搜索引擎的区别泾渭分明:
Perplexity 类产品的横空出世,对于搜索引擎似乎已经形成了莫大的威胁。对于大厂派而言,内部的组织惯性、竞价排名商业模式带来的变革阻力,以及用户流失到新的 AI 搜索产品上,成为了他们不被看好的几个话题点。
胜也推理,败也推理
提及 AI 搜索,第一印象,当然是 Perplexity 所自称的“我们不是AI搜索,我们是答案引擎”的自信。用户提出问题,对话框下面直接给出答案,而且还提供了引用来源,给出联想问题,与用户形成进一步的延伸互动。
许多人都对这一问题百思不得其解:AI 搜索有何特殊之处?为什么不管是像 Perplexity 这样的创业公司,还是夸克这种原本做传统搜索引擎的公司,都将 AI 搜索视作新目标?
首先,AI 搜索引擎做到了传统搜索引擎所不能做到的事情——更加智能。
用户使用搜索引擎是为了满足自己的求知需求,每问出一个问题,都希望得到一个明确而具体的答案,而不是传统搜索引擎所给出的相关文档、网页链接等。只是在技术条件达不到的时代,退而求其次,接受搜索引擎将大量网页送到面前,供我们挑选最满意的结果。
但挑选毕竟效率低下。而且用户的需求,不一定恰好有网页可以满足。大模型的出现改变了这一切。
相较于搜索引擎,Perplexity 创始人 Aravind Srinivas更愿意将其描述为一个“答案引擎”——当用户提出问题,它会给出一个简洁、明确的答案,且所有的答案都标明了来源。
之所以做出这样的产品,是因为Aravind Srinivas认为,当前世界中存在海量信息,在信息过载的噪音中,需要有一个平台来为用户提供精准答案。他信奉Google创始人拉里佩奇的一句产品哲学——在人机交互的过程中,用户永远不会犯错。
国内的 AI 搜索类产品,比如秘塔科技、Kimi 等,本质上也是直接通过对话形式给出答案,填补的是传统搜索引擎搜索结果相关度不高、专业知识难以寻找、无法围绕一个问题进行探讨的缺陷。
搜索引擎的 AI 化,则是在原有搜索结果的基础上,增加了一部分通过模型能力生成的答案。百度、夸克都是这种做法,在某些搜索场景中,将生成式答案置顶,后面接续原有的搜索结果。
这两者的区别是,无论是秘塔还是Kimi,所有的答案都是完全基于大模型技术原生出来的内容。而加入大模型技术的搜索引擎,将搜索词(query)分为两类,一类是可以从网上得到标准答案和足够内容的搜索词,一类是可能包含有进一步需求、无法被网上现有内容满足的搜索词。
比如用 Kimi 和夸克同时输入“地球直径”这个搜索词,得到的结果是这样的:
Kimi 是完全通过推理生成得到的答案,夸克则直接引用了百科的答案。
如果输入变为“地球直径是多少”,得到的结果也发生了变化:
夸克通过对搜索词分析,判断这两次搜索时的实际需求是不一样的,前者可能只是想了解一个数值,后者可能是想要更多的详细知识。
推理计算是有成本的,尤其是面临着 C 端用户不可计数的需求时,这个成本就很可观了。假设推理成本降低到百分之一,搜索需求增长到一千倍,那这个成本还是要增加为原来的十倍。
搜索引擎的优势就是,他们已经积攒了大量的搜索数据,对用户的需求有了分析和分类,所以他们能够降低这个成本。这是传统搜索引擎多年的布局,新入局的AI搜索工具目前还无法跨越。
AI 搜索是“0”,搜索引擎是“1”
AI 搜索没有门槛。Perplexity 被称为“套壳产品”,因为它的推理能力来自于 ChatGPT,搜索能力则是靠接入 Google 和 Bing 的 API 来实现的。
蜂拥而至的同类产品在证明,这里确实谁都能来掺合一把。大模型时代的这些新公司,要走的是一条从零到一的道路。他们没有用户,没有数据,既没有搜索历史的负担,也没有搜索历史的积累优势,想要突出重围,只能另寻办法。
既然技术上找不到差异,那么那些在产品上有独到思维和差异化能力的,如 Perplexity 的一句话搜索、Kimi 的长文本总结能力等,才能跟其他产品产生用户心智上的差异,让用户记住,争取到一定的生存空间。其他的产品,如果产品的特征仍然是聚焦在类 GPT-4 的对话答案生成中,是没有竞争力的。
与初创企业或是传统搜索厂商不同的是,秘塔科技主要是靠做法律起家。
一位接触秘塔科技的投资人形容秘塔AI搜索是“一个神奇的项目”,原本秘塔所在的法律赛道就算做透了也就只有一两个亿的收入,并不被看好。融资过程中碰壁的秘塔认清这一点后,开始寻找新出路,由于秘塔的能力在于知识整理与搜索,这其实与AI搜索一脉相承,于是团队转向搜索,推出秘塔AI搜索,没想到踩中了风口,一炮而红。
传统的搜索公司,产品形态早已经稳定下来,这阻碍了他们的产品进化和创新。
但是从另一面来说,这些历史包袱带来的也不仅仅是阻碍,还有一些宝贵的财富。传统搜索公司的长处不在于产品,而在于他们的历史数据。比如从前文所述的搜索案例中,他们可以通过不同的关键词来预测用户真实的需求;或者通过一个用户的搜索数据和使用历史,去建立用户的个性化标签,了解用户想要什么。
此外,大模型的技术特点是“预训练”,即擅长记忆与背诵。AI搜索产品如 Perplexity、Kimi 都会遇到 1 个问题,就是 Perplexity 的一句话搜索会吸引的用户也是习惯用一句话搜索的用户,而无法吸引长文本分析搜索的专业用户,Kimi 也会更吸引长文本用户,但对有更多搜索需求的用户吸引力可能不大,造成用户茧房的现象。
了解用户、提升结果的精准度,搜索引擎在 AI 时代是跑在前头的。Perplexity 或者是 Kimi,这些新玩家暂时还没有这样的能力。
StatCounter 数据显示,2024 年 1 月,微软搜索市场份额为 3.43%,Google 搜索为 91.46%,而去年同期,两者分别占 3.03%、92.9%,微弱的增长并没有达到微软预期,Google 霸主地位依然稳固。
谷歌也在伺机反击。
去年 5 月,谷歌内测开放生成式搜索平台 SGE,今年 5 月,又添加可生成摘要呈现在搜索结果顶部的新功能——AI Overviews。对此,谷歌搜索副总裁 Liz Reid 的解释是,“有时你想要一个快速的答案,但并没有时间去拼凑出所需要的所有信息,那么通过 AI Overviews 就可以帮你完成任务。”
Perplexity 的一顿拳打脚踢也引起了非搜索领域厂商的兴趣。今年 4 月,有报道称苹果想要将 Perplexity 收入麾下,为下一代苹果旗舰手机做准备,不过也有业内人士分析称,Perplexity 现在更可能的买家是 Meta 和 Amazon。
技术驱动与用户驱动
虽然初创企业、传统搜索厂商纷纷争相入局做AI搜索,但在整体的探索路径上,大致可以概括为两种流派,一种是聊天机器人式AI问答搜索引擎,另一种是基于传统搜索引擎的对话框升级。
AI 搜索新生代中,又分为两类,一类是如 kimi 般“先技术后产品”,一类是如 Perplexity 般“先产品后技术”。
在技术上,Perplexity走的是典型的“先做产品再做技术”路线,Aravind Srinivas曾豪言“拥有十万用户的套壳产品,比拥有自有模型却没有用户更有意义。”,所以Perplexity的“套壳”之说甚嚣尘上,引发业界臧否。其实Perplexity确实使用的是第三方模型,但团队也在调用大模型时基于产品需求做微调,并打造出更适合需求的模型。
据了解,Perplexity模型用到的大模型有 Mistral AI 的 mistral 系列,以及 Meta 的 llama 系列等,并基于 mistral-7b、llama2-70b进行微调,打造出两款自己的大模型:pplx-7b-online 和 pplx-70b-online。
而除了大模型,Perplexity 的核心技术还包括传统的 RAG(检索增强生成技术),通过增强现有生成模型,使其能够访问外部信息源,提高答案的准确性和可靠性。这项技术的使用,确保了 Perplexity 在处理用户问题时,能够实时搜索互联网并提供准确的最新信息,同时附加可靠来源引用。
而传统搜索引擎代表往往具有强烈的用户驱动意识,如夸克搜索。
传统的搜索引擎,更像是在用户的需求中不断“缝缝补补”。推荐引擎时代来了,要加上推荐引擎,所以手机百度的首页上,要出现文章feed流。大模型时代来了,要加上 AI 能力,所以就要在搜索结果上面加上生成式的内容。
新的技术变革再出现后,搜索引擎还会有新的变化,至于这些变化能不能跟之前的功能相结合,会不会消弭掉产品的特色,可能他们自身也没有想清楚。
AI 搜索是技术驱动的产品,意味着更大的想象空间,有望催生更多更有趣的 AI native 应用。而用户驱动的产品或许有着更大的确定性,但是想象空间呢?没人知道。
另一个更关键的问题是,在用户认知与市场圈地下,AI 搜索的商业化前景如何?
所以,技术驱动诞生的 AI 搜索,在产品形态创新与用户开拓的双重挤压下,仍面临较大的不确定性。
结语
AI 搜索公司缺乏经验和数据积累,但他们有更大的想象空间,能够源源不断带来创新的功能和应用。
传统搜索公司在产品创新与技术实力上略有逊色,但他们有丰富的搜索数据与用户习惯认知,了解用户想要什么。
但是在短时间内,我们认为,Perplexity 是很难替代谷歌的,Kimi 和秘塔也是很难取代百度和夸克的。夸克这样的搜索引擎可以重新训练了一个全栈自研、千亿参数的夸克大模型,建立底层的分布式架构,专门为搜索产品服务。他们瞄准的用户是传统的、仍然有 80% 的需求是确定性答案的搜索用户。而 Perplexity、Kimi 等公司现在要做的,是从传统搜索引擎所无法覆盖的 20% 的市场份额中抢蛋糕。而这个蛋糕,Google 他们也在抢。
鹿死谁手,尚未可知。