AI 搜索向左,搜索 OG 向右

作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。 这把火原本由 Perplexity 引燃,在美国烧及 Google 和微软,在中国引发了百度、360 的追随,又带动一批创业者跟上,已然成为当下最时髦的热词。 如果大模型之争能够被称为百模大战的话,那么 AI 搜索之争,就可以步其后尘,称之为“百搜大战”了。

作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。

这把火原本由 Perplexity 引燃,在美国烧及 Google 和微软,在中国引发了百度、360 的追随,又带动一批创业者跟上,已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话,那么 AI 搜索之争,就可以步其后尘,称之为“百搜大战”了。

在这场竞赛中,AI 搜索和搜索引擎的区别泾渭分明:

Perplexity 类产品的横空出世,对于搜索引擎似乎已经形成了莫大的威胁。对于大厂派而言,内部的组织惯性、竞价排名商业模式带来的变革阻力,以及用户流失到新的 AI 搜索产品上,成为了他们不被看好的几个话题点。

胜也推理,败也推理

提及 AI 搜索,第一印象,当然是 Perplexity 所自称的“我们不是AI搜索,我们是答案引擎”的自信。用户提出问题,对话框下面直接给出答案,而且还提供了引用来源,给出联想问题,与用户形成进一步的延伸互动。

许多人都对这一问题百思不得其解:AI 搜索有何特殊之处?为什么不管是像 Perplexity 这样的创业公司,还是夸克这种原本做传统搜索引擎的公司,都将 AI 搜索视作新目标?

首先,AI 搜索引擎做到了传统搜索引擎所不能做到的事情——更加智能。

用户使用搜索引擎是为了满足自己的求知需求,每问出一个问题,都希望得到一个明确而具体的答案,而不是传统搜索引擎所给出的相关文档、网页链接等。只是在技术条件达不到的时代,退而求其次,接受搜索引擎将大量网页送到面前,供我们挑选最满意的结果。

但挑选毕竟效率低下。而且用户的需求,不一定恰好有网页可以满足。大模型的出现改变了这一切。

相较于搜索引擎,Perplexity 创始人 Aravind Srinivas更愿意将其描述为一个“答案引擎”——当用户提出问题,它会给出一个简洁、明确的答案,且所有的答案都标明了来源。

之所以做出这样的产品,是因为Aravind Srinivas认为,当前世界中存在海量信息,在信息过载的噪音中,需要有一个平台来为用户提供精准答案。他信奉Google创始人拉里佩奇的一句产品哲学——在人机交互的过程中,用户永远不会犯错。

国内的 AI 搜索类产品,比如秘塔科技、Kimi 等,本质上也是直接通过对话形式给出答案,填补的是传统搜索引擎搜索结果相关度不高、专业知识难以寻找、无法围绕一个问题进行探讨的缺陷。

搜索引擎的 AI 化,则是在原有搜索结果的基础上,增加了一部分通过模型能力生成的答案。百度、夸克都是这种做法,在某些搜索场景中,将生成式答案置顶,后面接续原有的搜索结果。

这两者的区别是,无论是秘塔还是Kimi,所有的答案都是完全基于大模型技术原生出来的内容。而加入大模型技术的搜索引擎,将搜索词(query)分为两类,一类是可以从网上得到标准答案和足够内容的搜索词,一类是可能包含有进一步需求、无法被网上现有内容满足的搜索词。

比如用 Kimi 和夸克同时输入“地球直径”这个搜索词,得到的结果是这样的:

AI 搜索向左,搜索 OG 向右

Kimi 是完全通过推理生成得到的答案,夸克则直接引用了百科的答案。

如果输入变为“地球直径是多少”,得到的结果也发生了变化:

AI 搜索向左,搜索 OG 向右

夸克通过对搜索词分析,判断这两次搜索时的实际需求是不一样的,前者可能只是想了解一个数值,后者可能是想要更多的详细知识。

推理计算是有成本的,尤其是面临着 C 端用户不可计数的需求时,这个成本就很可观了。假设推理成本降低到百分之一,搜索需求增长到一千倍,那这个成本还是要增加为原来的十倍。

搜索引擎的优势就是,他们已经积攒了大量的搜索数据,对用户的需求有了分析和分类,所以他们能够降低这个成本。这是传统搜索引擎多年的布局,新入局的AI搜索工具目前还无法跨越。

AI 搜索是“0”,搜索引擎是“1”

AI 搜索没有门槛。Perplexity 被称为“套壳产品”,因为它的推理能力来自于 ChatGPT,搜索能力则是靠接入 Google 和 Bing 的 API 来实现的。

蜂拥而至的同类产品在证明,这里确实谁都能来掺合一把。大模型时代的这些新公司,要走的是一条从零到一的道路。他们没有用户,没有数据,既没有搜索历史的负担,也没有搜索历史的积累优势,想要突出重围,只能另寻办法。

既然技术上找不到差异,那么那些在产品上有独到思维和差异化能力的,如 Perplexity 的一句话搜索、Kimi 的长文本总结能力等,才能跟其他产品产生用户心智上的差异,让用户记住,争取到一定的生存空间。其他的产品,如果产品的特征仍然是聚焦在类 GPT-4 的对话答案生成中,是没有竞争力的。

与初创企业或是传统搜索厂商不同的是,秘塔科技主要是靠做法律起家。

一位接触秘塔科技的投资人形容秘塔AI搜索是“一个神奇的项目”,原本秘塔所在的法律赛道就算做透了也就只有一两个亿的收入,并不被看好。融资过程中碰壁的秘塔认清这一点后,开始寻找新出路,由于秘塔的能力在于知识整理与搜索,这其实与AI搜索一脉相承,于是团队转向搜索,推出秘塔AI搜索,没想到踩中了风口,一炮而红。

传统的搜索公司,产品形态早已经稳定下来,这阻碍了他们的产品进化和创新。

但是从另一面来说,这些历史包袱带来的也不仅仅是阻碍,还有一些宝贵的财富。传统搜索公司的长处不在于产品,而在于他们的历史数据。比如从前文所述的搜索案例中,他们可以通过不同的关键词来预测用户真实的需求;或者通过一个用户的搜索数据和使用历史,去建立用户的个性化标签,了解用户想要什么。

此外,大模型的技术特点是“预训练”,即擅长记忆与背诵。AI搜索产品如 Perplexity、Kimi 都会遇到 1 个问题,就是 Perplexity 的一句话搜索会吸引的用户也是习惯用一句话搜索的用户,而无法吸引长文本分析搜索的专业用户,Kimi  也会更吸引长文本用户,但对有更多搜索需求的用户吸引力可能不大,造成用户茧房的现象。

了解用户、提升结果的精准度,搜索引擎在 AI 时代是跑在前头的。Perplexity 或者是 Kimi,这些新玩家暂时还没有这样的能力。

StatCounter 数据显示,2024 年 1 月,微软搜索市场份额为 3.43%,Google 搜索为 91.46%,而去年同期,两者分别占 3.03%、92.9%,微弱的增长并没有达到微软预期,Google 霸主地位依然稳固。

谷歌也在伺机反击。

去年 5 月,谷歌内测开放生成式搜索平台 SGE,今年 5 月,又添加可生成摘要呈现在搜索结果顶部的新功能——AI Overviews。对此,谷歌搜索副总裁 Liz Reid 的解释是,“有时你想要一个快速的答案,但并没有时间去拼凑出所需要的所有信息,那么通过 AI Overviews 就可以帮你完成任务。”

Perplexity 的一顿拳打脚踢也引起了非搜索领域厂商的兴趣。今年 4 月,有报道称苹果想要将 Perplexity 收入麾下,为下一代苹果旗舰手机做准备,不过也有业内人士分析称,Perplexity 现在更可能的买家是 Meta 和 Amazon。

技术驱动与用户驱动

虽然初创企业、传统搜索厂商纷纷争相入局做AI搜索,但在整体的探索路径上,大致可以概括为两种流派,一种是聊天机器人式AI问答搜索引擎,另一种是基于传统搜索引擎的对话框升级。

AI 搜索新生代中,又分为两类,一类是如 kimi 般“先技术后产品”,一类是如 Perplexity 般“先产品后技术”。

在技术上,Perplexity走的是典型的“先做产品再做技术”路线,Aravind Srinivas曾豪言“拥有十万用户的套壳产品,比拥有自有模型却没有用户更有意义。”,所以Perplexity的“套壳”之说甚嚣尘上,引发业界臧否。其实Perplexity确实使用的是第三方模型,但团队也在调用大模型时基于产品需求做微调,并打造出更适合需求的模型。

据了解,Perplexity模型用到的大模型有 Mistral AI 的 mistral 系列,以及 Meta 的 llama 系列等,并基于 mistral-7b、llama2-70b进行微调,打造出两款自己的大模型:pplx-7b-online 和 pplx-70b-online。

而除了大模型,Perplexity 的核心技术还包括传统的 RAG(检索增强生成技术),通过增强现有生成模型,使其能够访问外部信息源,提高答案的准确性和可靠性。这项技术的使用,确保了 Perplexity 在处理用户问题时,能够实时搜索互联网并提供准确的最新信息,同时附加可靠来源引用。

而传统搜索引擎代表往往具有强烈的用户驱动意识,如夸克搜索。

传统的搜索引擎,更像是在用户的需求中不断“缝缝补补”。推荐引擎时代来了,要加上推荐引擎,所以手机百度的首页上,要出现文章feed流。大模型时代来了,要加上 AI 能力,所以就要在搜索结果上面加上生成式的内容。

新的技术变革再出现后,搜索引擎还会有新的变化,至于这些变化能不能跟之前的功能相结合,会不会消弭掉产品的特色,可能他们自身也没有想清楚。

AI 搜索是技术驱动的产品,意味着更大的想象空间,有望催生更多更有趣的 AI native 应用。而用户驱动的产品或许有着更大的确定性,但是想象空间呢?没人知道。

另一个更关键的问题是,在用户认知与市场圈地下,AI 搜索的商业化前景如何?

所以,技术驱动诞生的 AI 搜索,在产品形态创新与用户开拓的双重挤压下,仍面临较大的不确定性。

结语

AI 搜索公司缺乏经验和数据积累,但他们有更大的想象空间,能够源源不断带来创新的功能和应用。

传统搜索公司在产品创新与技术实力上略有逊色,但他们有丰富的搜索数据与用户习惯认知,了解用户想要什么。

但是在短时间内,我们认为,Perplexity 是很难替代谷歌的,Kimi 和秘塔也是很难取代百度和夸克的。夸克这样的搜索引擎可以重新训练了一个全栈自研、千亿参数的夸克大模型,建立底层的分布式架构,专门为搜索产品服务。他们瞄准的用户是传统的、仍然有 80% 的需求是确定性答案的搜索用户。而 Perplexity、Kimi 等公司现在要做的,是从传统搜索引擎所无法覆盖的 20% 的市场份额中抢蛋糕。而这个蛋糕,Google 他们也在抢。

鹿死谁手,尚未可知。

给TA打赏
共{{data.count}}人
人已打赏
应用

毒舌AI疯狂Diss特朗普、霉霉等世界名流,网友:嘴真欠!

2024-8-8 18:55:00

应用

统信发布中国首款操作系统级端侧模型 UOS LM,支持问答、翻译、创作等

2024-8-8 19:49:10

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索