Kimi 正在重新定义「AI 搜索」

AI搜索的故事是这么讲的:传统搜索过程需要输入关键词,然后机械地反馈回来具有相关性的数十个蓝色链接。 AI搜索则不是返回链接,而是帮助总结好的内容、聚合一份「答案」。 为了让这份答案看起来更加丰富,很多产品还提供更高级的深度搜索或研究模式。

AI搜索的故事是这么讲的:传统搜索过程需要输入关键词,然后机械地反馈回来具有相关性的数十个蓝色链接。AI搜索则不是返回链接,而是帮助总结好的内容、聚合一份「答案」。

为了让这份答案看起来更加丰富,很多产品还提供更高级的深度搜索或研究模式。其实就是不管问什么,AI 搜索引擎都会给出一份更长、更综合的报告……这样的AI高级搜索,倒是充分发挥了大模型的特长:拼凑大量的信息。

然而,这些内容看似丰富、信息量大,但实际有用的信息却不多。用户需要从大量的冗余信息里,再挑选一遍有用的部分。

本来是10个蓝色的链接,很容易辨别哪个信息源质量更高,现在是混在一起的一份形式主义的报告,要浪费更多时间才能从中再挑出有用的信息。

形式主义当然有它的用处,比如用来唬人。但大部分情况下,人们更倾向于尽快得到自己想要的信息,而不是东拉西扯,迟迟不入正题。

所以究竟AI搜索应该怎么做?我们需要更多不同的答案,需要做更多方向探索。

巧了,国庆节刚过,就传来了Kimi内测「探索版」的消息。找月之暗面的同学要了内测资格,体验一番后,不得不说,这可能就是我们早该探索的AI搜索方向——让AI自己去跟搜索引擎斗智斗勇,我们就能省下来时间,去想更好的问题。

先举一个特别简单的例子。我的问题看起来并不难,但你通过任何一个传统搜索引擎和AI搜索来找到答案却不那么容易。

Kimi 正在重新定义「AI 搜索」

Kimi 探索版是怎么办的?它把我的搜索词转成了各种英文词去搜索……就是这么一个对人来说,有不小难度——不是每个人都能翻译为标准的英文,大部分人也懒得自己去用翻译软件,或者让AI先翻译成英文——但特别适合AI的方法,就真的第一时间把我需要找的名单给找到了,而且很全,而且标注了索引来源,我可以第一时间去验证真实性。这不就是AI该干的事情吗?

Kimi 正在重新定义「AI 搜索」

AI 还该干什么?

海量地搜、穷尽式地去搜,一次搞几十个关键词,搜几百个网页。搜到我看完就不想自己再打开搜索引擎输入一个字了……

过去,为了找一个有用的信息,变换着各种搜索词,打开无数浏览器标签页的日子,应该可以变得越来越少了。

人类只能串行工作,AI要发挥自己并行的优势。当AI有了一定的智慧,又愿意付出最大的力气,大力出奇迹就是必然了。

我们就拿这个问题测试一下:2024年《财富》中国科技50强企业中,哪些公司的总部在北京?这一问题中有时间、细分的对象、落地等多个关键词。

Kimi 探索版只花了几秒钟,先找到了 50 家企业的列表,然后搜了每家公司的总部,看了 756 个网页,找到了 9 家企业,然后再反思一把,把10个公司都找全了。

Kimi 正在重新定义「AI 搜索」

不得不说,这个事,很适合 AI 来干。

而且居然还能「反思」,开始主动思考自己的回答质量,来对问题进行自我修正和迭代。

在问另一个问题的时候,又遇到一次Kimi的反思,这回不是补充更完整,而是给出来更多维度的参考资料。问题是「如果所有钢琴都定期调律,估算一下北京需要多少名全职的钢琴调律师」。如下所示:

Kimi 正在重新定义「AI 搜索」

再看一个例子。查询 9 月上海迪士尼各个游乐项目在一天不同时段的平均排队时长,列成表格,再根据这个设计一条耗费排队时间最少的游玩路线。这一问题难在需要嵌套多个限制条件,Kimi 输出结果的过程如下所示:

Kimi 正在重新定义「AI 搜索」

可以看到,Kimi 可以主动搜索阅读 46 个网页,并将其分为了 9 月上海迪士尼游乐项目列表、各个游乐项目在一天不同时段的平均排队时长、设计耗费排队时间最少的游玩路线这几个关键问题,分别浏览对应网页,也可以看到后续仔细推演的过程。

相同的问题给到其他模型,得到下图的结果。其搜索过程链条短、推理过程简单,得出的搜索结果也相对单薄,没有办法直接拿到平均排队时长的具体数据,只给出了预估表。

Kimi 正在重新定义「AI 搜索」

看来AI拆解一个用户自然提问句子,分步骤来解决复杂问题的本事,正在变得更加可靠。

换个问题考验一下 Kimi:如果我今年春节后的首个交易日开盘时买了比亚迪股票,对比一下,同期在上海黄金交易所投资黄金,截至9月最后一个交易日结束,哪个方案的收益更高?列个表格。

这一问题涉及到具体的时间限制、两个主体的对比,放在日常生活中,也令人挠头,都是需要反复推理、准确计算。Kimi 给出的回答是:

Kimi 正在重新定义「AI 搜索」

如果是一个人面对这一问题,通常需要在头脑中拆分出比亚迪股票和上海黄金交易所黄金两个主体,然后经历多个搜索步骤,再拿出计算器计算。将这一问题完整抛给 Kimi ,它可以进行精密的思考、推理、计算,直接省掉了人力的多个步骤,极大提高了准确率和效率。

表现得还不错。据说Kimi内部评估的结果是,面对真实用户的长难问题,Kimi 探索版答题的正确率要高出其他国内外所有的主流 AI 产品至少 30%。

怪不得产品负责人会说,“如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地找到所需答案。”

Kimi 探索版:AI搜索有了新答案

大约一年前,月之暗面发布了支持输入 20 万汉字的智能助手产品 Kimi,当时创造了消费级 AI 产品所支持的上下文输入长度的新纪录。Kimi 多被用来处理长篇文献、报告和进行创作,好用的能力赢得了用户心智,Kimi 的用户量也一跃而上,成为几个创业公司里的头牌,给其他公司带来了不小的压力。

最近几个月,大家一直在等待 Kimi 的下一个动作会是什么?他们自己好像反而没那么着急。直到最近,国庆节刚过,就传来了Kimi内测「探索版」的消息。

今天,月之暗面正式发布了 Kimi 探索版,强调的是 AI的自主搜索能力。提前用完之后,我觉得AI搜索有了新答案,而且这个答案应该是来自大量真实用户的需求。

根据 Similarweb 数据,今年以来,在代表生产力的 PC 网页端,Kimi 的月访问量从 140 多万提高到 2500 多万,增长了 17 倍。目前 Kimi 的 PC 网页版,也是国内 Al 助手产品中唯一月访问量超过 2500 万的产品。

自去年 10 月推出后,Kimi 以长文本能力为核心,也打造了多语言翻译、多格式文件解读、AI 搜索、编程辅助、整理表格等多个能力,在生产力场景中较为实用。Kimi 能够快速阅读并深入理解大量信息,辅助进行内容输出,以此为基础形成了核心竞争力,并在用户心中锚定了「长文本」。

这种竞争力也给 Kimi 带来了诸多真实用户,无论是产品初期在小红书上的自然破圈,还是逐渐形成的「自来水」,都表明 Kimi 解决了部分用户的真实需求。这部分用户大多是学术科研人群、互联网从业者、程序员、自媒体与内容创作者、法律从业人员、教育工作者等知识工作者。

Kimi 探索版的市场可能会更大,因为它对使用者更加友好,复杂问题可以无脑抛给 Kimi 。Kimi 具备更高的易用性,随后使用人群数量、范围会进一步扩张。

Kimi 基本盘的能力可以满足原本已有用户,而 Kimi 探索版更强的搜索能力,则能够满足更日常的任务和问题,尤其是变量多、内容庞杂、限制条件多、主体复杂的调研分析类任务,解决这类任务则是知识工作者在日常知识积累、发现创造、探索世界的基础。

继续探索「月之暗面」

本次迭代的 Kimi 新版本取名为「探索版」,这也与公司名「月之暗面」遥相呼应,寓意着继续探索着月之暗面的神秘和未知,大胆追求技术上的突破创新,向那些雄心勃勃、具有革命性的计划继续进发。

Kimi创始人杨植麟曾表示:AGI 是新的登月计划,长文本是登月第一步。在迈出了探索版的新一步之后,陪他一起登月的用户可能会变得更多。

相关资讯

一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测

半年时间,月之暗面把 AI 模型支持的上下文长度提升了一个数量级,实现了 200 万字上下文的「无损压缩」。一个能读 200 万字的 AI 助手是什么概念?这意味着,它可以一口气读完整个《甄嬛传》剧本,然后和你讨论剧情。或者一口气读完一本厚厚的中医诊疗手册,给你提出诊疗建议。对于人类来说,成为某个领域的专家可能需要 10000 个小时的学习,但对于这个 AI 来说,只需要 10 分钟就够了。将甄嬛传全集几十万字的剧本传给 AI 助手,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。它能在不同时间段、各个场景的故事

AI在用| 又是一年毕业季,给你找了个论文搭子Kimi+

机器之能报道编辑:山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例。近日,月之暗面的 Kimi 迎来大更新,不仅 Logo 变得更卡通俏皮,还上线了「Kimi 」功能。所谓「Kimi 」,就是一个 AI 私人助理,有点类似于 OpenAI 的 GPTs,可以为用户提供更多个性化的 AI 服务,例

月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o1

基准测试显示,Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。